进入这个网站:http://data.weibo.com/index
搜索一个词,能够看到指数图表,怎样抓取?
举报 使用道具
| 回复

共 2 个关于本帖的回复 最后回复于 2020-11-2 11:52

来自 3#
wangyong 版主 发表于 2020-11-2 11:52:55 | 只看该作者
使用集搜客的微博工具箱,选中要采集的板块,输入要采集的链接或者关键词就可以采集数据

数据示例

举报 使用道具
沙发
Fuller 管理员 发表于 2016-9-27 16:51:26 | 只看该作者
新浪微博的微指数抓取还是比较容易的,因为是标准的html5页面,只要在图表上做连续动作,鼠标从左到右移动,把悬浮显示的指数抓下来即可。


在MS谋数台上最规则的时候,要这样操作才能看到悬浮的内容
1)显示工作台(如果是GS爬虫浏览器,点击工具条上的“定义规则”按钮,如果是MS谋数台,运行的时候工作台就显示出来了)
2)在图表上把鼠标移动到某个位置,显示出来悬浮内容
3)鼠标不能动,点击 Alt键,看到菜单项变亮了,左右移动到“规则”菜单,点击向下箭头键,打开规则菜单,选择“冻结页面”,鼠标就可以移动了
4)选择菜单“规则”-》“刷新页面结构”,让DOM结构进行刷新
5)鼠标点击悬浮内容,就能定位到DOM节点了,接下来做数据映射规则即可

注意:DS大数据自动移动鼠标的连续动作功能不包含在开放的在线版中,需要者可联系我们。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 06:33