新浪微博_话题

633 51 35 所需积分:2000 更新时间:2015-08-13 14:15 类别: 社交网络

规则介绍

本规则可以采集批量网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html 。 采集微博热门话题下的微博讨论信息,可用于分析话题的传播效果、舆论走向、用户心理行为、讨论热点等;微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。 可与新浪微博_博主主页、新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论等规则资源结合使用,能够实现更加全面深入的分析研究。
       若你想免除做规则的时间,可使用微博话题采集工具直接获取数据。

注:请先登录所抓取的网站,再运行该规则。 (如果该规则与描述不符或无效,您可 申诉。)

采集内容

信息字段 网页内容
微博话题
话题
导语
阅读数
讨论数
粉丝数
样例
博主
博主id
博主主页
博主头像
博文
博文独立网址
发布时间
发布终端
转发数
评论数
点赞数
转发_博主
转发_博主id
转发_博主主页
转发_博文
转发_发布时间
转发_发布终端
转发_转发数
转发_评论数
转发_点赞数

数据截图

用户评论

  1. sosoends 2015-10-07 13:55

    这个能用吗

  2. gooseeker_info 2015-10-07 14:54

    能用,下载了不能用可以申诉

  3. yw0411 2016-01-05 09:53

    我想问一些具体的信息:对于任何话题都可以采集是吗?采集到的热门话题的评论数可以达到千级吗?这需要一天24小时都开着电脑吗?估计几天的时间可以采集到3000条左右的评论?

  4. ym 2016-01-05 10:07

    这个规则采集的是讨论某话题的微博,例如这种类型的网页[url]http://weibo.com/p/100808652f58276ac222928f0879922c5372bd?k=P7%E8%93%9D%E5%AE%9D%E7%9F%B3%E5%85%B8%E8%97%8F%E7%89%88&from=501&_from_=huati_topic&sudaref=www.gooseeker.com[/url] 如果话题下的讨论数已经不再增加,那么采集一遍就可以了,爬虫会一页页地采集直到最后一页为止,但微博有个反爬机制,大约翻页30多页,就会失败,如果超过这个页数的话,可以构造每一页的网址再去采集。想要持续跟踪采集的话,就要隔一段时间重新采集一遍,这个就得由自己手工执行了

  5. Fuller 2016-01-05 12:12

    爬虫可以很快速地运行,但是新浪微博会防爬。要分布到多台计算机上运行,比如,联络自己的同学或者朋友。

关于作者

作者其他资源更多 >

学校列表-findingschool网站
findingschool网站的院校点评列表,教育行业信息,国外学校最新资讯,留学必备参考。可以与规则“学校详情-findingschool网站”一起使用,这样就可以把采到的网址生成第二级“学校详情-findingschool网站”的线索,用第二级规则就可以抓取到更多详细信息。
学校详情-findingschool网站
findingschool网站的国外各大院校的详情信息,教育行业信息,国外学校最新资讯,留学参考必备,可以深入分析了解国外学校收费资讯、教育资质、硬件设施等
新浪微博_博主主页
本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。 【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。 【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。 可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
       若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。

V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据信息技术有限公司
粤ICP备08108565号-1 粤公网安备44030502004363号