规则介绍
百度新闻关键词搜索结果翻页采集,本规则也是自定义xpath的案例规则 (如果该规则与描述不符或无效,您可 申诉。)
采集内容
规则_1
|
信息字段 | 网页内容 |
---|---|
新闻搜索 | |
关键词 | |
结果 | |
列 | |
顺序id | |
标题 | |
摘要 | |
来源及时间 | |
相同新闻 | |
新闻链接 | |
相同新闻链接 |
数据截图

关于作者
作者其他资源更多 >
- 学校列表-findingschool网站
- findingschool网站的院校点评列表,教育行业信息,国外学校最新资讯,留学必备参考。可以与规则“学校详情-findingschool网站”一起使用,这样就可以把采到的网址生成第二级“学校详情-findingschool网站”的线索,用第二级规则就可以抓取到更多详细信息。
- 学校详情-findingschool网站
- findingschool网站的国外各大院校的详情信息,教育行业信息,国外学校最新资讯,留学参考必备,可以深入分析了解国外学校收费资讯、教育资质、硬件设施等
- 新浪微博_博主主页
- 本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。
【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。
【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。
可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。