规则介绍
采集京东商品下的评论信息,用于研究消费者的购买行为和研究如何优化产品。注意:这个规则不能单独使用,必须与“京东商品”规则一起使用,因为商品介绍页面会有大量商品广告图片,通过规则“京东商品”模拟点击“商品评论”自动切换到评论页面,然后使用本规则可避开广告,加快速度抓取评论信息,与“京东商品搜索列表”、“京东商品”规则组合使用,能对某分类下的所有商品进行全方位的追踪分析。 规则可以采集批量网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程http://www.gooseeker.com/doc/article-85-1.html (如果该规则与描述不符或无效,您可 申诉。)
信息字段 | 网页内容 |
---|---|
评论列表 | |
用户 | 用户名称 |
用户主页 | 用户主页网址 |
用户等级 | 用户等级 |
用户所在地 | 用户所在地 |
星级 | 星级打分 |
评论日期 | 评论日期 |
评论 | 评论 |
颜色 | 商品颜色 |
型号 | 商品型号 |
标签词 | 标签词 |
商品信息 | |
商品名称 | 商品名称 |
价格 | 价格 |
好评度 | 好评度 |
全部评价 | 全部评价 |
好评 | 好评 |
中评 | 中评 |
差评 | 差评 |
追评 | |
有图片的评价 | 有图片的评价 |
用户评论

-
Fuller 2018-09-01 16:06
如果有追评的评论是在评论列表里面的第一个,那就好做了,因为集搜客爬虫一第一个作为样例定义抓取内容的映射关系。然后选择第一个和第二个做样例复制映射,得到复制规律。如果不在第一个有追评,这个过程就变得比较复杂。 如果是在第一个,只需建立一个嵌套的整理箱,就是大箱子里面套着小箱子,小箱子用来存所有追评,嵌套整理箱这里有个说明:[url]https://www.gooseeker.com/doc/thread-10764-1-1.html[/url] 内层小箱子的抓取内容不要勾选“关键内容”,因为他们有时候没有 如果不是在第一个有追评,可在中间某个有追评的上面做内容映射,完成以后,以它做为第一个,下一个作为第二个做样例复制映射,存规则以后,要手工修改规则,把样例复制起点手工修改了,再“保存修改”
关于作者
作者其他资源更多 >
- 学校列表-findingschool网站
- findingschool网站的院校点评列表,教育行业信息,国外学校最新资讯,留学必备参考。可以与规则“学校详情-findingschool网站”一起使用,这样就可以把采到的网址生成第二级“学校详情-findingschool网站”的线索,用第二级规则就可以抓取到更多详细信息。
- 学校详情-findingschool网站
- findingschool网站的国外各大院校的详情信息,教育行业信息,国外学校最新资讯,留学参考必备,可以深入分析了解国外学校收费资讯、教育资质、硬件设施等
- 新浪微博_博主主页
- 本规则采集博主主页的博文信息,可以批量采集微博网址的数据,只需把同类网址导入到规则即可,具体使用方法请参考教程 http://www.gooseeker.com/doc/article-85-1.html 。
【注意:采集前要设置DS打数机的配置菜单->滚屏参数,滚屏次数为15或以上,滚屏速度为2,具体参数含义请看滚屏设置 http://www.gooseeker.com/doc/article-57-21.html 】。
【微博采集需要登录账号,且要定期(1或2天)更换微博账号,降低封锁风险】。
可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题等规则资源结合使用,能够实现更加全面深入的分析研究。
若你想免除做规则的时间,可使用微博博主主页采集工具直接获取数据。