规则名是:去哪儿网_古北水镇


用图中1的text做了内容映射,2含class“mp-star-level”做了定位映射,在测试的时候依旧抓取到评论星级
或者只用2含class“mp-star-level”做定位映射,也抓取不到评论星级

p.s. 请问大众点评的评论加密你们在年前会安排解决吗



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2019-2-18 18:47

沙发
知识产权 高级会员 发表于 2019-1-16 11:21:53 | 只看该作者
span下的attribute下有一个title,可以采集里面的内容来做评论星级。
举报 使用道具
板凳
pipi1519 初级会员 发表于 2019-1-17 20:42:53 | 只看该作者
知识产权 发表于 2019-1-16 11:21
span下的attribute下有一个title,可以采集里面的内容来做评论星级。

请您再帮我看看,规则名:去哪儿网_古北水镇

(1)做了翻页区和翻页记号,在爬数据时仍然只能爬第1页,如下图1/2所示

(2)用span里的class做了内容映射,用上一层的div做了定位映射,但是测试结果“评论星级”一栏全是“mp-star-level”没有等级变化


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
wangyong 版主 发表于 2019-1-17 21:00:16 | 只看该作者

去哪网上没有专门大的字段来显示星级,是通过@style来控制的,width:100%是五星,80%就是四星

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
pipi1519 初级会员 发表于 2019-1-17 23:09:02 | 只看该作者
wangyong 发表于 2019-1-17 21:00
去哪网上没有专门大的字段来显示星级,是通过@style来控制的,width:100%是五星,80%就是四星
...

懂了谢谢,请问翻页的问题怎么解决
举报 使用道具
6#
pipi1519 初级会员 发表于 2019-1-18 10:18:20 | 只看该作者
等一个翻页的解决办法,谢谢大家了
举报 使用道具
7#
maomao 论坛元老 发表于 2019-1-18 11:56:37 | 只看该作者
你这个规则是用来抓评论的吧,评论应该要用模拟点击。https://www.gooseeker.com/doc/article-437-1.html
举报 使用道具
8#
pipi1519 初级会员 发表于 2019-1-19 10:38:21 | 只看该作者
maomao 发表于 2019-1-18 11:56
你这个规则是用来抓评论的吧,评论应该要用模拟点击。https://www.gooseeker.com/doc/article-437-1.html
...

我按照你说的重新做了一个规则:去哪儿网_古北水镇2,但是还是只能抓取到第一页,请问应该怎么解决

之前的规则名:去哪儿网_古北水镇 依然是能翻页到第二页,但是第二页的内容抓取不到,第3页就翻不过去了

求一个解决办法,谢谢~


举报 使用道具
9#
wangyong 版主 发表于 2019-1-19 16:33:47 | 只看该作者
记号线索的记号应该映射“下一页”,不是“评论”
举报 使用道具
10#
pipi1519 初级会员 发表于 2019-1-22 09:39:22 | 只看该作者
wangyong 发表于 2019-1-19 16:33
记号线索的记号应该映射“下一页”,不是“评论”

规则名:去哪儿网_古北水镇
翻页记号线索映射的是“下一页”,还是只能翻到第二页,但是第二页的内容爬取不到,也翻不到第三页,请问该怎么解决


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-23 21:01