规则名是:去哪儿网_古北水镇


用图中1的text做了内容映射,2含class“mp-star-level”做了定位映射,在测试的时候依旧抓取到评论星级
或者只用2含class“mp-star-level”做定位映射,也抓取不到评论星级

p.s. 请问大众点评的评论加密你们在年前会安排解决吗



举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2019-2-18 18:47

沙发
知识产权 高级会员 发表于 2019-1-16 11:21:53 | 只看该作者
span下的attribute下有一个title,可以采集里面的内容来做评论星级。
举报 使用道具
板凳
pipi1519 初级会员 发表于 2019-1-17 20:42:53 | 只看该作者
知识产权 发表于 2019-1-16 11:21
span下的attribute下有一个title,可以采集里面的内容来做评论星级。

请您再帮我看看,规则名:去哪儿网_古北水镇

(1)做了翻页区和翻页记号,在爬数据时仍然只能爬第1页,如下图1/2所示

(2)用span里的class做了内容映射,用上一层的div做了定位映射,但是测试结果“评论星级”一栏全是“mp-star-level”没有等级变化


举报 使用道具
地板
wangyong 版主 发表于 2019-1-17 21:00:16 | 只看该作者

去哪网上没有专门大的字段来显示星级,是通过@style来控制的,width:100%是五星,80%就是四星
举报 使用道具
5#
pipi1519 初级会员 发表于 2019-1-17 23:09:02 | 只看该作者
wangyong 发表于 2019-1-17 21:00
去哪网上没有专门大的字段来显示星级,是通过@style来控制的,width:100%是五星,80%就是四星
...

懂了谢谢,请问翻页的问题怎么解决
举报 使用道具
6#
pipi1519 初级会员 发表于 2019-1-18 10:18:20 | 只看该作者
等一个翻页的解决办法,谢谢大家了
举报 使用道具
7#
maomao 论坛元老 发表于 2019-1-18 11:56:37 | 只看该作者
你这个规则是用来抓评论的吧,评论应该要用模拟点击。https://www.gooseeker.com/doc/article-437-1.html
举报 使用道具
8#
pipi1519 初级会员 发表于 2019-1-19 10:38:21 | 只看该作者
maomao 发表于 2019-1-18 11:56
你这个规则是用来抓评论的吧,评论应该要用模拟点击。https://www.gooseeker.com/doc/article-437-1.html
...

我按照你说的重新做了一个规则:去哪儿网_古北水镇2,但是还是只能抓取到第一页,请问应该怎么解决

之前的规则名:去哪儿网_古北水镇 依然是能翻页到第二页,但是第二页的内容抓取不到,第3页就翻不过去了

求一个解决办法,谢谢~


举报 使用道具
9#
wangyong 版主 发表于 2019-1-19 16:33:47 | 只看该作者
记号线索的记号应该映射“下一页”,不是“评论”
举报 使用道具
10#
pipi1519 初级会员 发表于 2019-1-22 09:39:22 | 只看该作者
wangyong 发表于 2019-1-19 16:33
记号线索的记号应该映射“下一页”,不是“评论”

规则名:去哪儿网_古北水镇
翻页记号线索映射的是“下一页”,还是只能翻到第二页,但是第二页的内容爬取不到,也翻不到第三页,请问该怎么解决


举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 22:01