1 6704

评论爬取缺失

yangsiyu233 于 2020-3-31 10:19 发表 [复制链接]
如图爬取携程民宿评论,用第一个和第二个评论做映射,定位选择绝对定位,但测试结果显示第一页只爬取了第一条和最后一条评论,规则名称:民宿评论爬取1
未命名1585621110.png
举报 使用道具
| 回复

共 1 个关于本帖的回复 最后回复于 2020-3-31 10:53

lan_1985 金牌会员 发表于 2020-3-31 10:53:47 | 显示全部楼层
本帖最后由 lan_1985 于 2020-3-31 11:00 编辑

你抓取的是什么网址的评论,我这边测试,做样例复制(定位选‘绝对定位’或‘偏好id’),或第二种方法:因为每个样例节点的class值一样,直接对样例复制的容器节点,定位标志映射,都可以测试全部抓取。
我测试的网址是:https://inn.ctrip.com/onlineinn/newdetail/11671619?d1=2020-03-03&d2=2020-03-04&channelId=211&nav=yangzhou26&tdsourcetag=s_pctim_aiomsg

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 21:19