如图,该怎么抓,看了教程之后抓取的还是不完整的

TTQE4]P76ZBXEBP(ZF%XK`4.png (204.36 KB, 下载次数: 1067)

如上图,每条评论都有更多,才能显示完全,这种情况怎么抓取完整的评论

如上图,每条评论都有更多,才能显示完全,这种情况怎么抓取完整的评论
举报 使用道具
| 回复

共 7 个关于本帖的回复 最后回复于 2019-4-3 07:26

沙发
Fuller 管理员 发表于 2018-5-18 09:00:28 | 只看该作者
这个需要做连续动作,逐个点击“更多”。连续动作每做一轮,就会产生一个抓取结果,这样会有大量的重复内容产生,所以,在导出了抓取结果以后,需要做一个过滤操作。另外,还有做一个替换操作。因为每条内容会抓到点击“更多”前的内容和点击后的内容,要用点击后的内容覆盖点击前的内容
举报 使用道具
板凳
1278467024 初级会员 发表于 2018-5-18 14:08:39 | 只看该作者
Fuller 发表于 2018-5-18 09:00
这个需要做连续动作,逐个点击“更多”。连续动作每做一轮,就会产生一个抓取结果,这样会有大量的重复内容 ...

就是在一个主题下进行连续动作和数据采集、翻页三个功能吗?
举报 使用道具
地板
wangyong 版主 发表于 2018-5-18 14:51:30 | 只看该作者
是的,不过猫途鹰评论这里只需要点一次“更多”后,其他评论就相当于都点了的效果了
举报 使用道具
5#
1278467024 初级会员 发表于 2018-5-18 15:02:09 | 只看该作者
wangyong 发表于 2018-5-18 14:51
是的,不过猫途鹰评论这里只需要点一次“更多”后,其他评论就相当于都点了的效果了 ...

只需要一个点击的连续动作吗
举报 使用道具
6#
bowieD 金牌会员 发表于 2018-5-18 15:31:06 | 只看该作者
1278467024 发表于 2018-5-18 15:02
只需要一个点击的连续动作吗

只需要一个点击动作,点击动作的xpath要能定位到所有的“更多”,这样爬虫就会逐个去点击每个“更多”。
举报 使用道具
7#
yizhiyu1996 新手上路 发表于 2019-4-2 23:57:23 | 只看该作者
请问楼主顺利解决了吗 我现在也卡在这个问题上
举报 使用道具
8#
Fuller 管理员 发表于 2019-4-3 07:26:04 | 只看该作者
yizhiyu1996 发表于 2019-4-2 23:57
请问楼主顺利解决了吗 我现在也卡在这个问题上

你的规则存了以后,把主题名发出来,管理员会帮你诊断问题出在哪里。这个帖子都是泛泛讨论,可能解决不了具体问题,要对着实际问题进行解决
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-20 10:02