|
嗯嗯,不好意思,我发现这个问题了,一直迭代前面的内容都是重复的,最新最大的那个才是比较完整的,只看生成的最后一个就可以了。
另外还有个想请教的问题就是,我用你们开发的微博采集工具采集评论,不能够采集所有的评论,比如微博下面“共XXX条回复”那种。
我也自己试着改xpath,改成//*[contains(text(),'共') and contains(text(),'条回复') ] ,但好像还是不行。
另外我也结合使用了连续动作,但我发现,他是先执行的翻页(就是每一页的那个"查看更多"),再回来执行那个连续动作,就是点击“共XXX条回复”,但最后爬取的内容还是没有下面的更多回复,我试了好久好多天,这么简单的问题也没能解决呢,所以想问问你们,这个到底要怎么弄比较好y吖,麻烦啦~
|
|
共 6 个关于本帖的回复 最后回复于 2018-12-25 08:52