Fuller 发表于 2019-5-14 22:21
你的规则本来都是正确的,但是,第二级你却做了一个翻页。这个就不对了,因为翻页是归第一级管的。第二级只 ...
fluffy 发表于 2019-5-15 18:12
我调试之后规则运行失败了,那第二级规则还要做标志映射吗?还是只要抓取评论的内容,评论的题目和标志映 ...
Fuller 发表于 2019-5-15 19:51
我测试了你的规则,运行的挺好的。你的窗口是不是特别小?DS打数机窗口尽量放大,在把底部的日志窗口收缩 ...
fluffy 发表于 2019-5-16 00:08
恩恩,放大了窗口确实可以了。但是为什么有的页数不是每个更多都点开了,比如这个图。还有是选择集搜还是 ...
Fuller 发表于 2019-5-16 07:44
假设网页上有10个“更多”,如果xpath写的合适,能够包含所有10个更多,那么就会自动点10次。我试过,点 ...
Fuller 发表于 2019-5-16 07:44
假设网页上有10个“更多”,如果xpath写的合适,能够包含所有10个更多,那么就会自动点10次。我试过,点 ...
fluffy 发表于 2019-5-16 18:11
我没太明白你的意思,什么叫最后一个结果文件是最全的啊?不过我搜索过,确实是包含了10个更多,但是不懂 ...
fluffy 发表于 2019-5-16 19:35
还有个问题,我发现我抓下来的评论会出现重复的现象,是因为我设置了标志映射的原因吗?
...
Fuller 发表于 2019-5-16 19:42
因为连续点击的时候会下载多个结果文件,首先文件与文件之间的重复是不可避免的。但是,同一个文件内部的 ...
Fuller 发表于 2019-5-16 19:42
因为连续点击的时候会下载多个结果文件,首先文件与文件之间的重复是不可避免的。但是,同一个文件内部的 ...
fluffy 发表于 2019-5-17 17:07
就是有文件和文件会重复,这个要自己手动删除吗。那xpath的定位有问题吗?就这种不能每个都点开的情况
...
fluffy 发表于 2019-5-17 17:21
有没有办法设置每一次翻页只点击一次更多,因为我发现就点一次这个页面上所有评论完整版就都会跳出来
...
Fuller 发表于 2019-5-17 17:26
xpath中增加一个条件 (你写的xpath)[1],这样就只定位到1个节点,你可以试试,把xpath写好以后,放在这 ...
欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) | Powered by Discuz! X3.2 |