最后登录 1970-1-1
最后登录 2025-5-2
Fuller 发表于 2016-5-8 12:02 要建立多层嵌套整理箱:http://www.gooseeker.com/doc/article-151-1.html 难点在于选择一个合适的样例, ...
LQX930107 发表于 2016-5-8 20:56 如果样例不符合您说的要求,做出来的规则就难以适用于多个网页?咱们的爬虫就实现不了大量网页的抓取了是 ...
Fuller 发表于 2016-5-8 22:50 比如微博,假设抓取实时消息流,不断有人发新的消息,好容易找到一个含有转发的微博位于消息流的第一个位 ...
bennana 发表于 2016-12-25 16:14 像微博改版后这种共n条评论,需要点开后才能显示出来所有回复的网页,该如何抓取数据? ...
Fuller 发表于 2016-12-25 20:32 可以做连续动作,逐个点开
bennana 发表于 2017-1-2 21:01 多谢!按照高级教程淘宝和京东的做法尝试了一下,还是点不开,只能抓取显示出来的前两条。Xpath(//*[@cl ...
Fuller 发表于 2017-1-3 09:06 你做的规则的主题名是什么?我可以从后台帮你看看问题在哪
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-5-3 20:43
共 16 个关于本帖的回复 最后回复于 2017-1-12 17:19