目录
- 快捷采集
- 初级教程(新版)
- 初级教程(老版)
- 数据转Excel处理
- 爬虫规则管理
- 高级教程(新版)
- 高级教程(老版)
- 用爬虫群分布式高效采集
- 爬虫关键知识拓展
- 问题集锦
- 实战演练案例
- 爬虫安装说明
- 关于集搜客
集搜客交流群
2000人群:点击加入
瀑布流数据重复
你好,我在wish这个网站进行产品评论采集时,第一级网页是瀑布流的形式,每次滚屏采集到的XML文件内容前半部分产品链接都是重复的
瀑布流抓取中断
][/color] [color=rgb(51, 51, 51)][size=15px][b] 瀑布流抓取几百条数据就中断
瀑布流加载不出
采集一个瀑布流的网站,规则运行起来,但是网页下面的内容加载不出来采集不到怎么办?
瀑布流网页抓取问题
瀑布流网页抓取问题 任务名称 : hyperion目录 瀑布自动走可以,但不知道是否是正常走到底部了.
点击更多的瀑布流网页
采集一个瀑布流网页,网页最底下有个“加载更多”的按钮,点击一下才会加载更多内容,请问这种要怎么采集啊
瀑布流式网页抓取中断
用滚屏动作抓取瀑布流式网页时,滚屏次数设置的是0,滚屏速度设置的是1,并且在连续动作的设置中总共滚屏数设置的是-1,结束标志是重复内容
瀑布流网页无法自动滚屏
在抓取瀑布流网页时,参照了今日头条那个连续动作案例选择了滚屏的连续动作,但是在抓取过程中如果不动页面就只能抓10条数据重复抓三次
请教:瀑布流网页抓取失败
网页属于滚动鼠标,自动翻页加载的网页,到最后一页才会停止,学习瀑布流教程,设置规则总是失败,求大神指教!!!!
瀑布流网页清除老数据失败
使用滚屏连续动作爬取今日头条数据时,设置了清除老数据,但采集的时候还是有很多个excel表格,跟没设置清除老数据一样,这是咋回事啊?可以帮我看看吗? 规则名词:suibe_ydh_今日头条
瀑布流的怎么生成一个xml文件
爬取瀑布流的内容怎样可以只生成一个xml文件,不要一点一点叠加生成多个xml文件,还得自己手动删除
瀑布流滚屏中断是什么情况呢?
按照教程设定了连续动作,但抓取总是中断 规则名是“新制造网” 样例页是“http://www.xzhizao.com/search?q=%E8%9E%BA%E4%B8%9D&x=0&y=0&act=order”
瀑布流下的点击回退任务问题
并且想到了了另外个问题,该任务是瀑布流模式,如果是翻页下一页模式,那是不是会出现,上一页的点击回退还没完就翻到下一页了。
B站会员购评论瀑布流不能下拉
视频啥的评论都行,就这个不行。。。
怎样采集瀑布流网页的详情页面?
我要采集的页面是瀑布流 [url]https://m.baidu.com/s?%8B%23&topic_id=161459391213296918&sa=hts_kg_hot[/url] 瀑布流自动滚屏
求教复杂的瀑布流网页信息采集
这是打开网址后的初始页面 [attach]3297[/attach] 我希望采集列表的全部信息,可是电话信息被遮挡住了。这是点击后弹出来的网页。这个点击没有任何链接需要设置模拟动作 [attach]3300[/attach] 而且这个网址点击后网页结构发生变化了,可能里面嵌入了iframe 。 跪求大神请教这个网址怎么采集电话信息呢?谢谢了。 附上网址(各位点击下发货,然后手机收下验证码就可以了)。拜托!!!! http://m.ttyhuo.com/m/index.html