本帖最后由 Mu_shui_GS2020 于 2020-3-31 17:30 编辑

使用快捷采集采集豆瓣电影列表数据,刚开始没多久就因为抓取出错停止了,这个中断问题怎么解决啊?谢谢大家啦
抓取的网址是:https://movie.douban.com/tag/#/?sort=U&range=0,10&tags=%E7%94%B5%E5%BD%B1,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86,2010%E5%B9%B4%E4%BB%A3

4.png (63.19 KB, 下载次数: 597)

4.png

5.png (31.88 KB, 下载次数: 552)

5.png
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2020-4-1 11:23

沙发
Fuller 管理员 发表于 2020-3-31 21:15:13 | 只看该作者
看样子是遇到错误了,我估计是提示登录。要想抓取更多,要在集搜客浏览器中预先登录。

这个失败任务能导出多少数据?
举报 使用道具
板凳
Fuller 管理员 发表于 2020-3-31 21:29:23 | 只看该作者
我看了一下,你这个网页是选影视,而快捷采集那个网页是选电影。两个不同的版块,虽然看起来挺像的,还是有差别。明天我跟开发讨论一下,是否能兼容两个版块
举报 使用道具
地板
Mu_shui_GS2020 初级会员 发表于 2020-3-31 21:31:43 | 只看该作者
本帖最后由 Mu_shui_GS2020 于 2020-3-31 21:33 编辑
Fuller 发表于 2020-3-31 21:15
看样子是遇到错误了,我估计是提示登录。要想抓取更多,要在集搜客浏览器中预先登录。

这个失败任务能导出 ...

一个数据也导不出来,应该是需要登陆,之后我又一次对自己做的规则进行采集时他就进行到一半让我登陆账号
举报 使用道具
5#
Mu_shui_GS2020 初级会员 发表于 2020-3-31 21:36:12 | 只看该作者
Fuller 发表于 2020-3-31 21:29
我看了一下,你这个网页是选影视,而快捷采集那个网页是选电影。两个不同的版块,虽然看起来挺像的,还是有 ...

捂脸,这个我弄错了,笑哭,我还以为可以直接应用到分类这个界面。谢谢你。
举报 使用道具
6#
Fuller 管理员 发表于 2020-4-1 07:37:14 | 只看该作者
Mu_shui_GS2020 发表于 2020-3-31 21:36
捂脸,这个我弄错了,笑哭,我还以为可以直接应用到分类这个界面。谢谢你。
...

昨晚我同事说把规则调整了,因为我把你的问题向他反映了,应该把规则调整成通用的了,既可以采集影视也可以采集电影,你试试
举报 使用道具
7#
Mu_shui_GS2020 初级会员 发表于 2020-4-1 11:23:58 | 只看该作者
Fuller 发表于 2020-4-1 07:37
昨晚我同事说把规则调整了,因为我把你的问题向他反映了,应该把规则调整成通用的了,既可以采集影视也可 ...

好的,谢谢,我去试一下,感谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 21:37