41#
范祖云 初级会员 发表于 2022-4-18 10:09:46 | 只看该作者
Fuller 发表于 2022-4-18 09:19
网页上有的都能抓到,除了点赞以外,你还想抓取哪些内容。

快捷采集任务如果有翻页,肯定都能翻页。快捷 ...

好的!我有点悟了,还有一个小问题,我用快捷采集来抓抖音关键词的数据,好像只有目前显示出来的能抓到,它不能自动加载后面的是吗???
举报 使用道具
42#
Fuller 管理员 发表于 2022-4-18 10:41:41 | 只看该作者
范祖云 发表于 2022-4-18 10:09
好的!我有点悟了,还有一个小问题,我用快捷采集来抓抖音关键词的数据,好像只有目前显示出来的能抓到, ...

这是个瀑布流网页,往下滚动就会加载出来更多内容,网页就会越来越长。如果是自己定义规则,那么要使用连续动作的滚屏动作,每滚一次就抓取一次。因为网页长到一定程度就显示不下了,所以,能抓取到的是有限制的。
举报 使用道具
43#
范祖云 初级会员 发表于 2022-4-18 12:08:36 | 只看该作者
Fuller 发表于 2022-4-18 10:41
这是个瀑布流网页,往下滚动就会加载出来更多内容,网页就会越来越长。如果是自己定义规则,那么要使用连 ...

我发现抓取页数那里设置一下也可以抓到后面的了。我还想问一下,我想抓作者的一些个人数据比如粉丝数、获赞数这种,但是用那个快捷工具里面个人主页的那个,它还会把作品的数据也抓了,但我不需要那个,有没有可以设置的地方啊??
举报 使用道具
44#
Fuller 管理员 发表于 2022-4-18 15:15:49 | 只看该作者
范祖云 发表于 2022-4-18 12:08
我发现抓取页数那里设置一下也可以抓到后面的了。我还想问一下,我想抓作者的一些个人数据比如粉丝数、获 ...

规则做好了就没法通过设置过滤掉。要新做规则。这需要你用数据管家软件定义采集规则,只采集想要的信息
举报 使用道具
45#
范祖云 初级会员 发表于 2022-4-18 16:36:03 | 只看该作者
Fuller 发表于 2022-4-18 15:15
规则做好了就没法通过设置过滤掉。要新做规则。这需要你用数据管家软件定义采集规则,只采集想要的信息
...

好的,了解了,谢谢回复!非常感谢
举报 使用道具
46#
Jelenazhou_163 新手上路 发表于 2022-5-17 18:48:12 | 只看该作者
您好,“抖音视频关键词搜索采集”好像无法使用,示例页面也无法成功爬取。
举报 使用道具
47#
Fuller 管理员 发表于 2022-5-17 20:01:44 | 只看该作者
Jelenazhou_163 发表于 2022-5-17 18:48
您好,“抖音视频关键词搜索采集”好像无法使用,示例页面也无法成功爬取。 ...

我测试了,采集没有问题。采集之前要在爬虫浏览器中登录抖音,另外,采集的时候,爬虫浏览器的窗口要尽量放大。最后,要确保网络比较快,不要开360,否则会大大拖慢速度
举报 使用道具
48#
Season_66 新手上路 发表于 2022-10-21 00:05:13 | 只看该作者
请问为什么爬取下来的信息,作者那栏的内容和视频标题一样?
举报 使用道具
49#
Season_66 新手上路 发表于 2022-10-21 00:09:38 | 只看该作者
maomao 发表于 2021-12-7 18:10
这个问题已经修复了,你再试试

现在爬的数据又作者和视频标题一样了
举报 使用道具
50#
gz51837844 管理员 发表于 2022-10-21 09:37:30 | 只看该作者
Season_66 发表于 2022-10-21 00:09
现在爬的数据又作者和视频标题一样了

抖音关键词搜索采集我们刚才做了更新,你可以再试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-8 22:13