Fuller 管理员 发表于 2023-4-9 17:26:23 | 显示全部楼层
hoopoe 发表于 2023-4-9 10:11
微博关键词搜索爬下的文本都是没有展开全文的,怎么能把完整的爬下来

把需要展开全文的网址导入到这个快捷采集工作中再采集一遍:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
hoopoe 新手上路 发表于 2023-4-9 22:26:11 | 显示全部楼层
Fuller 发表于 2023-4-9 17:26
把需要展开全文的网址导入到这个快捷采集工作中再采集一遍:https://www.gooseeker.com/res/rule_494.htm ...

需要展开的太多了,有几千个
举报 使用道具
Fuller 管理员 发表于 2023-4-10 08:57:42 | 显示全部楼层
hoopoe 发表于 2023-4-9 22:26
需要展开的太多了,有几千个

导出采集结果以后,在excel中搜索一下内容中含有展开全文字样,把这些行过滤出来,然后,把他们的网址一列拷贝出来,添加到采集展开全文的快捷采集工具中,一次批量添加网址就可以了。几千条一天应该能采集完
举报 使用道具
hoopoe 新手上路 发表于 2023-4-10 10:14:01 | 显示全部楼层
好的
举报 使用道具
先想想想想 新手上路 发表于 2023-5-16 20:50:59 | 显示全部楼层
b站怎么添加多个纬度
举报 使用道具
Fuller 管理员 发表于 2023-5-16 22:42:03 | 显示全部楼层
先想想想想 发表于 2023-5-16 20:50
b站怎么添加多个纬度

要增加什么,可以多个快捷工具复合使用,采集更多内容。
举报 使用道具
Fuller 管理员 发表于 2023-5-16 22:47:45 | 显示全部楼层
Fuller 发表于 2023-5-16 22:42
要增加什么,可以多个快捷工具复合使用,采集更多内容。

比如,B站视频采集_搜索列表B站视频采集_详情 复合使用,会批量采集到视频的详情。
具体操作方法,前一个快捷工具采集到视频的链接,然后把这些链接批量添加到第二个快捷工具。
举报 使用道具
WZY20031218 新手上路 发表于 2023-6-14 14:44:45 | 显示全部楼层
b站评论采集只能采集到其六条就没了
举报 使用道具
Fuller 管理员 发表于 2023-6-14 15:56:39 | 显示全部楼层
WZY20031218 发表于 2023-6-14 14:44
b站评论采集只能采集到其六条就没了

采集之前要在数据管家登录B站
举报 使用道具
laolao 新手上路 发表于 2023-6-19 10:46:50 | 显示全部楼层
有没有大神告诉一下,怎么采集阿里巴巴详情页图片,总是提示出错,数据什么也没有
|
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 01:16