Fuller 管理员 发表于 2023-10-12 15:57:30 | 显示全部楼层
kosmos 发表于 2023-10-12 15:11
请问爬取的字段只有截图上面这些吗

哪个微博采集工具?随着网站改版,可以采集到的内容会有些调整,最好先试采一下看看
举报 使用道具
cingo311 新手上路 发表于 2023-10-15 15:10:40 | 显示全部楼层
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之后的该怎么办呢?
举报 使用道具
Fuller 管理员 发表于 2023-10-15 16:56:20 | 显示全部楼层
cingo311 发表于 2023-10-15 15:10
请问采集某账号某一时间段的含有某关键词的微博时,超140字长微博的话只能采集到“展开全文”这四个字,之 ...

把需要采集全文的网址整理出来,导入到这个快捷采集工具中:https://www.gooseeker.com/res/rule_494.html
举报 使用道具
fishhaichun 金牌会员 发表于 2023-10-18 21:24:36 | 显示全部楼层
Fuller 发表于 2023-9-26 12:09
增加了一个快捷采集工具,可以采集到含有被转发博文的微博搜索结果:https://www.gooseeker.com/res/rule ...

能否提个改善意见。关键词搜索的收集工具能否把转发部分的微博收集也添加回去。虽然非常给力开发了新的采集工具,但是这个采集工具的分小时的网址没办法自动生成,大量采集的时候实在是很麻烦。

关键词搜索工具不能收集转发部分的微博倒也罢了,查看收集的结果发现,微博博主的部分,显示的是被转发的ID和名字,但是微博内容缺失转发人的评论,这样其实微博博主跟微博内容是不对应的。这样张冠李戴,费好多时间收集的数据就都没办法用了。
或者把新的采集工具的自动生成收集网址解决一下,那样也就跟以前的收集方式没有分别了。
非常感谢!
举报 使用道具
fishhaichun 金牌会员 发表于 2023-10-24 11:46:52 | 显示全部楼层
请问生成的收集网址有什么办法能批量导出吗
举报 使用道具
Fuller 管理员 发表于 2023-10-24 15:50:00 | 显示全部楼层
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

生成网址的功能还在开发中,还没有开发完
举报 使用道具
Fuller 管理员 发表于 2023-10-24 18:21:46 | 显示全部楼层
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

今天已经开发完了,正在测试,明天上午就能上线生成网址功能
举报 使用道具
Fuller 管理员 发表于 2023-10-25 09:46:49 | 显示全部楼层
fishhaichun 发表于 2023-10-24 11:46
请问生成的收集网址有什么办法能批量导出吗

生成网址的功能已经上线了
第一步:在微博关键词搜索采集工具界面上点击“细分条件”按钮,设置细分条件,点击“预览生成的网址”

第二步:需用手工选择,只需点击“复制”按钮,就可把内容复制到剪贴板。转到快捷采集页面,用ctrl+V按钮可以粘贴上,也可以粘贴到记事本等编辑器上

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
fishhaichun 金牌会员 发表于 2023-10-25 23:29:37 | 显示全部楼层
Fuller 发表于 2023-10-24 18:21
今天已经开发完了,正在测试,明天上午就能上线生成网址功能

你们的技术支持太给力了。谢谢
举报 使用道具
kento_羊林 新手上路 发表于 2023-10-26 22:44:40 | 显示全部楼层
很好用,谢谢!
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 怎样让GooSeeker分词工具使用宋体画词云图
  • 使用BERTopic时遇到的c-TF-IDF是什么?
  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?

热门用户

GMT+8, 2026-5-13 05:38