4 5077

推特数据采集

2574586329 于 2022-7-21 00:16 发表 [复制链接]
您好,我在使用“推特推文数据采集”时发现数据不全,请问是因为推特最近更新了网页结构代码导致的呢?
image.jpg image.png
应该有3k+,但是爬取完成经过去重发现只有800+

PS: 爬取的时候已经选择了爬取“全部”界面

亟需您的回复,祝您工作顺利!
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2023-2-9 16:48

Fuller 管理员 发表于 2022-7-21 09:13:03 | 显示全部楼层
这个网址是什么?我测试一下
举报 使用道具
2574586329 中级会员 发表于 2022-7-21 10:23:45 | 显示全部楼层
Fuller 发表于 2022-7-21 09:13
这个网址是什么?我测试一下

https://twitter.com/VisitSuzhou
辛苦了!谢谢
举报 使用道具
2574586329 中级会员 发表于 2022-7-21 11:27:02 | 显示全部楼层
Fuller 发表于 2022-7-21 09:13
这个网址是什么?我测试一下

您好,请问您这边测试结果是不是也有问题
举报 使用道具
ida1015 初级会员 发表于 2023-2-9 16:48:29 | 显示全部楼层
同问
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-27 14:10