https://weibo.com/1392859820/ObcWevYNO#repost
怎样做任务呢
用class定位总是采集不全,请问是怎么回事,怎么处理谢谢


举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 昨天 12:38

沙发
kodiaxu 高级会员 发表于 2024-4-24 17:46:48 | 只看该作者
任务名称:微博转发博主网页2
举报 使用道具
板凳
wangyong 版主 发表于 2024-4-25 17:17:21 | 只看该作者
微博转发和微博评论网页界面显示的和HTML的顺序不同,要用网页结构中的第一个转发结构和第二个转发结构做样例复制映射,样例复制参考教程:https://www.gooseeker.com/doc/article-520-1.html
举报 使用道具
地板
kodiaxu 高级会员 发表于 昨天 11:39 | 只看该作者
最后采集出来的数据不全,大概只能采集一半左右,请问怎么解决
举报 使用道具
5#
Fuller 管理员 发表于 昨天 12:38 | 只看该作者
kodiaxu 发表于 2024-5-5 11:39
最后采集出来的数据不全,大概只能采集一半左右,请问怎么解决

转发和评论是很难采集全的,因为微博网站有时候会突然显示不出来新内容,如果自己家里的网络速度也不高,就特别容易出现加载不出来新内容的情况。如果网络速度很好,我曾经采集到5000条转发或者评论。更多时候会采集到少一些。电脑上千万不能运行360等这些安全卫士,他们会大大拖慢网速。

可以多采集几遍,选用采集到最多的那次的结果
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-6 02:24