微博位置服务(签到采集-此地热议)无展开全文,导致部分位置信息爬取不到
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2022-10-24 11:02

沙发
gz51837844 管理员 发表于 2022-10-11 09:43:19 | 只看该作者
你添加的任务网址是哪个, 发出来我们测试下
举报 使用道具
板凳
紫忆zi 初级会员 发表于 2022-10-11 11:21:19 | 只看该作者
gz51837844 发表于 2022-10-11 09:43
你添加的任务网址是哪个, 发出来我们测试下

链接是这个~https://weibo.com/p/1001018008643010000000000 谢谢啦例如这一条就没有展开全文



image.png (2.09 KB, 下载次数: 533)

image.png
举报 使用道具
地板
gz51837844 管理员 发表于 2022-10-12 09:14:08 | 只看该作者
紫忆zi 发表于 2022-10-11 11:21
链接是这个~https://weibo.com/p/1001018008643010000000000 谢谢啦例如这一条就没有展开全文

针对这些少量需要展开全文才能采集到的,可以在excel中筛选出来博文网址后添加进另一个规则采集:
1. 在excel中筛选出博文内容包含“展开全文”的记录,把博文独立网址复制出来
2. 把博文网址添加进这个快捷采集:微博完整博文和地理信息,启动采集。这个快捷采集的结果里有博文详细信息,包括签到地点和签到地点链接



举报 使用道具
5#
紫忆zi 初级会员 发表于 2022-10-21 21:31:48 | 只看该作者
gz51837844 发表于 2022-10-12 09:14
针对这些少量需要展开全文才能采集到的,可以在excel中筛选出来博文网址后添加进另一个规则采集:
1. 在ex ...

好的 谢谢
但是这两天采集地理位置的时候每天只能采集到300多条,是怎么回事呢?之前有900多。是不是规则需要更新了?

举报 使用道具
6#
gz51837844 管理员 发表于 2022-10-24 10:15:06 | 只看该作者
紫忆zi 发表于 2022-10-21 21:31
好的 谢谢
但是这两天采集地理位置的时候每天只能采集到300多条,是怎么回事呢?之前有900多。是不是规则 ...

技术检查过,规则是匹配的,不用更新
举报 使用道具
7#
紫忆zi 初级会员 发表于 2022-10-24 11:02:38 | 只看该作者
gz51837844 发表于 2022-10-24 10:15
技术检查过,规则是匹配的,不用更新

好吧,谢谢

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 19:35