微博位置服务(签到采集-此地热议)无展开全文,导致部分位置信息爬取不到
举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2022-10-24 11:02

沙发
gz51837844 管理员 发表于 2022-10-11 09:43:19 | 只看该作者
你添加的任务网址是哪个, 发出来我们测试下
举报 使用道具
板凳
紫忆zi 初级会员 发表于 2022-10-11 11:21:19 | 只看该作者
gz51837844 发表于 2022-10-11 09:43
你添加的任务网址是哪个, 发出来我们测试下

链接是这个~https://weibo.com/p/1001018008643010000000000 谢谢啦例如这一条就没有展开全文



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
地板
gz51837844 管理员 发表于 2022-10-12 09:14:08 | 只看该作者
紫忆zi 发表于 2022-10-11 11:21
链接是这个~https://weibo.com/p/1001018008643010000000000 谢谢啦例如这一条就没有展开全文

针对这些少量需要展开全文才能采集到的,可以在excel中筛选出来博文网址后添加进另一个规则采集:
1. 在excel中筛选出博文内容包含“展开全文”的记录,把博文独立网址复制出来
2. 把博文网址添加进这个快捷采集:微博完整博文和地理信息,启动采集。这个快捷采集的结果里有博文详细信息,包括签到地点和签到地点链接



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
5#
紫忆zi 初级会员 发表于 2022-10-21 21:31:48 | 只看该作者
gz51837844 发表于 2022-10-12 09:14
针对这些少量需要展开全文才能采集到的,可以在excel中筛选出来博文网址后添加进另一个规则采集:
1. 在ex ...

好的 谢谢
但是这两天采集地理位置的时候每天只能采集到300多条,是怎么回事呢?之前有900多。是不是规则需要更新了?

举报 使用道具
6#
gz51837844 管理员 发表于 2022-10-24 10:15:06 | 只看该作者
紫忆zi 发表于 2022-10-21 21:31
好的 谢谢
但是这两天采集地理位置的时候每天只能采集到300多条,是怎么回事呢?之前有900多。是不是规则 ...

技术检查过,规则是匹配的,不用更新
举报 使用道具
7#
紫忆zi 初级会员 发表于 2022-10-24 11:02:38 | 只看该作者
gz51837844 发表于 2022-10-24 10:15
技术检查过,规则是匹配的,不用更新

好吧,谢谢

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • gooseeker分词工具的命名实体识别和词形还
  • 怎样设置LDA模型的超参数alpha(α)和beta(
  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的

热门用户

GMT+8, 2026-5-2 22:41