1021#
wangyong 版主 发表于 2020-2-17 14:44:09 | 只看该作者
Jane243 发表于 2020-2-17 14:06
比如下面这些。应该不是网址问题,因为无论我添加多少条网址机构文件夹下面都是空的,之前我也用过这个功 ...


我测试了十条你发的网址,是可以采到数据的,打包的条数可以添加的网址数能对应上吗?
举报 使用道具
1022#
Jane243 中级会员 发表于 2020-2-17 14:54:39 | 只看该作者
本帖最后由 Jane243 于 2020-2-17 14:55 编辑
wangyong 发表于 2020-2-17 14:44
我测试了十条你发的网址,是可以采到数据的,打包的条数可以添加的网址数能对应上吗?
...

打包的条数比添加的网址少,好像就是少机构的那几条。
我单独采集机构也可以成功,但是个人和机构混在一起之后,机构的文件夹下面就是空的。反复试过几次了,都是这样。
举报 使用道具
1023#
wangyong 版主 发表于 2020-2-17 15:10:32 | 只看该作者
Jane243 发表于 2020-2-17 14:54
打包的条数比添加的网址少,好像就是少机构的那几条。
我单独采集机构也可以成功,但是个人和机构混在一起 ...

我们再测试一下和个人一起采
举报 使用道具
1024#
wangyong 版主 发表于 2020-2-18 14:24:39 | 只看该作者
Jane243 发表于 2020-2-17 14:54
打包的条数比添加的网址少,好像就是少机构的那几条。
我单独采集机构也可以成功,但是个人和机构混在一起 ...


机构和个人混起来采也能成功采集到
举报 使用道具
1025#
wangyong 版主 发表于 2020-2-18 14:25:19 | 只看该作者
wangyong 发表于 2020-2-18 14:24
机构和个人混起来采也能成功采集到

采集的时候有登录微博吗?
举报 使用道具
1026#
ada1999 初级会员 发表于 2020-2-19 16:23:22 | 只看该作者
我想问两个问题:1.微博评论采集,采集窗口很早就显示匹配失败,但一直显示运行中怎么办?2、采集开始时,采集窗口评论加载不出来,也就是一开始就显示匹配失败怎么办?
举报 使用道具
1027#
Fuller 管理员 发表于 2020-2-19 17:17:30 | 只看该作者
ada1999 发表于 2020-2-19 16:23
我想问两个问题:1.微博评论采集,采集窗口很早就显示匹配失败,但一直显示运行中怎么办?2、采集开始时, ...

有没有换上最新的V9.0.5版本?这个版本能及时的修改微博评论采集中的状态显示
举报 使用道具
1028#
maomao 论坛元老 发表于 2020-2-19 17:19:06 | 只看该作者
ada1999 发表于 2020-2-19 16:23
我想问两个问题:1.微博评论采集,采集窗口很早就显示匹配失败,但一直显示运行中怎么办?2、采集开始时, ...

微博评论是瀑布流,不是翻页,很难说能采集多少。要想尽量采集的多,有以下建议:
1. 爬微博之前,一定要在集搜客浏览器登陆微博
2.网速要好,网速好,才能及时加载网页,把评论加载出来
3.计算机处理速度要快,这样才能及时把评论网页加载出来
4.采集量大了,要及时清缓存

举报 使用道具
1029#
351351 新手上路 发表于 2020-2-23 12:56:13 | 只看该作者
请问如何设置规则 比如时间限制(比如到哪一天就自动停止),
举报 使用道具
1030#
Fuller 管理员 发表于 2020-2-23 13:10:44 | 只看该作者
351351 发表于 2020-2-23 12:56
请问如何设置规则 比如时间限制(比如到哪一天就自动停止),

你在用哪个微博采集工具?关键词搜索吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-1 13:46