881#
Fuller 管理员 发表于 2019-6-3 08:44:28 | 只看该作者
zhengxj 发表于 2019-6-2 23:56
请问能采集到博主的性别和所在地等基本信息吗

在博主详细资料那里,如果博主公开了这些信息才能采集到
举报 使用道具
882#
xuanzi123456 新手上路 发表于 2019-6-13 22:30:48 | 只看该作者
可以获得评论带有的emoji吗
举报 使用道具
883#
Fuller 管理员 发表于 2019-6-13 23:37:41 | 只看该作者
xuanzi123456 发表于 2019-6-13 22:30
可以获得评论带有的emoji吗

现有的采集规则没有采集,但是可以自己定义规则,只要采集评论的时候设置成采集网页片段,那么表情图是一种特别的图,是img标签,会采集下来
举报 使用道具
884#
guochuntao 新手上路 发表于 2019-6-16 10:24:12 | 只看该作者
微博主页采集,点击开始采集后,需要输入的账号密码是什么

举报 使用道具
885#
fridtest123 新手上路 发表于 2019-6-16 11:07:27 | 只看该作者
guochuntao 发表于 2019-6-16 10:24
微博主页采集,点击开始采集后,需要输入的账号密码是什么

是微博网站要求登陆?输入一个微博账号和密码就可以了。
举报 使用道具
886#
Fuller 管理员 发表于 2019-6-16 11:17:46 | 只看该作者
guochuntao 发表于 2019-6-16 10:24
微博主页采集,点击开始采集后,需要输入的账号密码是什么

要区分两种账号和密码
1,微博网站的:在启动爬虫群的时候,会提示要不要登录微博账号和密码,如果要去登录,会显示一个微博的网页,在那里用微博账号和密码登录
2,集搜客爬虫客户端的:如果在启动爬虫群的时候提示,应该是没有配置好爬虫客户端,那就要输入集搜客账号和密码。这个登录窗口不是一个网页,而是这样的:

举报 使用道具
887#
13999226453 新手上路 发表于 2019-6-16 17:34:13 | 只看该作者
您好,数据下载不出来是怎么回事呀?
举报 使用道具
888#
Fuller 管理员 发表于 2019-6-16 18:16:28 | 只看该作者
13999226453 发表于 2019-6-16 17:34
您好,数据下载不出来是怎么回事呀?

数据能打包吗?把计算机的360管家之类的软件关掉。
举报 使用道具
889#
felixgt_86 新手上路 发表于 2019-6-18 23:49:36 | 只看该作者
你好 请问一下采集微博主页数据为什么只能采集一页就停止了?
举报 使用道具
890#
Fuller 管理员 发表于 2019-6-19 08:30:31 | 只看该作者
felixgt_86 发表于 2019-6-18 23:49
你好 请问一下采集微博主页数据为什么只能采集一页就停止了?

添加任务的时候,需要选择采集所有页还是只采集首页。你是不是没有选择对?

另外,采集微博之前,要在集搜客浏览器登录微博
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-30 03:53