9 7166

微博原文抓取

yinghui0121 于 2016-6-5 10:14 发表 [复制链接]
我新发布了一个采集规则:
微博原文抓取


详细信息:
在weibo.cn(微博手机网页端)微博搜索框键入检索词,在打数机中将返回页面地址设置为线索,可以抓取微博原文、评论、转发、点赞和发布时间等

希望大家喜欢!下载地址:
http://www.gooseeker.com/res/detail_125454.html
举报 使用道具
| 回复

共 9 个关于本帖的回复 最后回复于 2017-10-23 16:32

LemonDing 新手上路 发表于 2016-6-6 20:43:25 | 显示全部楼层
运行后在哪里查看结果?
举报 使用道具
Fuller 管理员 发表于 2016-6-6 21:03:52 | 显示全部楼层
LemonDing 发表于 2016-6-6 20:43
运行后在哪里查看结果?

请访问教程:http://www.gooseeker.com/tuto/tutorial.html
左边目录打开,初级教程第二步有关于采集结果存放位置的说明
举报 使用道具
LemonDing 新手上路 发表于 2016-6-6 21:31:25 | 显示全部楼层
非常感谢,不过我 点击后续分析提示错误“加载抓取规则遇到的错误:无法定位抓取内容 No.3”,这是什么原因您可以指教一下吗
举报 使用道具
Fuller 管理员 发表于 2016-6-6 22:23:08 | 显示全部楼层
LemonDing 发表于 2016-6-6 21:31
非常感谢,不过我 点击后续分析提示错误“加载抓取规则遇到的错误:无法定位抓取内容 No.3”,这是什么原因 ...

微博登录了吗?

使用菜单 “文件”-〉刷新网页结构 -〉分析页面 ,看看是否还有相同的错误。如果还有,那么就是这个规则的适应性不够,第3号抓取内容定位不到了。加载完成以后需要重新映射

举报 使用道具
小黄鸭 新手上路 发表于 2017-6-1 23:00:06 | 显示全部楼层
运行结果在哪里看啊
举报 使用道具
Fuller 管理员 发表于 2017-6-1 23:27:34 | 显示全部楼层
举报 使用道具
风之星 新手上路 发表于 2017-7-6 11:40:47 | 显示全部楼层
这个没办法自动翻页吗?
举报 使用道具
小黄鸭 新手上路 发表于 2017-10-23 16:26:50 | 显示全部楼层
这个规则怎么运行?
举报 使用道具
umsung 高级会员 发表于 2017-10-23 16:32:18 | 显示全部楼层
小黄鸭 发表于 2017-10-23 16:26
这个规则怎么运行?

需要先下载,下载之后这个规则就你在账号里面的
1,可以通过DS打数机,找到这个规则点击单搜来运行。
2,也可以进入会员中心,在会员中心-规则管理中找到这个规则,启动爬虫群运行。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-18 19:40