快捷导航
80 82963

新浪微博_博主主页

ym 于 2015-8-13 15:22 发表 [复制链接]
用户ym新发布了一个采集规则:
新浪微博_博主主页
详细信息:
采集热门博文的评论信息,用于分析微博效果、舆论走向、用户心理行为、舆情分析等,通过定时采集可实现持续监控的效果;微博采集需要登录账号,且要定期(1/2天)更换微博账号,降低封锁风险。      可与新浪微博_博主详细信息、新浪微博_搜索列表、新浪微博_评论、新浪微博_话题结合使用,能够实现更加全面深入的分析研究。

希望大家喜欢!下载地址: http://www.gooseeker.com/res/detail_89119.html
举报 使用道具
| 回复

共 80 个关于本帖的回复 最后回复于 2018-12-23 10:53

yxhk 新手上路 发表于 2015-9-24 13:44:46 | 显示全部楼层
为什么直接加载的时候会出错呢~~第8~16个属性都没法定位。。。
举报 使用道具
gooseeker_info 金牌会员 发表于 2015-9-24 14:26:38 | 显示全部楼层
yxhk 发表于 2015-9-24 13:44
为什么直接加载的时候会出错呢~~第8~16个属性都没法定位。。。

首先,要在登录了微博以后再加载

其次,对于博主首页或者搜索列表,因为新微博不断出现,可能会出现不含有某些抓取内容的规则,在这种情况下,抓取规则不影响使用
举报 使用道具
yxhk 新手上路 发表于 2015-9-24 14:48:26 | 显示全部楼层
gooseeker_info 发表于 2015-9-24 14:26
首先,要在登录了微博以后再加载

其次,对于博主首页或者搜索列表,因为新微博不断出现,可能会出现不含 ...

首先我是在登录了微博以后进行的规则加载,其次,这个规则在DS中是可以抓取样本页面的相应信息的,但是在MS中加载就出错。。。。输出信息提示无法抓取定位内容8-16,所以测试也没法测试,我就没法用这个规则抓取新页面的相应信息
举报 使用道具
gooseeker_info 金牌会员 发表于 2015-9-24 14:57:08 | 显示全部楼层
yxhk 发表于 2015-9-24 14:48
首先我是在登录了微博以后进行的规则加载,其次,这个规则在DS中是可以抓取样本页面的相应信息的,但是在 ...

找一个新的样本页面,第一条微博里面含有转发的那种。某个博主的主页微博消息会不断增加新的,会影响加载,为了稳定地能加载分析,可以用自己的微博,第一条消息可以是一条含有的成份最全的,等MS谋数台把规则加载上以后,把样本页面替换上,用菜单项 分析页面,就会替换上新的样本页面
举报 使用道具
yxhk 新手上路 发表于 2015-9-24 15:06:34 | 显示全部楼层
这个道理我懂,我都懂。。。。我都要哭了,醉不行。。。不是这有问题就是那有问题。。。。我换了我自己的微博,结果又出问题了。又无法定位0-3.。但是我看上头也有定位信息啊,不知道怎么回事,
举报 使用道具
shenzhenwan6 中级会员 发表于 2015-9-29 23:30:42 | 显示全部楼层
你可以在DS里直接添加线索后执行采集
举报 使用道具
wxboom 新手上路 发表于 2015-10-8 10:00:18 | 显示全部楼层
什么情况还不知道
举报 使用道具
Fuller 管理员 发表于 2015-10-8 10:47:01 | 显示全部楼层
wxboom 发表于 2015-10-8 10:00
什么情况还不知道

遇到了什么情况?
举报 使用道具
1942634130 新手上路 发表于 2015-11-15 09:25:19 | 显示全部楼层
有些东西根本 怕不出来
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-19 17:00