如题:主题1:生意参谋抓取数据、主题2:详细数据、规则3:产品信息数据
举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2017-4-28 16:45

沙发
wangyong 版主 发表于 2017-4-28 14:27:10 | 只看该作者
生意参谋需要账号密码才能打开网页,第二个主题名查不到

根据你说的为什么二级规则只抓一个页面的问题可能是,第一级规则里生成的线索下级主题名写错了
举报 使用道具
板凳
shengchengx 金牌会员 发表于 2017-4-28 14:30:31 | 只看该作者
本帖最后由 shengchengx 于 2017-4-28 14:37 编辑

检查一下线索定位映射是否做了。
在做完记号映射之后,要进行线索定位映射,就是选择包含记号标志的范围进行映射。
选择线索定位区块,线索定位的区块一般是包含"下一页"翻页标志的区块节点,也就是网页上的翻页区块(在网页结构窗口中点击包含 “下一页”翻页标志的区块节点,会在浏览器窗口中显示)。
进行线索定位映射,右击翻页区块节点,选择线索映射→定位→线索1 。完成后定位编号会显示翻页区块节点的定位编号。
具体教程可以查看《如何翻页抓取网页数据》
举报 使用道具
地板
sanlong 新手上路 发表于 2017-4-28 14:42:44 | 只看该作者
shengchengx 发表于 2017-4-28 14:30
检查一下线索定位映射是否做了。
在做完记号映射之后,要进行线索定位映射,就是选择包含记号标志的范围进 ...

亲 这个是不翻页的 只是复制一级规则复制样例给二级规则提供线索,二级样例抓取数据哦

举报 使用道具
5#
sanlong 新手上路 发表于 2017-4-28 14:43:15 | 只看该作者
wangyong 发表于 2017-4-28 14:27
生意参谋需要账号密码才能打开网页,第二个主题名查不到

根据你说的为什么二级规则只抓一个页面的问题可能 ...

我刚刚把二级主题重新修改了一下,还是不行,主题名没错
举报 使用道具
6#
sanlong 新手上路 发表于 2017-4-28 14:48:38 | 只看该作者
wangyong 发表于 2017-4-28 14:27
生意参谋需要账号密码才能打开网页,第二个主题名查不到

根据你说的为什么二级规则只抓一个页面的问题可能 ...

主题名都对的  第一个二级规则产品详情能够收到线索,第二个二级规则详细数据收不到线索

QQ图片20170428144746.png (45.91 KB, 下载次数: 683)

QQ图片20170428144746.png
举报 使用道具
7#
HJLing 版主 发表于 2017-4-28 14:49:33 | 只看该作者
sanlong 发表于 2017-4-28 14:48
主题名都对的  第一个二级规则产品详情能够收到线索,第二个二级规则详细数据收不到线索
...

你加载第一个规则
然后重新保存一遍试试

举报 使用道具
8#
sanlong 新手上路 发表于 2017-4-28 15:00:57 | 只看该作者
HJLing 发表于 2017-4-28 14:49
你加载第一个规则
然后重新保存一遍试试

还是不行啊 ,我试了几次


举报 使用道具
9#
HJLing 版主 发表于 2017-4-28 15:08:58 | 只看该作者
sanlong 发表于 2017-4-28 15:00
还是不行啊 ,我试了几次

你看一下本地结果文件
是不是两个采集网址的字段都采到网址了?

举报 使用道具
10#
Fuller 管理员 发表于 2017-4-28 15:21:32 | 只看该作者
sanlong 发表于 2017-4-28 15:00
还是不行啊 ,我试了几次

生意参谋需要登录才能帮你诊断规则。不过,我估计你的规则是正确的。如果你给第二级规则的第一个定义了一个线内线索,这个线索指向第二级的第二个规则,那么,不会为第二个规则生成线索,线内线索的意思就是运行了第一个规则,紧接着运行第二个规则,在同一个DS打数机窗口中把第二个规则线索消耗了,所以,你统计不到线索数量
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-5 20:21