主题  晋江2         晋江3

不知道为什么点击了  主题:晋江2的线索到不了  主题 :晋江3  ,而是出现掠飞,帮我分析一下


举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-2-2 22:49

沙发
scraper 论坛元老 发表于 2017-2-2 12:58:27 | 只看该作者
晋江2 里的点击连续动作,目标主题名是晋江3, 应该勾选上"飞掠模式”
举报 使用道具
板凳
scraper 论坛元老 发表于 2017-2-2 13:00:35 | 只看该作者
运行抓取没有问题, 但是你在晋江2定义连续动作的表达式, 只是定位到第一个“查看楼盘”,所以只能抓第一条
如果要抓全, 应该改成能定位到所有“查看楼盘”的表达式
举报 使用道具
地板
zhuohui1987 金牌会员 发表于 2017-2-2 18:32:45 | 只看该作者
scraper 发表于 2017-2-2 13:00
运行抓取没有问题, 但是你在晋江2定义连续动作的表达式, 只是定位到第一个“查看楼盘”,所以只能抓第一 ...

定位到所有“查看楼盘”的表达式要怎么写
举报 使用道具
5#
scraper 论坛元老 发表于 2017-2-2 18:45:29 | 只看该作者
试试用 //*[@class='textDiv']/a
举报 使用道具
6#
zhuohui1987 金牌会员 发表于 2017-2-2 21:49:10 | 只看该作者
scraper 发表于 2017-2-2 12:58
晋江2 里的点击连续动作,目标主题名是晋江3, 应该勾选上"飞掠模式”

晋江3  获取不到,我已经加了掠飞了
举报 使用道具
7#
scraper 论坛元老 发表于 2017-2-2 22:49:01 | 只看该作者
获取不到应该和飞掠无关
我看你的规则, 每个抓取字段都勾选了“关键内容",这样只要一个字段获取不到, 晋江2的抓取就失败了,还没到执行第3级的飞掠。
你可以只留下一个字段勾选”关键内容“,其它的去掉
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-4 04:53