已经做好的正常的两个规则,请问怎么利用DS打数机调出来继续抓取啊。主题名:天天有货货源1  和  天天有货货源12   
我激活了天天有货货源1规则的所有线索,然后点击集搜/单搜  只抓一会就提示:没有定义下级规则了,。如图所示。请问怎么回事。之前定义的Crontab自动激活抓取就正常的。
举报 使用道具
| 回复

共 16 个关于本帖的回复 最后回复于 2016-12-27 09:24

沙发
quyixuan 金牌会员 发表于 2016-12-26 14:19:05 | 只看该作者

看了一下你的规则,主题名天天有货货源12的连续动作这里的目标主题名没有定义

举报 使用道具
板凳
Givent 中级会员 发表于 2016-12-26 15:54:48 | 只看该作者
quyixuan 发表于 2016-12-26 14:19
看了一下你的规则,主题名天天有货货源12的连续动作这里的目标主题名没有定义

...


这是当时那个技术人员告诉我的,做一个虚构的主题名,完成回退功能。
举报 使用道具
地板
Fuller 管理员 发表于 2016-12-26 16:42:25 | 只看该作者
Givent 发表于 2016-12-26 15:54
这是当时那个技术人员告诉我的,做一个虚构的主题名,完成回退功能。
...

这是个小技巧,可以这样用。你的规则我测试了,运行也正常,出现那个提示不用管,只要能回退回来,能进行下一轮点击,就达到目的了。

另外,你没有必要使用这个小技巧。天天有货货源12 的连续动作工作台上填写的目标主题名是 天天有货货源1 就能达到目的,就是主题之间形成了一个循环。
举报 使用道具
5#
Givent 中级会员 发表于 2016-12-26 16:47:57 | 只看该作者
Fuller 发表于 2016-12-26 16:42
这是个小技巧,可以这样用。你的规则我测试了,运行也正常,出现那个提示不用管,只要能回退回来,能进行 ...

恩,不用管,爬虫会回退还是会抓取是么?
另外,我这个重复率这么高怎么办啊。我在想是不是不要使用crontab自动激活,直接单搜会好一点呢?
举报 使用道具
6#
Fuller 管理员 发表于 2016-12-26 16:49:37 | 只看该作者
Givent 发表于 2016-12-26 16:47
恩,不用管,爬虫会回退还是会抓取是么?
另外,我这个重复率这么高怎么办啊。我在想是不是不要使用cront ...

可以爬。

你先不要用crontab,单搜看看重复率是多少
举报 使用道具
7#
Givent 中级会员 发表于 2016-12-26 17:03:54 | 只看该作者
Fuller 发表于 2016-12-26 16:49
可以爬。

你先不要用crontab,单搜看看重复率是多少

就直接激活规则1所有线索,点击单搜就可以了是么

举报 使用道具
8#
quyixuan 金牌会员 发表于 2016-12-26 17:05:29 | 只看该作者
Givent 发表于 2016-12-26 17:03
就直接激活规则1所有线索,点击单搜就可以了是么

你先统计一下线索数量,然后点击单搜会提示输入线索数量

举报 使用道具
9#
Givent 中级会员 发表于 2016-12-26 17:09:15 | 只看该作者
quyixuan 发表于 2016-12-26 17:05
你先统计一下线索数量,然后点击单搜会提示输入线索数量

单搜规则1后,规则2统计不了线索的。跟一般的层级网页不一样

举报 使用道具
10#
Givent 中级会员 发表于 2016-12-26 17:18:08 | 只看该作者
Fuller 发表于 2016-12-26 16:49
可以爬。

你先不要用crontab,单搜看看重复率是多少

激活规则1后单搜,出现这种情况了。没有定位到节点?

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-15 10:40