规则名--》cq初中1      规则2--》cq初中2        这个之前跑过一次 可是跑的数据少 我有重新跑的 这次数据正好不好  我把规则2的线索都撤销了  跑完规则1  查看规则2 待抓取2481条  抓取完成29条 我根本没运行 求答
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-12-9 08:49

沙发
wsj521 初级会员 发表于 2016-12-8 17:38:55 | 只看该作者
我不想激活完成的线索  应为我的数据需要采取的先后顺序  
举报 使用道具
板凳
ym 版主 发表于 2016-12-8 17:46:34 | 只看该作者
你有设置过这两个规则的爬虫群调度吗?
你去本地的datascraperworks文件夹里,看看第二级主题有没有刚爬到的xml文件吧
举报 使用道具
地板
wsj521 初级会员 发表于 2016-12-8 17:53:38 | 只看该作者
ym 发表于 2016-12-8 17:46
你有设置过这两个规则的爬虫群调度吗?
你去本地的datascraperworks文件夹里,看看第二级主题有没有刚爬到 ...

我运行了2遍规则1  然后查看规则2的线索数量 都是这样的  没运行爬虫群
举报 使用道具
5#
shenzhenwan10 金牌会员 发表于 2016-12-9 08:49:39 | 只看该作者
仅根据你的描述, 难以判断你说的20个已完成线索怎么来的, 需要你自己做一些操作来进一步分析
你可以到会员中心, 把规则2的线索都删除掉
然后再运行规则1, 运行完成后, 查看规则2的线索状态
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-24 15:42