请教下:每天抓一批网址,网址带日期参数,每天抓最新日期
        18号抓:www.test.com?/cdate=2016-08-17&id=1
                      www.test.com?/cdate=2016-08-17&id=2
        19号抓:www.test.com?/cdate=2016-08-18&id=1
                      www.test.com?/cdate=2016-08-18&id=2
网址数量有几百个,有什么可以自动生成url的办法么?
举报 使用道具
| 回复

共 10 个关于本帖的回复 最后回复于 2016-8-26 16:53

沙发
HJLing 版主 发表于 2016-8-26 16:08:36 | 只看该作者
去excel替换一下
举报 使用道具
板凳
scraper 论坛元老 发表于 2016-8-26 16:08:53 | 只看该作者

每天都得手动加入到线索里么
举报 使用道具
地板
HJLing 版主 发表于 2016-8-26 16:09:16 | 只看该作者
scraper 发表于 2016-8-26 16:08
每天都得手动加入到线索里么

是的
举报 使用道具
5#
scraper 论坛元老 发表于 2016-8-26 16:09:34 | 只看该作者

好吧
没有更简单的方式了么
举报 使用道具
6#
HJLing 版主 发表于 2016-8-26 16:10:00 | 只看该作者
scraper 发表于 2016-8-26 16:09
好吧
没有更简单的方式了么

因为你的网址不是由上级生成的 所以只能自己添加到线索里
举报 使用道具
7#
scraper 论坛元老 发表于 2016-8-26 16:10:36 | 只看该作者
HJLing 发表于 2016-8-26 16:10
因为你的网址不是由上级生成的 所以只能自己添加到线索里

噢,明白了
可以我自己弄个页面,把这些url加进去作为上级么?就是我自己写个页面,每天生成上述的url。然后抓这个页面作为上级
举报 使用道具
8#
HJLing 版主 发表于 2016-8-26 16:11:45 | 只看该作者
scraper 发表于 2016-8-26 16:10
噢,明白了
可以我自己弄个页面,把这些url加进去作为上级么?就是我自己写个页面,每天生成上述的url。 ...

可以 只要能采下来并勾上下级线索 就可以为下一级规则生成线索了
举报 使用道具
9#
scraper 论坛元老 发表于 2016-8-26 16:12:04 | 只看该作者
HJLing 发表于 2016-8-26 16:11
可以 只要能采下来并勾上下级线索 就可以为下一级规则生成线索了

内网页面都可以抓是吧
举报 使用道具
10#
HJLing 版主 发表于 2016-8-26 16:12:52 | 只看该作者
scraper 发表于 2016-8-26 16:12
内网页面都可以抓是吧

内网不可以 爬虫需要连我们的服务器才能运行
如果要实现内网抓取需要购买企业版
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-28 20:08