最后登录 1970-1-1
您需要 登录 才可以下载或查看,没有帐号?立即注册
xandy 发表于 2017-4-5 14:23 你的样本网址是: 这个网址并不能抓到你要的结果,样本网址要以你要抓取内容的网页网址为准的,比如下面这 ...
最后登录 2025-5-4
verygood 发表于 2017-4-5 15:09 谢谢,但是这个网址太长了,被自动截断了。有什么其它方法可以爬取百度搜索结果吗? ...
Fuller 发表于 2017-4-5 16:19 做规则的时候,提示网址截断并不影响爬虫的工作,另外,百度新闻抓取有现成的爬虫,这里是新闻类抓取,包 ...
Fuller 发表于 2017-4-5 16:24 你的样本网址是什么?直接加载你的规则是失败的,因为只显示了首页。
Fuller 发表于 2017-4-5 16:30 百度网页搜索的规则很难做,尤其是第一个页,网页上有多种结构的结果,比如,有图和没有图的,有相关新闻 ...
verygood 发表于 2017-4-5 16:41 上面那个样本网址搜索出来的结果的结构是一样的。我不需要图片,只需要标题、时间、摘要、网址,如果可能 ...
发表回复 回帖并转播 回帖后跳转到最后一页
GMT+8, 2025-5-5 01:29
共 10 个关于本帖的回复 最后回复于 2017-4-5 17:58