Web信息提取

能不能控制抓取的速度?

能不能控制抓取的速度?现在我抓取百度google,都因为过快而被封IP,dataScraper能控制两个抓取请求之间的时间间隔吗?

MetaSeeker QQ交流群

我创建了一个群 群号:144346213

希望广大MetaSeeker的研究者 跟初学者加入 来更好的交流。

MetaSeeker QQ交流群

我创建了一个群 群号:144346213

希望广大MetaSeeker的研究者 跟初学者加入 来更好的交流。

MetaSeeker QQ交流群

我创建了一个群 群号:144346213

希望广大MetaSeeker的研究者 跟初学者加入 来更好的交流。

如何获取嵌套的回复信息?

非常感谢这款工具,请问您如果要获取那种嵌套的回复信息,应该怎样设置抓取规则呢?是不是应该在定义收集箱的时候就定义出容许嵌套的结构?谢谢!

在线等待解答 网页提取失败

点提取的时候 软件显示 Failed:Crawl cannot be initiated from the state of FAILED.

提取数据存储位置问题

您好:
谢谢您帮助我解答了周期性问题,我现在基本上能够周期性提取数据!但是现在面临数据存储方面的问题:
我用软件周期性提取数据时,提取的数据都自动存储在C盘了。因为C盘(系统盘)空间有限,我想把存储位置换到其他盘,不知道需要进行什么设置?
急盼您的解答!谢谢!

周期性提取数据

您好:
经过几天的学习,现在我基本上掌握了定义提取数据规则,在此非常感学您给予我们的技术帮助。现在我主要想对网站上的数据进行自动周期性(定时)提取数据,但经过多次尝试,始终无法提取到数据,在DataScraper—Web信息提取工具的日志窗口中始终弹出“Timeout to load the page”,我始终不明白是什么原因。现在主要解决问题是:在无人看守情况下,想通过软件每5min提取一次网站数据(网站每5min更新一次数据)

怎样阻止51yes弹出关于sa.aspx的窗口

DataScraper提取网站数据时,可能会遇到弹出窗口的情况,DataScraper能够自动关闭目标网站弹出的窗口,但是,最近大量网站会弹出询问是否存储sa.aspx文件的对话框,该文件是由http://count6.51yes.com 发布的,count后面的数字会变。Firefox并不知道该怎样处理aspx文件,缺省情况下,会询问用户怎样处理这些文件,用户可以选择打开或者存储。

新手问题:怎样提取更多线索啊?

我刚开始的时候可以提取20多条的,但我改了一下提取结构,然后上载提取时,只能提取一条记录@@
怎样才可以把可能的所有记录提取啊?谢谢!

Syndicate content