Web信息提取

如何获取<ahref="javascript:__doPostBack('mainModuleContainer$485$488$ctl00$ResultControl1$ANPager','2')>返回的url

Mon, 11/08/2010 - 22:12 — louxiaofeng

如何获取下页下页对应的url

Web信息提取

2 comments

operation example教程的一点疑问？

Fri, 10/08/2010 - 02:21 — shawn

下载了operation example
v1.0，在第一个练习中尝试反选DOM节点“美食—贵州菜”成功；
当“美食”本身不是超链接时，则“贵州菜”无法反选DOM节点，如何处理？
是否是“美食”本身是超链接才可以？
可以查看样本：
http://www.ylmf.net/当中标题栏右侧的“社区服务”可以反选DOM节点，而鼠标滑过出现的“圈子”“勋章中心”“道具中心”“体彩交流”无法反选，怎么处理？

Web信息提取

3 comments

从XML文件导出数据到Excel出错

Tue, 08/17/2010 - 09:19 — 意气少年

如题。我从维基公司库提取公司信息，提取完成后是一大推XML文件，每个文件包含一条记录。
有以下情形：
1. 使用excel打开XML文件，打开方式为“使用XML源任务窗口"，建立映射：从右边的XML源中将Item中的字段，拉到excel表格，结果无法显示标题；忽视这个错误，导入数据，结果只能导入一条数据，其他文件导入失败；

Web信息提取

为什么不能提供对某一URL目录下的所有连接进行爬取的功能？

Thu, 08/12/2010 - 11:51 — snipersun

类似flashget下载一个页面的所有连接一样，再加上多层就好了。

Web信息提取

1 comment

用XSLT提取网页数据的技巧

Sat, 07/31/2010 - 18:38 — Fuller

网页数据提取软件MetaSeeker具有操作简易的图形化界面，容易快速掌握普通的网页数据提取技能，但是，一些特殊的数据提取需求需要使用自定义XPath或XSLT规则的方法得以满足，MetaSeeker能够无缝地将用户自定义的XPath或XSLT规则片断嵌入到MetaStudio自动生成的数据提取规则框架中。文件《采集京东商城网站的产品信息的技巧》展示了另一个自定义XPath的数据提取案例。

Web信息提取

Login to post comments
Read more

DataScraper如何跳过继续提取

Sat, 07/17/2010 - 08:26 — redplus

当目标页面出现一个提示信息（比方说你要查找的信息不存在或是其他），其内容格式跟我定义的信息结构不相符时，发现DataScraper就停在那了，不能继续下条线索的提取，在日志文件里面发现以下提示：
DataScraperEngine handleLoadEvent DEBUG: load has been caught

请问这个问题可以解决吗？该如何设置参数？