Web信息提取

你好，我按上面的方法一步步配置，在dataSceaper运行第一个主题时，发现浏览器的确是在不断翻页抓取结果的，抓取完成后，我就到本地的DataScraperWorks文件夹下，只见到一个xml文件，然后我打开后发现里面只有第一个主题的内容结果，只有标题价格等。但第2个主题的评论信息完全看不到？请问第2个主题的结果应该怎样找到呢？我是菜鸟，希望大神能详细一点解答，谢谢您！

Web信息提取

1 comment

网站ajax数据包抓取问题

Thu, 06/05/2014 - 11:24 — dly1911618

想抓取下面这个网站的数据包链接：
http://jp101.ys168.com/

但是因为ajax的关系，不知道如何设置线索，各位有什么好的建议吗？

Web信息提取

1 comment

提取信息翻页问题，属性是onclick="getnextquestion(this)" href="javascript:;"怎么实现翻页

Mon, 05/26/2014 - 14:25 — benniao

提取信息翻页问题，属性是onclick="getnextquestion(this)" href="javascript:;"怎么实现翻页

提取网址：http://m.jxedt.com/mnks/chapter.asp?type=c&chapter=1

我建立的规则名字：jiaxiao

谢谢！

Web信息提取

1 comment

Datascraper使用时遇到问题

Wed, 05/21/2014 - 11:44 — liuyue8453200

您好，我在抓取线索的时候提示 the URL of the inthread clue is same as the current Stopped 这是什么原因呢？只抓取了2个数据我的主题是京东乐视S50评价麻烦您看一下吧谢谢！

Web信息提取

Login to post comments

Fuller大神：
你好！最近在搜集新浪微博时遇到了翻页的问题，坛子里也有很多教程，但是发现都不适合，都无法完成翻页。
目标页面：http://weibo.com/1764570453/B30DgfXaC?type=repost
主题名是：G1
采用了延长模式和积极模式
试了几种方法问题如下：
1、设置线索为偏好ID
问题：翻到第二页就停止了等了很久出现timeout
2、设置偏好CLASS
问题：翻来翻去都是第1页

求教大神如何解决。