1.百度提取到第二页就停止,例:city8-汽车用品商行批发
百度搜索结果,marker线索记号值是 下一页>。后来我部分匹配成 下一页,也只能搜索到第二页。好像到第二页也是java形式
2.腾讯地图都是JAVA怎么提取
在腾讯地图里搜索的结果都是javascript:void(0) 怎么提取。
http://map.qq.com/
3.还有登陆我们网站,和发表文章的验证码太难输正确。
1.百度提取到第二页就停止,例:city8-汽车用品商行批发
百度搜索结果,marker线索记号值是 下一页>。后来我部分匹配成 下一页,也只能搜索到第二页。好像到第二页也是java形式
2.腾讯地图都是JAVA怎么提取
在腾讯地图里搜索的结果都是javascript:void(0) 怎么提取。
http://map.qq.com/
3.还有登陆我们网站,和发表文章的验证码太难输正确。
tmall商品的交易记录,现在又多了一个“查看更多历史记录”,必须点击它之后,才能看到更多的历史交易记录,像这种情况,应该怎么处理呢?有没有相关的案例可以参考一下?谢谢。
我创建了一个主题为:szh_demo_tmaill_history,对http://detail.tmall.com/item.htm?id=36470320710中的交易记录进行提取。交易记录基本上都能提取出来,现在我想利用这个主题对http://detail.tmall.com/item.htm?id=36458766723这个网页也提取交易记录,网页结构都是类似的,应该怎样操作呢?
我把网页地址替换之后,之前定义的freeform和clue等信息都没有了。
老大,我的目标网站主体是两个DIV,左侧DIV中是js控制的目录树,点击父目录前的+号展开,层级不定。右侧DIV中显示点击目录树节点时对应的内容。
我研究了一下帮助文档中的多级目录和模拟点击,没有想出抓取上述动态目录树且层级不定的方法。
求赐教
Fuller老大,我的MetaStudio和DataScraper今天下午突然链接补上服务器,请帮忙看下!
另外,请问老大,在线收费版的费用及功能情况如何?谢谢!
Fuller大神,在新浪微博中,每条微博发布者的关注数、粉丝数、微博数并不在搜索结果中直接显示,而是需要鼠标停留在微博发布者的名字上才能显示出来,请问能否有办法进行抓取?拜谢!!!
老大!我在做新浪微博数据抓取时,发现新浪微博的转发数和评论数的class值和结构基本一样,请问,有什么方法可以解决这个问题吗?谢谢!
老大好!我针对新浪微博做了一个信息结构和信息提取指令文件,已上传,但在测试时报错:“Exception caught: msg=Component returned failure code: 0x80600001 [nsIXSLTProcessor.importStylesheet] Transforming for FF”,麻烦老大帮忙看看问题在哪。
具体地,我是用账号登陆了新浪微博后,通过搜索关键词搜索新浪微博,获得搜索结果。然后我想把搜索结果的相关内容搜集下来,但是报错了。
非常感谢!
主题名称为:JD_Record_2
前一级按京东品牌筛选制定的线索,这一主题提取每个品牌下的所有产品信息
问题是:
比如“JADO”品牌下有10页产品,第10页产品数量不满60个,结果提取结果只有9页内容一共540个产品,第10页抓不下来
而Datascraper显示FindDataSchema_Plain, 抓取后所有线索都变成了unknownschema
这种情况如何解决?怎样把第10页内容抓下来?
我抓取新浪微博只能抓取两页后就停止了,什么翻页也没有,怎么办