集搜客GooSeeker网络爬虫

标题: 大神求助!!怎样按一个特殊的规则抓取网页信息? [打印本页]

作者: yanghaonan    时间: 2017-4-8 16:54
标题: 大神求助!!怎样按一个特殊的规则抓取网页信息?
我想抓取BBS的数据,第一页第一行总是发帖人的信息,后面所有都是回复人的信息。翻页之后都是回复人的信息。怎么设计这个抓取规则???
谢谢大神


作者: shenzhenwan10    时间: 2017-4-8 16:59
你可以做2个规则
第一个规则抓第一页的发帖人和回复
翻页后用第二个规则,抓所有回复
作者: yanghaonan    时间: 2017-4-8 17:08
shenzhenwan10 发表于 2017-4-8 16:59
你可以做2个规则
第一个规则抓第一页的发帖人和回复
翻页后用第二个规则,抓所有回复 ...

谢谢!
如果在层级抓取上使用,在第二层上怎么设置这两个规则?

作者: ym    时间: 2017-4-8 19:12
第二层做成同一个主题名,不同规则编号,操作可参考教程《采集同一网站的不同网页结构信息》




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2