名字是 macore 我想扒翻页这个新闻下所有的帖子,但是发现怎么第一页就不全,能麻烦告诉我是怎么回事吗。。。
建议给每个信息属性尽量映射合适的FreeFormat,这能提高定位准确度。如果抓取不全,看看少哪条评论,然后用MetaStudio的DOM树分析一下这条评论的HTML结构与其它的有什么不同,然后考虑怎样做数据映射和FreeFormat映射才能提供适应度。
163新闻评论抓取技巧
建议给每个信息属性尽量映射合适的FreeFormat,这能提高定位准确度。如果抓取不全,看看少哪条评论,然后用MetaStudio的DOM树分析一下这条评论的HTML结构与其它的有什么不同,然后考虑怎样做数据映射和FreeFormat映射才能提供适应度。