快捷导航

中级教程

2015-10-16 10:35| 发布者: ym| 查看: 21267| 评论: 0

摘要: 中级教程将教会你采集数据常用的方法和手段,例如:怎么采集多个商品的标题、网址、价格?如何采集网页完整内容?翻页怎么弄?多层级网页怎么采集?怎样精确定位?图片怎么下载? ...

一、采集流程设计

采集流程:做规则前就要计划

二、单点采集

单点采集一条信息的标题网址价格

合并采集网页的分散文本信息

三、批量采集

    3.1 样例复制

样例复制批量采集相同结构的信息

嵌套样例复制解决采集多模块样例

样例复制相关问题的解决方法集锦

    3.2 翻页采集

记号线索:利用文本记号设置翻页

相对线索:解决数字页码的翻页

没有文本记号怎么设置翻页线索

翻页重复、死循环的解决方法

翻页采集相关问题的解决方法集锦

    3.3 定位标志

定位标志提高规则的精度和适用度

定位标志批量采集相同定位信息

避免不合适的定位标志影响抓取规则

定位标志相关问题的解决方法集锦

四、层级网页采集

模拟点击切换到另一标签窗口采数据

制作层级规则深入多层网页采数据

层级采集相关问题的解决方法集锦

五、网页图片采集

怎样抓取网页的同时下载图片

图片采集相关问题的解决方法集锦


23

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (23 人)

上一篇:初级教程下一篇:功能按钮介绍

相关阅读

最新评论

集搜客GooSeeker网络爬虫 ( 粤ICP备11065265号-2 )

GMT+8, 2017-7-28 08:36