2015-10-16 10:35| 发布者: ym| 查看: 33897| 评论: 0
一、采集流程设计
采集流程:做规则前就要计划
二、单点采集
单点采集一条信息的标题网址价格
合并采集网页的分散文本信息
三、批量采集
3.1 样例复制
样例复制批量采集相同结构的信息
嵌套样例复制解决采集多模块样例
样例复制相关问题的解决方法集锦
3.2 翻页采集
记号线索:利用文本记号设置翻页
相对线索:解决数字页码的翻页
没有文本记号怎么设置翻页线索
翻页重复、死循环的解决方法
翻页采集相关问题的解决方法集锦
3.3 定位标志
定位标志提高规则的精度和适用度
定位标志批量采集相同定位信息
避免不合适的定位标志影响抓取规则
定位标志相关问题的解决方法集锦
四、层级网页采集
模拟点击切换到另一标签窗口采数据
制作层级规则深入多层网页采数据
层级采集相关问题的解决方法集锦
五、网页图片采集
怎样抓取网页的同时下载图片
图片采集相关问题的解决方法集锦
332287524myh
学习使我掉头发
wuxingchang
toomworld
方兴未艾777
wbog20100319
846583318
yonggandexin68
meilihujia
zhangxiaoshu
gongjicai
门徒
ly19806688
singco890826
Kevin_Durant
ocean8
xuyiminhh
For数据
Anna J
坦克罐头
czm4321
Always
zxd5825089
tianjian_app
评论
GMT+8, 2024-11-5 12:08