本帖最后由 dollywood 于 2017-8-21 17:49 编辑
目标:采集爱回收页面不同选项下的价格,整理Excel表格,得出每一个选项对于回收价格的影响。
目标网址:http://aihuishou.com/product/23422.html
页面分析:点击不同的选项,最后需要点击询价按钮,最终的价格需要在第二级网页进行采集。
采集思路:用连续动作模拟点击,因为点击页面的偏好class不一样,做了四级步骤。第一级和第二级为点击选项,第三级为点击询价按钮,第四级为回退网页。
采集思路有参考帖子:http://www.gooseeker.com/doc/thread-7842-1-1.html
规则名:1.爱回收层级抓取-第一级 2.爱回收层级抓取-第二级 3.爱回收层级抓取-第三级
遇到问题:
1.爱回收层级抓取-第二级采集运行错误,在采集一个选项后提示规则不适用?
2.如已经选择了 国行机器-32G-金色-屏幕完好等选项,如何体现在抓取结果里并与最后抓取价格做对应?
3.因为价格是展现在点击询价之后的网址里,应该如何用第二级规则去采集跳转后的网址,供第三级规则做为线索使用?
如果方便,可以直接修改我的规则,十分感谢!
|
|
|
|
|
共 4 个关于本帖的回复 最后回复于 2017-8-21 19:04