|
1,第一级可以只管输入关键词,做动作。为了确保输入能够准确对准INPUT元素,可以创建一个抓取内容,把这个INPUT映射给他,并且设置关键内容。这样就能确保规则与网页结构对的上
2,在DOM上选中一个节点,DOM窗口下部有个按钮:显示XPath,有好几种选择,比如,使用 显示XPath:偏好id,就能自动生成xpath,把这个xpath拷贝过来就可以了
3,DS网络爬虫运行的时候,下一级不需要独立网址;MS定义规则的时候,在MS的浏览器窗口中把网页加载好,做完动作,等网页稳定下来,就给他做规则
4,连续动作的话,第一级和第二级都是连贯执行的,第二级没有独立网址。要想并行的话,需要在第一级并行,比如,多个第一级网址,或者购买“连发弹仓”服务 |
|
共 3 个关于本帖的回复 最后回复于 2016-7-16 18:04