|
你现在一共是几级规则?如果我做这个网站的话,我会做3级规则:
第一级:定义点击动作,点击列表中的每个汽车,目标主题是第二个规则。同时在爬虫路线那里做翻页。翻页和动作不冲突,集搜客爬虫会自动地先进行循环点击,再执行翻页
第二级:抓取详情信息,再定义一个动作,要么用一个回退动作,要么一个点击动作,点击页面上的All result,目标主题是第一级
至于悬浮显示的那个内容,不能用悬浮动作,因为那个内容是html原生的。在LI节点的title属性中,直接在DOM树上,用LI下面的title属性节点做内容映射就能抓取。所有属性节点放在+attributes下,要展开才能看到
|
|
共 8 个关于本帖的回复 最后回复于 2018-6-18 09:58