样本页面:https://d.guduomedia.com/
这个页面有【网络剧】【网络大电影】【网络综艺】等好几个选项卡,且每个选项卡没有独立页面,所以想通过两级模拟点击来分别抓取每一个选项卡打开后的内容。
第一级主题名:骨朵传媒_网络综艺_模拟点击
映射了【网络综艺】选项卡作为关键内容,并设置了一个点击动作,连接到第二级主题,勾上了窗口可见。
第二级主题名:骨朵传媒_网络综艺
在点击动作做完的页面结构上,映射好了所需要的字段内容。
做好两级主题之后,把主题加入爬虫群,
其中第一级主题设置样本页面为待抓取线索,“抓取数据”和“结果入库”都勾上;
第二级主题没有线索,只勾了“结果入库”
启动爬虫群后,第一级主题运行,成功完成点击动作到第二级主题所要抓取的页面,但停留时间特别短,就结束了抓取。
关掉打数机后,第二级主题没有数据。T.T
不知道问题出在哪儿呢?~
目前做的其他模拟点击其他选项卡并且能成功的主题有
第一级:骨朵传媒_网络大电影_模拟点击
第二级:骨朵传媒_网络大电影
我想打开以上已经成功的主题的调度设置看看,但是这两个主题的调度页面都404了
|
|
|
|
|
共 3 个关于本帖的回复 最后回复于 2017-6-18 11:19