集搜客GooSeeker网络爬虫

标题: 可以实现某个固定时间段(动态的,当天日期的前一天)的内容采集吗 [打印本页]

作者: 18206352582    时间: 2018-9-27 19:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: Fuller    时间: 2018-9-27 21:54
什么网站?因为点击一个日历要好几个动作,就像人点击一样,定义连续点击很麻烦。你先看看这个网站的url网址中有没有包含了时间信息,如果含有,那么就不要点击了,直接构造网址就行
作者: 18206352582    时间: 2018-9-28 22:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: Fuller    时间: 2018-9-29 09:03
18206352582 发表于 2018-9-28 22:39
淘宝后台选订单,我只想选最近一天的订单。

选时间段就更麻烦,要写xpath。
你采集的网址里面有没有含时间参数,如果含时间参数,构造网址最容易

作者: 18206352582    时间: 2018-9-29 09:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: 18206352582    时间: 2018-9-29 09:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: 18206352582    时间: 2018-9-29 10:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: Fuller    时间: 2018-9-29 10:15
18206352582 发表于 2018-9-29 10:01
我写了这个xpath, 是能定位到当前日期的节点  //*[contains(@aria-disabled,"false") and contains(@aria- ...

如果前一个节点是div的话,应该这样  //*[contains(@aria-disabled,"false") and contains(@aria-selected,"true")]/preceding-sibling::div[1]



作者: 18206352582    时间: 2018-9-29 10:22
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 集搜客GooSeeker网络爬虫 (https://www.gooseeker.com/doc/) Powered by Discuz! X3.2