还有,我要爬的页面没有  class=page   不知道会不会有影响?[img=0,1]file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\1228089095\QQ\WinTemp\RichOle\IM~IP2C]O(1YE9P@UMO5JHO.png[/img]
[img]file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\1228089095\QQ\WinTemp\RichOle\IM~IP2C]O(1YE9P@UMO5JHO.png[/img]

[img]file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\1228089095\QQ\WinTemp\RichOle\IM~IP2C]O(1YE9P@UMO5JHO.png[/img]


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 14 个关于本帖的回复 最后回复于 2018-1-4 15:45

沙发
yangwenge 金牌会员 发表于 2018-1-4 10:08:52 | 只看该作者
规则名多少?
举报 使用道具
板凳
lzy163mail 新手上路 发表于 2018-1-4 10:10:39 | 只看该作者

药品法律法规加附件1
举报 使用道具
地板
数据集二期 中级会员 发表于 2018-1-4 10:11:13 | 只看该作者
定位方式改成绝对定位试试,如果还不行就把规则名贴出来看看。
举报 使用道具
5#
lzy163mail 新手上路 发表于 2018-1-4 10:13:48 | 只看该作者
数据集二期 发表于 2018-1-4 10:11
定位方式改成绝对定位试试,如果还不行就把规则名贴出来看看。

绝对定位也不可以
举报 使用道具
6#
bowieD 金牌会员 发表于 2018-1-4 10:33:08 | 只看该作者
本帖最后由 bowieD 于 2018-1-4 10:50 编辑

这个网页好像比较特殊,用相对线索翻不了页。
1,因为每一页都有独立的链接,可以通过构造网址的方法把每一页的网址构造出来,再添加到规则进行采集
2,也可以通过样例复制把页码链接采集下来,作为下级线索传到这一级规则中采集

举报 使用道具
7#
lzy163mail 新手上路 发表于 2018-1-4 10:38:25 | 只看该作者
bowieD 发表于 2018-1-4 10:33
这个网页好像比较特殊,用相对线索翻不了页。
1,因为每一页都有独立的链接,可以通过构造网址的方法把每一 ...

但是我的网站有大量的类似页面 每个页面的 页数不确定
举报 使用道具
8#
lzy163mail 新手上路 发表于 2018-1-4 10:41:27 | 只看该作者
lzy163mail 发表于 2018-1-4 10:38
但是我的网站有大量的类似页面 每个页面的 页数不确定

求问大神,我本来想用连续动作,虚拟点击,但是没有class  ,请问可以吗
举报 使用道具
9#
数据集二期 中级会员 发表于 2018-1-4 10:47:50 | 只看该作者
本帖最后由 数据集二期 于 2018-1-4 10:50 编辑
lzy163mail 发表于 2018-1-4 10:41
求问大神,我本来想用连续动作,虚拟点击,但是没有class  ,请问可以吗
...

可以用连续动作翻页,不过相对来说会麻烦一点,建议参考上面的方法。连续动作翻页参考《用连续动作实现翻页点击
举报 使用道具
10#
lzy163mail 新手上路 发表于 2018-1-4 14:36:25 | 只看该作者
bowieD 发表于 2018-1-4 10:33
这个网页好像比较特殊,用相对线索翻不了页。
1,因为每一页都有独立的链接,可以通过构造网址的方法把每一 ...

我有好多个这样的文件并且每个内部页码  不确定也可以吗?求大神详细点。着急要,却老是爬不下来,谢谢谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-12 03:48