本帖最后由 lucky半杯 于 2017-4-17 11:44 编辑

网址:https://shopsearch.taobao.com/se ... _type=&ratesum=
每将鼠标移到该地方,出现我要的信息,如描述相符4.81。但是在MS数台上,每点击一次不同店铺的4.81,都会弹出要我刷新网页结构。如果不刷新就采集不到


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 24 个关于本帖的回复 最后回复于 2017-4-18 18:43

沙发
lucky半杯 中级会员 发表于 2017-4-17 11:54:21 | 只看该作者
还有那个皇冠图标,采集他的class值,为20,但是其他产品也只能是采集到20的,2个皇冠之类的就采集不到
举报 使用道具
板凳
Fuller 管理员 发表于 2017-4-17 12:28:03 | 只看该作者
lucky半杯 发表于 2017-4-17 11:54
还有那个皇冠图标,采集他的class值,为20,但是其他产品也只能是采集到20的,2个皇冠之类的就采集不到 ...

你的规则名是什么?我直接针对你的规则做诊断就更有效一些
举报 使用道具
地板
lucky半杯 中级会员 发表于 2017-4-17 12:59:36 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

文具店铺
举报 使用道具
5#
lucky半杯 中级会员 发表于 2017-4-17 14:39:21 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

看了吗是不是要写XPATH

举报 使用道具
6#
lucky半杯 中级会员 发表于 2017-4-17 14:39:43 | 只看该作者
Fuller 发表于 2017-4-17 12:28
你的规则名是什么?我直接针对你的规则做诊断就更有效一些

你好,能帮忙看下嘛

举报 使用道具
7#
Fuller 管理员 发表于 2017-4-17 15:00:20 | 只看该作者
lucky半杯 发表于 2017-4-17 14:39
你好,能帮忙看下嘛

信用 那里,DOM上能看到那个a节点的class='rank seller-rank-20',这个数字一定是跟级别有关,所以,在生成的规则中如果含有这个数字,就没有通用性。点击“测试”按钮,再点击数据规则,能看到他的规则。入下图



可以用自定义xpath
  1. .//*[contains(@class,'rank seller-rank')]/@class
复制代码






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
8#
lucky半杯 中级会员 发表于 2017-4-17 15:07:28 | 只看该作者
Fuller 发表于 2017-4-17 15:00
信用 那里,DOM上能看到那个a节点的class='rank seller-rank-20',这个数字一定是跟级别有关,所以,在生 ...

感谢,盯着  屏幕刷新到现在,以后回了,谢了

举报 使用道具
9#
Fuller 管理员 发表于 2017-4-17 15:42:58 | 只看该作者
lucky半杯 发表于 2017-4-17 15:07
感谢,盯着  屏幕刷新到现在,以后回了,谢了

如果是点击或者悬浮才能出现的内容,需要定义连续动作,而且要两级规则,第一级是动作前的,第二级是动作后的,这里有个悬浮动作的教程《采集悬浮窗信息——已微博为例
举报 使用道具
10#
lucky半杯 中级会员 发表于 2017-4-17 18:57:27 | 只看该作者
Fuller 发表于 2017-4-17 15:42
如果是点击或者悬浮才能出现的内容,需要定义连续动作,而且要两级规则,第一级是动作前的,第二级是动作 ...

我觉得第一步做规则,需要设置样例复制,不然一页只能抓第一个,我的就是这样

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 360或火绒等杀毒软件导致GooSeeker爬虫软件
  • 话题分析(NMF模型和LDA模型)软件的安装和
  • 运行Apple无法验证的程序的方法
  • 文本聚类分析软件的安装和使用方法
  • 利用AI阅读和分析文本:扣子COZE记录用户反

热门用户

GMT+8, 2025-5-5 05:05