如图 航空公司为什么是空的 其他的就能抓到

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-3-11 16:16

沙发
zhangyushiwo 新手上路 发表于 2016-3-10 20:35:43 | 只看该作者
还有一个问题就是DS打数器在抓取网页内容时向下抓取的速度太快了 网页还在向下加载内容,DS打数器以为到头了,就结束抓取。但是下面还有内容啊,只是还没加载出来。请问这个要怎么解决?是网速的问题吗
举报 使用道具
板凳
Fuller 管理员 发表于 2016-3-10 21:50:05 | 只看该作者
zhangyushiwo 发表于 2016-3-10 20:35
还有一个问题就是DS打数器在抓取网页内容时向下抓取的速度太快了 网页还在向下加载内容,DS打数器以为到头 ...

设置了滚屏参数?有个管滚屏速度的,设置成负数,比如,-2,越小越慢。另外,不能打开定时器触发。

只有抓取到第一行的航空公司名字,那是因为第一行和其它行的dom结构不一样,要仔细看看dom结构的差别
举报 使用道具
地板
zhangyushiwo 新手上路 发表于 2016-3-11 14:45:21 | 只看该作者
Fuller 发表于 2016-3-10 21:50
设置了滚屏参数?有个管滚屏速度的,设置成负数,比如,-2,越小越慢。另外,不能打开定时器触发。

只有 ...

谢谢你!DOM结构不一样 请问要怎么解决呢?
举报 使用道具
5#
Fuller 管理员 发表于 2016-3-11 16:16:00 | 只看该作者
zhangyushiwo 发表于 2016-3-11 14:45
谢谢你!DOM结构不一样 请问要怎么解决呢?

一般来说,每个特殊的可能会放在更深一层的标签中,比如
  1. <div>
  2.       <b>xxxxxx</b>
  3. </div>
  4. <div>
  5.       yyyyy
  6. </div>
复制代码

那么用div这层做内容映射,为了用一个元素节点做内容映射,首先要做高级设置-》抓取特定内容-》文本内容,才能做映射。更多案例参看:http://www.gooseeker.com/doc/thread-692-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别
  • GooSeeker分词、情感分析和文本分析平台简
  • 聚类分析和主题分析中的特征选择参数的设置

热门用户

GMT+8, 2026-3-22 09:53