如图 航空公司为什么是空的 其他的就能抓到

举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2016-3-11 16:16

沙发
zhangyushiwo 新手上路 发表于 2016-3-10 20:35:43 | 只看该作者
还有一个问题就是DS打数器在抓取网页内容时向下抓取的速度太快了 网页还在向下加载内容,DS打数器以为到头了,就结束抓取。但是下面还有内容啊,只是还没加载出来。请问这个要怎么解决?是网速的问题吗
举报 使用道具
板凳
Fuller 管理员 发表于 2016-3-10 21:50:05 | 只看该作者
zhangyushiwo 发表于 2016-3-10 20:35
还有一个问题就是DS打数器在抓取网页内容时向下抓取的速度太快了 网页还在向下加载内容,DS打数器以为到头 ...

设置了滚屏参数?有个管滚屏速度的,设置成负数,比如,-2,越小越慢。另外,不能打开定时器触发。

只有抓取到第一行的航空公司名字,那是因为第一行和其它行的dom结构不一样,要仔细看看dom结构的差别
举报 使用道具
地板
zhangyushiwo 新手上路 发表于 2016-3-11 14:45:21 | 只看该作者
Fuller 发表于 2016-3-10 21:50
设置了滚屏参数?有个管滚屏速度的,设置成负数,比如,-2,越小越慢。另外,不能打开定时器触发。

只有 ...

谢谢你!DOM结构不一样 请问要怎么解决呢?
举报 使用道具
5#
Fuller 管理员 发表于 2016-3-11 16:16:00 | 只看该作者
zhangyushiwo 发表于 2016-3-11 14:45
谢谢你!DOM结构不一样 请问要怎么解决呢?

一般来说,每个特殊的可能会放在更深一层的标签中,比如
  1. <div>
  2.       <b>xxxxxx</b>
  3. </div>
  4. <div>
  5.       yyyyy
  6. </div>
复制代码

那么用div这层做内容映射,为了用一个元素节点做内容映射,首先要做高级设置-》抓取特定内容-》文本内容,才能做映射。更多案例参看:http://www.gooseeker.com/doc/thread-692-1-1.html
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 03:38