主题名:旅游英语列表

我观察到第一页和第二页翻页线索的定位编号是不一样的,可能翻到第二页就不该往下翻了(不太了解这里面的机制),但是出现的情况是:不断打开新窗口加载第二页,而不继续往下翻或者停止翻页。

举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 2016-11-20 20:12

沙发
HJLing 版主 发表于 2016-11-20 19:58:42 | 只看该作者
翻页线索没有用偏好class 所以一直在第一页点击下一页 加上是新弹窗 所以不停弹出第二页
翻页是弹出新窗口 要用飞掠模式 飞掠模式是旗舰版才有的功能
不过每一页都有独立网址 你可以自己构造网址作为线索来采集
举报 使用道具
板凳
Fuller 管理员 发表于 2016-11-20 20:01:42 | 只看该作者
这个网页设计有问题,每一个分页都是在一个新窗口显示的,还好每个分页都有独立网址,那么你就不用做翻页规则了,而是只做一页的内容抓取规则,然后把所有分页的网址构造出来,成批导入进去,就像抓单页一样抓数据
举报 使用道具
地板
bigface 新手上路 发表于 2016-11-20 20:12:55 | 只看该作者
我试试~这应该能解决我的问题~谢谢
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-5-7 18:15