在搜狐网站里可以加载出网页的全部信息。
但是到了MS某数台以后网页底部的翻页点击模块就加载不出来了。
请问有什么解决方法吗?


举报 使用道具
| 回复

共 6 个关于本帖的回复 最后回复于 2017-2-23 16:26

沙发
xandy 论坛元老 发表于 2017-2-22 17:39:35 | 只看该作者
用的是GS浏览器的MS谋数台还是火狐爬虫插件的MS谋数台?
举报 使用道具
板凳
Fuller 管理员 发表于 2017-2-22 22:37:58 | 只看该作者
请把网址贴出来,我们测试一下
举报 使用道具
地板
weier_2016 中级会员 发表于 2017-2-23 13:34:43 | 只看该作者
Fuller 发表于 2017-2-22 22:37
请把网址贴出来,我们测试一下

http://news.search.hexun.com/news?key=%D6%D0%B4%A2%B7%A2%D5%B9
举报 使用道具
5#
weier_2016 中级会员 发表于 2017-2-23 13:52:43 | 只看该作者
xandy 发表于 2017-2-22 17:39
用的是GS浏览器的MS谋数台还是火狐爬虫插件的MS谋数台?

火狐版插件的
举报 使用道具
6#
ym 版主 发表于 2017-2-23 14:25:04 | 只看该作者

这个应该是火狐和爬虫的网页解析程序有漏洞,目前版本是显示不了翻页区块。
目前的解决方法是:和讯新闻的搜索结果,每页都是有独立页码网址的,可以构造出每页网址,然后添加到规则里批量采集,参考《如何构造网址》《如何管理规则的线索》
举报 使用道具
7#
weier_2016 中级会员 发表于 2017-2-23 16:26:52 | 只看该作者
ym 发表于 2017-2-23 14:25
这个应该是火狐和爬虫的网页解析程序有漏洞,目前版本是显示不了翻页区块。
目前的解决方法是:和讯新闻的 ...

谢谢!我还以为我的IP被网站封了呢,非常感谢哈
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 08:13