登录账号,进入界面
在浏览器下,正常进入
但是将网址添加到打数机后,无法打开网页,抓取失败!


2.png (149.4 KB, 下载次数: 597)

进入需要抓取页面

进入需要抓取页面

3.png (8.08 KB, 下载次数: 633)

添加线索

添加线索

4.png (45.3 KB, 下载次数: 586)

抓取失败

抓取失败
举报 使用道具
| 回复

共 4 个关于本帖的回复 最后回复于 2020-1-14 17:47

沙发
Fuller 管理员 发表于 2020-1-13 11:48:16 | 只看该作者
第一,你在集搜客浏览器也需要登陆账号
第二,你登录后,进入的页面的网址和你添加的网址是不是一样的?
举报 使用道具
板凳
Fuller 管理员 发表于 2020-1-13 12:18:14 | 只看该作者
chrome浏览器看到的内容:


爬虫浏览器看到的内容


几乎没有差别,你要采集的网页是这个吗?这是用你的网址加载出来的网页
举报 使用道具
地板
hyanrong 中级会员 发表于 2020-1-14 16:21:33 | 只看该作者
Fuller 发表于 2020-1-13 12:18
chrome浏览器看到的内容:

GooSeeker浏览器打开网页没有任何问题,爬虫的时候抓不到任何数据
举报 使用道具
5#
Fuller 管理员 发表于 2020-1-14 17:47:00 | 只看该作者
hyanrong 发表于 2020-1-14 16:21
GooSeeker浏览器打开网页没有任何问题,爬虫的时候抓不到任何数据

DS打数机菜单 配置-》配置浏览器,前三项是关于加载内容筛选的,缺省是全勾上的,如果没有勾上,勾上试试
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-19 15:42