在集搜客数据管家里也无法获取
举报 使用道具
| 回复

共 12 个关于本帖的回复 最后回复于 2020-10-8 17:54

沙发
Fuller 管理员 发表于 2020-10-7 11:20:19 | 只看该作者
发一个网址出来看看。采集下来后有什么异常?
举报 使用道具
板凳
bqq239 初级会员 发表于 2020-10-7 11:58:49 | 只看该作者
Fuller 发表于 2020-10-7 11:20
发一个网址出来看看。采集下来后有什么异常?

https://hotels.ctrip.com/hotels/ ... amp;hotelUniqueKey=


采集不到数据
举报 使用道具
地板
Fuller 管理员 发表于 2020-10-7 13:28:04 | 只看该作者
bqq239 发表于 2020-10-7 11:58
https://hotels.ctrip.com/hotels/detail/?hotelId=29626521&checkIn=2020-10-07&checkOut=2020-10-08&ci ...



这是数据管家打开的网页,可以看到评论。如果规则做的正确的话,应该能采集到数据。爬虫规则是你自己做的?还是使用了爬携程的快捷采集工具
举报 使用道具
5#
bqq239 初级会员 发表于 2020-10-7 15:25:57 | 只看该作者
Fuller 发表于 2020-10-7 13:28
这是数据管家打开的网页,可以看到评论。如果规则做的正确的话,应该能采集到数据。爬虫规则是你自己做 ...

使用的快捷采集。是可以看到评论的,但是中间会卡住,最后是爬不到数据的。(之前不用数据管家的时候是可以爬取到的哎)
举报 使用道具
6#
Fuller 管理员 发表于 2020-10-7 15:54:33 | 只看该作者
bqq239 发表于 2020-10-7 15:25
使用的快捷采集。是可以看到评论的,但是中间会卡住,最后是爬不到数据的。(之前不用数据管家的时候是可 ...

如果在集搜客爬虫软件中打开网页,能看到评论,就用爬虫软件爬。有些网站用爬虫软件打开显示不了信息,所以,退出了数据管家软件做补充。

如果翻页抓取过程中,翻页中断了,把这个网址重新爬一遍。有时候网络不稳定,或者服务器反应不过来,就超时中断了
举报 使用道具
7#
Fuller 管理员 发表于 2020-10-7 16:06:20 | 只看该作者
我安排人检查一下这个快捷采集工具是不是需要修改一下了,可能携程网站改版了
举报 使用道具
8#
bqq239 初级会员 发表于 2020-10-7 16:08:35 | 只看该作者
Fuller 发表于 2020-10-7 15:54
如果在集搜客爬虫软件中打开网页,能看到评论,就用爬虫软件爬。有些网站用爬虫软件打开显示不了信息,所 ...

现在用集搜客爬虫软件也没办法获取数据了哎,好像网页改版了..


举报 使用道具
9#
bqq239 初级会员 发表于 2020-10-7 16:08:49 | 只看该作者
Fuller 发表于 2020-10-7 16:06
我安排人检查一下这个快捷采集工具是不是需要修改一下了,可能携程网站改版了 ...

好的!感谢!

举报 使用道具
10#
wangyong 版主 发表于 2020-10-8 10:56:19 | 只看该作者

添加这个链接就能采到数据了,https://hotels.ctrip.com/hotel/dianping/29626521.html?isFull=F

你添加的是选择日期住宿的酒店网址,不是单纯的酒店详情
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-25 10:23