1121#
Fuller 管理员 发表于 2020-7-27 10:39:06 | 只看该作者
YOKA0301 发表于 2020-7-27 10:29
您好!我想问一下为什么大众点评的评论内容会缺漏或者乱码,有解决途径吗 ...

大众点评使用了自定义字体,需要特殊解码一下,通常我们不提供公开使用的解码软件,因为自定义字体可以随时换文字编码,要随时做应对,要投入开发成本
举报 使用道具
1122#
YOKA0301 初级会员 发表于 2020-7-27 10:44:32 | 只看该作者
大概要多少钱呢?数据量不是很大,最多几千条
举报 使用道具
1123#
YOKA0301 初级会员 发表于 2020-7-27 10:47:07 | 只看该作者
或者我充值一个旗舰版本,能帮我解决吗【大哭】,贫苦学生太惨了
举报 使用道具
1124#
YOKA0301 初级会员 发表于 2020-7-27 10:56:32 | 只看该作者
YOKA0301 发表于 2020-7-27 10:44
大概要多少钱呢?数据量不是很大,最多几千条

如果只爬2019年的样子,大概不到300条
举报 使用道具
1125#
Fuller 管理员 发表于 2020-7-27 11:08:30 | 只看该作者
YOKA0301 发表于 2020-7-27 10:56
如果只爬2019年的样子,大概不到300条

大众点评的自定义字体解决起来花费有些大,没法给在线版用户提供这个功能
举报 使用道具
1126#
YOKA0301 初级会员 发表于 2020-7-28 22:59:23 | 只看该作者
您好,我想询问一下微博关键词爬出来的数据,有很大部分是广告,请问有办法剔除吗
举报 使用道具
1127#
qqqz233 新手上路 发表于 2020-7-31 09:15:08 | 只看该作者
您好,请问点击“启动采集”后,已经在浏览器登录了微博,但是“点击此处”继续采集的跳转链接一直没反应,导致无法开始采集是怎么回事 i-i
举报 使用道具
1128#
qqqz233 新手上路 发表于 2020-7-31 09:16:59 | 只看该作者
我是楼上,不好意思打扰了,现在成功了!谢谢!~~
举报 使用道具
1129#
Fuller 管理员 发表于 2020-7-31 10:20:40 | 只看该作者
qqqz233 发表于 2020-7-31 09:16
我是楼上,不好意思打扰了,现在成功了!谢谢!~~


举报 使用道具
1130#
小马快跑 新手上路 发表于 2020-8-6 10:59:21 | 只看该作者
采集过程中能中断吗,应该使用强制关闭还是安全关闭?中途关闭后已经采集的数据可以导出吗?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-29 14:07