我正在尝试使用新版集搜客分词和分类检索平台。
会以回帖的形式, 把使用的过程和碰到的问题写出来

举报 使用道具
| 回复

共 27 个关于本帖的回复 最后回复于 2020-2-3 19:13

沙发
Fuller 管理员 发表于 2020-2-2 10:24:04 | 只看该作者
欢迎讨论。集搜客分词和文本分析平台在不断更新,把大家需要的功能加上,有什么好想法提出来
举报 使用道具
板凳
微舆情 高级会员 发表于 2020-2-2 10:32:14 | 只看该作者
测试数据的准备:
使用集搜客的快捷采集采集工具:京东-列表页采集京东商品评论采集
抓取京东手机, OPPO品牌, 列表第一页机型的评论内容。

举报 使用道具
地板
Fuller 管理员 发表于 2020-2-2 10:41:22 | 只看该作者
微舆情 发表于 2020-2-2 10:32
测试数据的准备:
使用集搜客的快捷采集采集工具:京东-列表页采集,京东商品评论采集
抓取京东手机, OPP ...

对,从分析用户评论入手比较好,用来做消费者洞察分析,分析过程比较成熟,有很多业界公认的方法
举报 使用道具
5#
微舆情 高级会员 发表于 2020-2-2 11:35:52 | 只看该作者
数据采集完成了, 一共采集了25380条评论
举报 使用道具
6#
Fuller 管理员 发表于 2020-2-2 11:40:59 | 只看该作者
微舆情 发表于 2020-2-2 11:35
数据采集完成了, 一共采集了25380条评论

接下来就要导入分词和分析平台了,注意有两种选择,看下图
第一种:不含有表头,或者表头不含有规定名字的字段,这样会把excel的每个单元格作为一个分析文档
第二种:含有规定的表头,这样导入以后,对于后续的检索、分类等处理都有好处,比如,就可以按照时间进行检索和排序等


举报 使用道具
7#
微舆情 高级会员 发表于 2020-2-2 11:47:56 | 只看该作者
看了一下集搜客新版分词和分类检索平台使用手册, 对导入的excel字段名是有要求, 于是按要求修改了字段名, 同时删除了一些暂时用不上的字段, 最后数据的截图如下:

举报 使用道具
8#
微舆情 高级会员 发表于 2020-2-2 11:56:00 | 只看该作者
想把excel数据表分享出来, 不过上传时提示“文件过大”
已经反馈给了集搜客技术支持人员

举报 使用道具
9#
Fuller 管理员 发表于 2020-2-2 12:05:04 | 只看该作者
微舆情 发表于 2020-2-2 11:56
想把excel数据表分享出来, 不过上传时提示“文件过大”
已经反馈给了集搜客技术支持人员

文件有多大?如果文件很大,建议加入到集搜客qq群(集搜客6群是:645638422 ),在qq群里分享和讨论更便捷
举报 使用道具
10#
微舆情 高级会员 发表于 2020-2-2 14:25:36 | 只看该作者
Fuller 发表于 2020-2-2 12:05
文件有多大?如果文件很大,建议加入到集搜客qq群(集搜客6群是:645638422 ),在qq群里分享和讨论更便 ...

已经由集搜客技术人员分享到了Q群: 645638422
文件名:京东商品评论采集结果_规则_1_列表_20200202103854073.xlsx

举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-27 13:35