快捷导航
本帖最后由 ym 于 2019-9-23 10:32 编辑

分词和分类检索平台是用于文本分词处理、数据主题分析、数据挖掘分析的文本处理工具,是第三版的分词应用。下面汇总了一些使用攻略,希望大家能运用好这个工具,去发现更多的数据价值。


1、使用手册
《分词和分类检索平台使用手册》

2、数据分析案例
《关于鸿蒙操作系统的知乎讨论热点分析
《抓取头号玩家电影的微博评论数据做口碑分析》
《挖掘淘宝爆款商品名称中的关键词》
《利用GooSeeker分词、Ucient和NetDraw进行社会网络分析》
《爬取豆瓣电影短评做中文分词与数据分析》


举报 使用道具
| 回复

共 3 个关于本帖的回复 最后回复于 前天 11:11

ym 版主 发表于 2019-9-23 10:24:29 | 显示全部楼层
分词应用的历史版本介绍

举报 使用道具
elvisll 新手上路 发表于 前天 10:42 | 显示全部楼层
想请教下 这个分词工具用的是什么算法呢?
举报 使用道具
Fuller 管理员 发表于 前天 11:11 | 显示全部楼层
elvisll 发表于 2019-11-20 10:42
想请教下 这个分词工具用的是什么算法呢?

这个分词工具发展了很多版本了,每次都会增加更多的NLP处理算法。1,分词方面,这个平台目前使用中科院的分词器,更多分词器参看:《中文分词工具汇总》

2,词性标注:使用了HANLP的开源版本
3,其他处理功能是GooSeeker自己开发的
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 网络爬虫占满了c盘怎么清理
  • 为什么采集速卖通用户评论翻页不了
  • 多级规则执行连续动作而输入动作不在第一级
  • 特征工程入门介绍
  • NLP文本情感分析入门

热门用户

GMT+8, 2019-11-22 13:51