222 107499

集搜客文本分词标注工具(V1版)

ym 于 2016-11-15 10:55 发表 [复制链接]
Fuller 管理员 发表于 2019-6-19 20:36:41 | 显示全部楼层

停止词应该分词器负责的,目前集搜客分词工具还没有实现。

如果您想设置排除词,这个跟停止词不一样,你可以跟其他词一样勾选排除词,等导出excel以后,在excel中排除词单独统计
举报 使用道具
morningair 新手上路 发表于 2019-8-7 10:46:02 | 显示全部楼层
不能导入词汇本体,按词汇本体分词吗
举报 使用道具
Fuller 管理员 发表于 2019-8-7 10:54:13 | 显示全部楼层
morningair 发表于 2019-8-7 10:46
不能导入词汇本体,按词汇本体分词吗

您说的本体是ontology中的本体吗?

往这个分词工具中一般是导入这类文字:
1,文章
2,用户评论
等,都是自然语言的话语,这个工具主要是执行分词任务,把句子切成词,然后统计哪些词出现的更多
举报 使用道具
Fuller 管理员 发表于 2019-8-7 11:25:27 | 显示全部楼层
添加词语20190807112236.png

可以这样操作
1,创建任务,导入要分词的文本,比如,一行行评论信息
2,如果有一张情感词表存在excel中,可以在excel中选中所有单元格,拷贝-粘贴,就能把所有情感词拷贝到这里。(选词结果页面上的添加词语按钮)
3,等待一会,需要一点时间让系统做自动匹配

然后就可能导出匹配结果了
举报 使用道具
xinyi1230 新手上路 发表于 2019-8-13 10:10:43 | 显示全部楼层
可以实现词语之间的依存语法分析吗
举报 使用道具
Fuller 管理员 发表于 2019-8-13 11:49:21 | 显示全部楼层
xinyi1230 发表于 2019-8-13 10:10
可以实现词语之间的依存语法分析吗

想达到什么目标?

以前版本我们有一个标注已存关系的,用来把一个情感词跟一个特征词绑定,这个版本去掉这个功能了。您想要什么功能?我们可以在未来版本中考虑添加
举报 使用道具
kelly1234_ 新手上路 发表于 2019-8-14 05:38:31 | 显示全部楼层
为社么我没有频次
举报 使用道具
Fuller 管理员 发表于 2019-8-14 08:55:52 | 显示全部楼层
kelly1234_ 发表于 2019-8-14 05:38
为社么我没有频次

你是说导出的结果中没有频次?导出来好几张表,有张表里面就有频次
举报 使用道具
wang1121 新手上路 发表于 2019-11-20 16:59:14 | 显示全部楼层
情感类的词语,想着要是能大概归总一下,还是不错滴
举报 使用道具
Fuller 管理员 发表于 2019-11-20 17:21:19 | 显示全部楼层
wang1121 发表于 2019-11-20 16:59
情感类的词语,想着要是能大概归总一下,还是不错滴

很快我们会发布一个版本,增加了情感分类的功能,里面含有我们预先整理好的情感词库。
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-3-29 05:08