资源介绍

天据英眼 - 分词打标软件新版

  • 导入文本数据,系统自动分词不用安装软件,直接在界面里导入文本数据,就会自动分词,得到词语列表和分词效果表;
  • 筛选词语,系统自动匹配原文本把词语列表按照词频大小排序,点击词语可以查看样本数据,筛选出有用的词,系统会自动把词语与原文本进行匹配,得到选词结果表和打标结果表;
  • 下载数据结果表完成前面两步后,就可以同时下载到选词结果表、打标结果表、分词效果表三张数据表。
操作说明
1. 登录进入系统,点击“导入数据”开始创建任务。点击进入任务,在“原数据”页面可以看到导入状态,如果数据量很大,自动分词需要一些时间


2. 筛选词语,把与研究目的相关的词勾上,点击“确定”,这一屏的词就消失了。勾上的是要的,没有勾上的词就是不要的。直到所有词都从这个页面上消失了,就表示选完了所有词。点击词语可以查看样本数据。在点击“确定”的时候,软件会用勾上的词匹配每条文本,形成一个矩阵,含有某个词,对应的矩阵单元的值就是1


3. 如果想要补充词语,可以人工添加进去,提交添加的时候,软件也会用添加的词去匹配每条文本。


4. 最后下载数据,一次性下载3张表:选词结果、打标结果(标签矩阵)、分词效果;


应用举例
一条条文本变成对应于每个特征词的矩阵,就能用量化计算对文本内容进行分析。例如,对消费者对手机使用体验的评论信息进行分词打标,得到这样一个矩阵


针对这样的数据表,通过统计运算和数据挖掘运算,可以得出很多量化的结论。


[]

用户评论

评分:

V8.9 版权所有 © 2007-2016 GooSeeker 深圳市天据电子商务有限公司
粤ICP备11065265号-2 粤公网安备 44030502000239号