Fuller 管理员 发表于 2022-1-8 22:43:53 | 显示全部楼层
18229165646 发表于 2022-1-8 19:38
同义词怎么放进云词图里啊

点击“同义词合并”按钮,进入到同义词合并界面,在那里输入同义词,在那个界面也有共词匹配和词云图按钮
举报 使用道具
dengxinyu 新手上路 发表于 2022-1-10 22:39:31 | 显示全部楼层
请问一下,分词可以添加自定义词汇吗?譬如“女拳”一词
举报 使用道具
Fuller 管理员 发表于 2022-1-10 23:16:34 | 显示全部楼层
dengxinyu 发表于 2022-1-10 22:39
请问一下,分词可以添加自定义词汇吗?譬如“女拳”一词

有个“加词”按钮,可以添加自定义词,那么就可以导出自定义词的词频表
举报 使用道具
ZNMZDX520 初级会员 发表于 2022-1-11 01:33:40 | 显示全部楼层
请问,如果我是想知道分出的这些词分别出现在多少个正文(单元格)中,而不是简单的词频汇总,分词工具有这个功能吗?
举报 使用道具
Fuller 管理员 发表于 2022-1-11 07:53:58 | 显示全部楼层
ZNMZDX520 发表于 2022-1-11 01:33
请问,如果我是想知道分出的这些词分别出现在多少个正文(单元格)中,而不是简单的词频汇总,分词工具有这 ...

最简单的方法是在excel中统计。如果要利用分词工具实现这个目的,可以导出共词矩阵,对角线上的数字就是出现在多少个正文。不过,共词矩阵大小有限制,不能所有的分出来的词
举报 使用道具
wjh0088 新手上路 发表于 2022-2-24 14:04:40 | 显示全部楼层
请问抽取关键词用的是什么算法呀
举报 使用道具
Fuller 管理员 发表于 2022-2-24 15:26:28 | 显示全部楼层
wjh0088 发表于 2022-2-24 14:04
请问抽取关键词用的是什么算法呀

是集搜客自己开发的关键词抽取算法,是在TF-IDF基础上做了一些优化。可以称为基于 TF-IDF的集搜客自有关键词抽取算法。

如果你想对比其他算法,可以看这里的notebook案例,tf-idf,text rank,pmi这些都可以用作关键词提取:https://www.gooseeker.com/doc/thread-18414-2-1.html
举报 使用道具
sunnylamm 新手上路 发表于 2022-3-30 21:18:59 | 显示全部楼层
请问怎么把多个文件的结果分开展示?
举报 使用道具
Fuller 管理员 发表于 2022-3-30 22:53:52 | 显示全部楼层
sunnylamm 发表于 2022-3-30 21:18
请问怎么把多个文件的结果分开展示?

要分开分词?还是分开情感分析?还是要分开统计词云?

一般需要建立不同的分词任务
举报 使用道具
sunnylamm 新手上路 发表于 2022-4-1 10:16:04 | 显示全部楼层
Fuller 发表于 2022-3-30 22:53
要分开分词?还是分开情感分析?还是要分开统计词云?

一般需要建立不同的分词任务

:多个不同年份的文件,结果可不可以分开展示
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • 利用AI阅读和分析文本:扣子COZE记录用户反
  • 在网页片段内直观标注——以B站评论采集为
  • 利用AI阅读和分析文本:使用COZE建设游记文
  • 使用AI工具Kimi生成python代码为文本分析结
  • 苹果mac电脑安装集搜客网络爬虫软件失败的

热门用户

GMT+8, 2024-10-5 13:37