标题:分析了30万条微博评论,看毕业生与翟天临的爱恨情仇
原文链接:https://mp.weixin.qq.com/s/DnMTS-yti6U4GWFMM2hSbw
摘要:本文基于翟天临2月道歉微博下的30万余条评论进行了分析





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2020-7-30 09:35

沙发
内容分析应用 金牌会员 发表于 2020-7-28 08:52:57 | 只看该作者
最近热点很多,采集微博评论等微博信息用来做各种分析的好像特别多。
举报 使用道具
板凳
Fuller 管理员 发表于 2020-7-29 17:14:55 | 只看该作者
这个文章里面说毕业论文查重越来越严,为了应对,有些技巧挺有意思的:“这届毕业生的扩句,倒装、同义词替换、句型转换等能力都得到了显著提升”
举报 使用道具
地板
Fuller 管理员 发表于 2020-7-29 17:20:30 | 只看该作者
难道每年毕业季,毕业生都会来喷一通?难道翟某变成了每年毕业生发泄怒火的对象?

原文说:
  1. 3月2日到5月26日,随着查重标准的发布,开题、初稿等任务的进行,开始陆陆续续有学生来到他的微博下发泄怒火。

  2. 5月27日,随着“翟天临”热搜词条的出现和毕业论文压力的增加,学生们都想起了这个“罪魁祸首”,从那天起,翟天临微博评论迎来新一轮的激增。
复制代码

为不能抄论文而恼羞成怒
举报 使用道具
5#
内容分析应用 金牌会员 发表于 2020-7-30 09:16:25 | 只看该作者
据说那些查重软件, 也有不少bug,有些不是抄袭的通用词,也会判断为有问题, 比如这个词“深圳交通”, 在有的查重系统就会误报
举报 使用道具
6#
Fuller 管理员 发表于 2020-7-30 09:35:24 | 只看该作者
内容分析应用 发表于 2020-7-30 09:16
据说那些查重软件, 也有不少bug,有些不是抄袭的通用词,也会判断为有问题, 比如这个词“深圳交通”, 在 ...

要是毕业设计是某个传统话题,岂不就不好了,如果一个研究课题要研究很多年,后面的论文越来越难提交了。

好奇怪为什么会查重失误,比如Shingling算法,是相当精准的,难道现在的查重软件只是统计词频?不统计上下文和句子?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • LDA主题分析模型到底是什么?
  • top2vec话题发现原理和使用方法
  • 将文本聚类和LDA分析模块安装在数据盘上的
  • GooSeeker分词软件的tf-idf算法和特征词选
  • 边表格式和矩阵格式的共词矩阵表有什么区别

热门用户

GMT+8, 2026-4-9 01:40