标题:分析了30万条微博评论,看毕业生与翟天临的爱恨情仇
原文链接:https://mp.weixin.qq.com/s/DnMTS-yti6U4GWFMM2hSbw
摘要:本文基于翟天临2月道歉微博下的30万余条评论进行了分析





举报 使用道具
| 回复

共 5 个关于本帖的回复 最后回复于 2020-7-30 09:35

沙发
内容分析应用 金牌会员 发表于 2020-7-28 08:52:57 | 只看该作者
最近热点很多,采集微博评论等微博信息用来做各种分析的好像特别多。
举报 使用道具
板凳
Fuller 管理员 发表于 2020-7-29 17:14:55 | 只看该作者
这个文章里面说毕业论文查重越来越严,为了应对,有些技巧挺有意思的:“这届毕业生的扩句,倒装、同义词替换、句型转换等能力都得到了显著提升”
举报 使用道具
地板
Fuller 管理员 发表于 2020-7-29 17:20:30 | 只看该作者
难道每年毕业季,毕业生都会来喷一通?难道翟某变成了每年毕业生发泄怒火的对象?

原文说:
  1. 3月2日到5月26日,随着查重标准的发布,开题、初稿等任务的进行,开始陆陆续续有学生来到他的微博下发泄怒火。

  2. 5月27日,随着“翟天临”热搜词条的出现和毕业论文压力的增加,学生们都想起了这个“罪魁祸首”,从那天起,翟天临微博评论迎来新一轮的激增。
复制代码

为不能抄论文而恼羞成怒
举报 使用道具
5#
内容分析应用 金牌会员 发表于 2020-7-30 09:16:25 | 只看该作者
据说那些查重软件, 也有不少bug,有些不是抄袭的通用词,也会判断为有问题, 比如这个词“深圳交通”, 在有的查重系统就会误报
举报 使用道具
6#
Fuller 管理员 发表于 2020-7-30 09:35:24 | 只看该作者
内容分析应用 发表于 2020-7-30 09:16
据说那些查重软件, 也有不少bug,有些不是抄袭的通用词,也会判断为有问题, 比如这个词“深圳交通”, 在 ...

要是毕业设计是某个传统话题,岂不就不好了,如果一个研究课题要研究很多年,后面的论文越来越难提交了。

好奇怪为什么会查重失误,比如Shingling算法,是相当精准的,难道现在的查重软件只是统计词频?不统计上下文和句子?
举报 使用道具
您需要登录后才可以回帖 登录 | 立即注册

精彩推荐

  • Gephi社会网络分析-马蜂窝游记文本分词并同
  • Gephi社会网络分析-基于马蜂窝游记文本以词
  • 知乎话题文本根据词语间距筛选后生成共词矩
  • 马蜂窝游记文本分词后以词语间距为筛选条件
  • 学习使用apriori算法挖掘关联关系

热门用户

GMT+8, 2024-4-23 18:38