中国知网论文反作弊系统研究

清华同方知网是我馆的中文期刊网,其数据库和检索系统均为业界领先。逃避很难,但也不是不可能。简单介绍一下工作原理和逃生方法。

整个系统建立在知识库数据库管理系统和stm中文智能信息处理系统的基础上。在此基础上,开发了相应的tpi数据库建设和管理系统等产品。kbase数据库具有强大的高效准确检索功能,检索速度可达1tb。而且具有强大的关系数据库检索网关,可以整合各种异构数据库和stm中文智能信息处理平台,可以自动挖掘、分类、聚类文本。此外,它还有大量的文件。

简单来说,首先,如果你复制一篇文章,无论你复制到哪里,都会被发现,你就死定了,因为你最多会在网上下载论文期刊,或者在网上通过搜索引擎搜索,而这些信息来源都在同方的数据库里,根本逃不掉,他的检索速度在百万文档的毫秒量级。想想看,查找一篇文章有多容易。

第二,智能中文信息处理系统,如果你说我改一篇文章,我加词,减词,把主动句改成被动句,把句子改成被动句,对不起,还是不行,因为这个检索系统会抓取你整句的主语、谓语、宾语,然后马上根据概念关系的词库,比如赞同=同意等,把它算作疑案。,然后是你的主语、谓语等。

可能你会说现在文章太多了,他还是检索不到。那我给你举个例子。你的题目是:关于政府福利制度,他会把每一个相似的词统计为一个题目,搜索相关文章。或者你可以说我的话题变了,答案还是不行,因为你的文章出现频率最高的那个词还是会算作话题,然后根据相似度。而且这个系统最致命的是,它会计算每一个相似度,最后汇总报告。如果我和某篇文章20%相似,另一篇20%相似,还有一篇11%,对不起你还是属于抄袭。

那么,我是在胡说八道吗?有什么办法不打你就能逃脱?答案是肯定的,但是方法还是很残忍。

三种方法说起来简单,做起来难。

第一,可以复制纸库的非中文部分,比如公式和图标,可以复制。

第二种,比较变态的方法,你去找个外文文献自己翻译,翻译出来的论文就是你的论文,因为他们对非中文没有技术支持。

第三,找一百篇文章,就要抄袭一百篇。他不会把你算作抄袭,这和写论文一样痛苦。

我没想到别的。并不令人震惊。我亲眼目睹了整个过程。希望对大家有帮助。如果你有任何问题,请发邮件给我。