中国知网论文反作弊系统研究

清华同方知网是我馆的中文期刊网，其数据库和检索系统均为业界领先。逃避很难，但也不是不可能。简单介绍一下工作原理和逃生方法。

整个系统建立在知识库数据库管理系统和stm中文智能信息处理系统的基础上。在此基础上，开发了相应的tpi数据库建设和管理系统等产品。kbase数据库具有强大的高效准确检索功能，检索速度可达1tb。而且具有强大的关系数据库检索网关，可以整合各种异构数据库和stm中文智能信息处理平台，可以自动挖掘、分类、聚类文本。此外，它还有大量的文件。

简单来说，首先，如果你复制一篇文章，无论你复制到哪里，都会被发现，你就死定了，因为你最多会在网上下载论文期刊，或者在网上通过搜索引擎搜索，而这些信息来源都在同方的数据库里，根本逃不掉，他的检索速度在百万文档的毫秒量级。想想看，查找一篇文章有多容易。

第二，智能中文信息处理系统，如果你说我改一篇文章，我加词，减词，把主动句改成被动句，把句子改成被动句，对不起，还是不行，因为这个检索系统会抓取你整句的主语、谓语、宾语，然后马上根据概念关系的词库，比如赞同=同意等，把它算作疑案。，然后是你的主语、谓语等。

可能你会说现在文章太多了，他还是检索不到。那我给你举个例子。你的题目是:关于政府福利制度，他会把每一个相似的词统计为一个题目，搜索相关文章。或者你可以说我的话题变了，答案还是不行，因为你的文章出现频率最高的那个词还是会算作话题，然后根据相似度。而且这个系统最致命的是，它会计算每一个相似度，最后汇总报告。如果我和某篇文章20%相似，另一篇20%相似，还有一篇11%，对不起你还是属于抄袭。

那么，我是在胡说八道吗？有什么办法不打你就能逃脱？答案是肯定的，但是方法还是很残忍。

三种方法说起来简单，做起来难。

第一，可以复制纸库的非中文部分，比如公式和图标，可以复制。

第二种，比较变态的方法，你去找个外文文献自己翻译，翻译出来的论文就是你的论文，因为他们对非中文没有技术支持。

第三，找一百篇文章，就要抄袭一百篇。他不会把你算作抄袭，这和写论文一样痛苦。

我没想到别的。并不令人震惊。我亲眼目睹了整个过程。希望对大家有帮助。如果你有任何问题，请发邮件给我。