查重的符合率和原理是什么?有多少连续的单词是重合的?

原理是对比数据库中的单词;连续十三个字重合。

整篇论文上传后,系统会根据文章生成的目录自动检测论文的章节信息,然后系统会对论文进行章节检测,这样就可以得到每篇单章的复制比例,目录灰显,不参与正文检测;否则会按照10000个左右的字符自动分割检测。同时,该目录可能被检测为文本,如果重复,它将被标记为红色。

中国知网给这个查重系统的灵敏度设定了一个阈值,就是5%。段落方面,无法检测到5%以下的抄袭或引用,常见于大段的小句或小概念。例如,如果检测段落1具有10000个单词,则小于500个单词的单个文档将不会被检测到。

网上论文检测的条件是13连续出现相似或抄袭的单词会被标为红色,但必须满足3中的前提条件:即你引用或抄袭的一篇文献的总字数和每个检测段落的字数必须达到5%以上才能被检测为红色。

网络检测系统会自动识别引用,引用不参与文本检测。另外剔除,知网测试报告中的参考文献显示灰色字体,表示未参与测试。当然,如果参考文献的格式完全正确和规范,这将被自动排除。否则,引用将被检测为文本,这将导致所有引用被标记为红色。成绩更高!