知网和paperpass已经看到了很大的差距。我该怎么办?
知网的最终版本是指:
特别版:PMLC知网,包括大学生论文联合比对数据库。
硕博:知网VIP5.2系统,包含学术论文联合比对数据库。
如果测知网的最终版本,可以改也可以不改。有两种情况:
1,你自己多写点。
2.你抄了很多,但是知网没有测。
如果是第一种情况,没必要改。直接交给学校。
如果是第二种情况,建议再改一次。因为我们不仅要经过学校检查体重!还要通过导师和盲评组的肉眼!及时知道网络未测,凭借导师和盲评团队的多年经验,一眼就能看出抄袭的内容。
那为什么PP和知网差距这么大?
这是因为:PP和知网的数据库和算法不一样!
但是很难说到底谁高谁低~
看一个例子:pp19%以内,知网86%。
PP和知网的数据库和算法不一样,所以判断的重复内容和相似度不一定一样。
你不相信吗?嗯,铁证如山!
(上半部分为知网检测结果,下半部分为paperpass检测结果)
上面红框中的句子
“社会责任感作为个人道德品质的核心,与个人价值观高度统一,要求个人将自我发展与社会发展有机结合,协调发展,在服务和贡献社会的过程中实现自我价值,追求和实现生活的幸福。”
在知网检测系统中,不重复。
在paperpass中,被判定为“略有相似”。
出于复核的目的,知网没有进行测算,所以其实这段话可以不做改动。好吧,如果是你自己写的,好吧,就算了。但如果确实是抄袭的,还是老实改吧。导师和盲评组的眼睛还是很锐利的。
再看另一个例子:
大学生的自我责任感包括“自我生存和自我发展的意识,具体指珍惜自己的生命,关心自己的身心健康,丰富自己的精神生活,有明确的目标和人生追求;好好学习,提高自身修养,积极追求有价值的人生;对自己的言行负责并履行自己的义务,提高自己的人生境界。”?[1]
请注意,这是一个报价。知网也正常运行,判定为重复引用。但是在paperpass里,这个完整的引文里有三种判断!
不重复(绿色):大学生的自我责任感包括;关心自己的身心健康,丰富自己的精神生活,有明确的目标和人生追求;好好学习,提高自身修养,积极追求有价值的人生。
略有相似(橙色):对自己的言行负责并履行自己的义务,提升自己的人生境界等。
重度相似(红色):对自我生存和自我发展的责任感,具体来说就是珍惜自己的生命。
我很想问问正在看paperpass的哥哥程。你的测试原理是什么?这么随意,这么随意?
是时候理论联系实际了(凳子挪过了吗?)
1,数据库差别很大。
从上表可以看出,知网的数据库无疑更加完整和详细。
独一无二的硕士博士学位论文学术论文联合比对数据库,几乎包含了最近一次更新(也可以理解为半年前)之前考过的所有硕士博士学位论文;
独一无二的大学生论文联合比对数据库,几乎囊括了之前所有参与测试的论文(也可以理解为1年前)。
注:我参加了测试。不管是不是提交给学校的最终版本,只要经过测试,都会被收录。
Paperpass只有五个数据库。
当然,我们不能从数据库的数量来判断谁的数据库数据更大。
但从实践经验来看,知网更具学术性,因此成为国内90%以上高校的合作查重系统,而PP本身就是一个商业产品。PP无法获取高质量、大数量的学术内容和数据,只能从互联网资源中丰富自己的数据库。
知网和PP数据库不一样,即使算法是一致的。测试结果也不一样。
而且他们的算法也不一样。
2.不同的算法
相对来说,PP检测的原理更为严格(从经验上讲)。
在paperpass中,如果相似度大于40%,则判定为重复,这就是需要修改的内容。
40%相似度是什么概念?看看这个例子:
这句话判断略有相似。但是,同一句话分成两部分,两部分的相似度是不一样的:(这个真的很奇怪)
前半句相似度45%,后半句相似度53%。且相似来源不同。
PP的检测原理真的是个谜……但是显然有“核心关键词”是相似的。但是,如上所述,“社会责任”这个词可以换成其他词吗?好像不是!
我们来看看PP中的严重雷同:
71%是怎么来的?这里是不是堆积了太多关键词?无解。欢迎有答案的同学评论留言~
知网的算法就清晰多了。不是抄袭就是反复引用。
怎么算抄袭?13连续出现相同或相似的单词会用红色标注,算抄袭。
相同的:
相似:(这说明删除抄袭内容或者简单的在抄袭内容中间加其他词好像是把这13连续的相似词分开了,是无效的!)
但是知网的引用,em…只能说大部分情况是正常的,就是有脚注或者引用的都算重复引用。在知网报告中标记为绿色。
那我们再回到正题。paperpass到底能不能作为查重减肥的参考?
如果你自己写的多,做好PP测试结果高于知网的准备。
如果抄多了,做好PP测试成绩比知网低的准备。
好在PP有一个人性化的功能:添加自建库。测试PP的时候,把你借的所有论文作为自建数据库上传到PP后台,提交修改。自建库99%以上的内容会重复,剩下的就靠PP的自由发挥了。
最后根据测试结果来修改,基本问题不大!
但由于PP算法异常,对关键词和技术术语不友好,不建议追求太低的PP重复率,差不多会在20%以内。
目前PP是34%,建议再换一个!
~~~~~~?(^_-)?(^_-)?(^_-)~~~~~~
完毕!听说被赞的朋友最后一篇论文都过了!Hihia ~什么?什么~
(原始发布地址:网络链接)