论文改了又改,重复率反而更高?多半是这3个原因在作怪
同一篇论文拿去查重,有时候会得出不同的结果,其实挺正常的。主要是因为查重系统本身就有很多不同的版本,而且每个版本背后的数据库也不完全一样,所以测出来结果有差异并不奇怪。这也是为什么我们一直提醒大家,自己提前查的时候,尽量选和学校一样的系统、一样的版本。
大部分同学很难一次就过,所以一般都会查好几次。那为什么同一篇论文两次查重结果会不一样呢?有时候问客服,他们也未必能说得清楚。下面,小编就以PaperEE查重系统为例,来跟大家详细聊聊这背后的几个原因。
1. 你检测的内容有变动
很多同学在PaperEE上查完之后,发现重复率有点高,就会去修改,然后再查。但你可能没注意到,哪怕只是改了一小部分内容,系统重新解析论文时,章节划分可能会变,重复计算的范围也可能不同,结果自然就会有出入。说白了,查重系统看你的论文,不是一个字一个字孤立去对的,它会把文章切成一个个“小片段”来对比。你前面增增减减几个字,就好像推倒了一块多米诺骨牌,系统对整个文章结构的划分可能就跟着变了。比如你本来第三章里有一句是重复的,你把它改掉了,系统可能就会认为你第三章的边界发生了变化,转而用新的方式去计算其他章节的重复,这样一来,之前没标红的地方,第二次说不定就红了,反之亦然。所以啊,有时候真不是系统出错了,而是你动过的文章在系统眼里已经成了“另一篇”结构稍有不同的文章了。
2. 系统数据库一直在更新
论文查重系统里的数据是联网更新的,今天的数据和昨天的可能就不一样。数据库一变,查重的结果当然也可能跟着变。这就好比你上周搜一个冷门概念,网上可能就那么几篇文章提到,但过了几天,突然有新的博客或论文发表了,也讨论了这个概念。系统把这篇新文章收进数据库后,你再查,你论文里那句话可能就因为跟新文章撞车而被判为重复。这个尤其是对于经常引用的最新研究数据或热点话题来说,特别明显。
3. 查重算法也会升级
为了更贴近大家的写作习惯和学术规范,论文查重系统会不定期更新算法。每次算法一升级,哪怕内容完全一样,测出来的结果也可能有细微差别。比如,早期的系统可能对连续7个字相同就标红,但现在大家写作都精了,会刻意避开这种“字面重复”,所以系统也在进化。它可能会变得更智能,开始关注“语义重复”,也就是意思一样但换了个说法的情况;或者它调整了对引用格式的识别灵敏度,以前可能不判重的短引用,现在也给算进去了。这些算法上的小修小补,目的都是为了更精准地识别真正的抄袭,但客观上就会造成同一篇文章在不同时间点检测,结果有细微的波动。 不过这种差异通常不会太大,一般不会影响你最后的通过。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.