论文重复率是怎么计算的?

文章重复性的高低是判断其是否存在剽窃的一个重要指标。所有的毕业论文,都会有重复率的要求,达到了这个标准,就可以算是合格的论文了。那么,如何计算论文的重复性呢?

文章重复率=论文重复数/总字数*100%,该公式用于计算文献重复次数。请注意,这是一个简单的公式,而不是一个算法!所以,内容的重复性,就是由查重系统按照算法,与数据库中的内容进行比对来确定的。本科毕业论文重复率通常低于30%,严格控制20%。毕业论文的要求也不超过10%。一般来说,高品质的毕业论文重复率不超过15%;研究生和博士学位分别为10%和5%。

那么,论文查重系统是怎样计算出重复次数的?不同的系统,其算法也不尽相同。

论文查重系统设定了10%的阈值,该阈值由段落(或章节)中的字数来确定。5%以下的单篇文献剽窃或引言不能被检出,通常在从句和大段中使用。

举例来说,若所测的段落 A中有100个词,而与文件 A重复的5%,则无法被检测。若与 B文档重复超过50个单词,则在第1章中发送的 B文档中的剽窃部分将以红色字体标明。不论其在第1章中处于什么位置,即便被截断为一句话,当出现13个以上的词语时,仍然会被标示出来。

由于论文的第一章有5000个词,因此,在第1章中,仅可参考500字以下的 A文件,否则将被视为剽窃。第2章4000字,因此,您只能参考200字以下的 A文件,否则将会被系统视为剽窃。

编辑提醒大家,要想避免重复率过高:在参考文献时,请尽量避免在同一篇文章中引用较长的段落。引用的文献多了,就不能称之为引用,很容易被认为是剽窃。这主要是因为论文查重的门槛问题,在其它文献重复率超过5%的情况下,还存在重复次数的问题。即,当引用与剽窃的门槛达到5%时,视为剽窃。