登录/注册

知网查重检测系统算法是什么

作者:学术家 时间: 2019-08-08

简述:


知网查重检测系统的算法是较为先进的模糊算法,文章中有超过三处13个字与他人文献内容相似的地方就会被知网作为抄袭部分处理。知网查重是可以自动识别论文中的参考文献,引用部分的内容的,只要不超过知网查重的文献复制比的阀值就可以了。

正文:


不管是学校还是杂志社,或者其他机构单位。其要求的毕业论文或者是职称审评论文的查重都是用知网查重检测系统进行的,几乎所有的高校都用知网查重检测论文,知网查重检测系统算法是什么呢?

知网查重检测系统算法是什么

对于知网查重检测系统算法是什么这一问题,我们首先要对知网有一定的了解,中国知网凭借庞大数据库,先进的抄袭率算法。先后推出中国知网大学生论文管理系统PMLC;),知网硕博学术不端检测系统VIP5.1/TMLC2;知网科研诚信管理系统AMLC/SMLC等知网查重系统。深得高校,科研机构信赖,但不同的知网查重系统所使用的对比数据库是不一样的,但知网的查重算法规则是相同的。

知网查重采用的是最先进的模糊算法,如果文章中有超过三处,13个字与他人文献内容相似的地方就会被知网作为抄袭部分处理。知网查重是可以自动识别论文中的参考文献,引用部分的内容的,只要不超过知网查重的文献复制比的阀值就可以了。

国知网对其检测系统的灵敏度设置了一个阀值,该阀值为3%,以段落(或章节)的字数来计算,单篇文献低于3%的抄袭或引用是检测不出来的,这种情况常见于大段文字中的小句或者小概念。

此外知网查重检测系统对于论文的格式,一定要按照学校的要求去上传,部分学校要求上传格式是PDF或Word格式,其实学生要知道PDF要比Word多了一个文本转换格式,在这个过程中PDF文本转换可能是会出现乱码,是会影响检测报告结果。