知网查重原理

 我来答

1个回答

小高聊数码
2023-05-24 · TA获得超过386个赞

知道小有建树答主

回答量：8417

采纳率：100%

帮助的人：111万

关注

展开全部

论文查重的原理是连续出现13个字符类似就判断为重复部分，并将重复的内容计算到论文的重复率之中。

论文上传完以后，系统会根据上传的文字生成目录，自动检测出论文章节信息，以“章”来进行分段检测。封面、摘要、研究目的、第一章等都会单独进行查重，每段都会有一个重复率，如果连续13个字类似，就会被标记为红色，那么这个段落是严重重复的，系统会自动计算这部分的重复率。

在查重完毕之后，查重系统会将重复率、引用率、总字数等论文指标都自动标注在论文查重报告单中，这一整个过程就是论文查重的原理。论文查重系统会先对内容进行分层处理，按照篇章、段落、句子等层级分别创建指纹，对每一部分内容单独计算其重复率等各项指标。

查重系统的特点

当知网论文查重系统发现你论文中有一句话有抄袭嫌疑，然后系统会自动对这句话的前后进行模糊识别，这个算法是非常严格的，仅仅通过加一些副词也是能够被检测出来，只有自己重新修改重复内容，或者大量修改重复部分，这时候才不会被检测出重复。

知网系统将灵敏度的阈值设定在5%，用段落来计算。比如在5000字被检测的大段落里，引用的一片文献内容少于250字，如此便不会被判定为重复。所以，同学们后续论文降重的时候，最好不用重复引用一篇文献，可以应用几篇文献，每篇的内容只选择积聚，那么就能不被检测到。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容