在撰写学术论文时,公式、定理和方程式是表达研究成果的重要组成部分。许多作者在提交论文前进行查重检测时,都会产生一个疑问:论文查重系统是否会将公式纳入检测范围?这个问题直接关系到重复率的计算结果和论文的学术规范性。
主流查重系统如何处理公式
目前主流的论文查重系统(如知网、万方、维普、Turnitin等)主要采用文本比对技术。这些系统的核心算法是基于字符匹配和语义分析,因此对纯文本内容的检测非常精准。然而,对于数学公式、化学方程式等特殊内容,处理方式有所不同。
公式呈现形式与查重结果
1. 图像格式的公式
如果论文中的公式是作为图片插入的(如PNG、JPG格式),大多数查重系统无法识别图片中的内容,因此这类公式通常不会被计入查重范围。系统会跳过图片区域,仅对周围的文本进行比对。
2. 使用公式编辑器插入的公式
使用MathType、LaTeX或Word自带的公式编辑器插入的公式,在文档中以特殊对象或可编辑字段存在。部分先进的查重系统(如Turnitin)具备识别LaTeX代码或公式结构的能力,可能会将公式部分纳入检测范围,尤其是当公式结构完全相同时。
3. 纯文本表示的公式
如果公式以纯文本形式书写(如 E=mc^2),则会被查重系统当作普通文本处理,完全纳入查重范围。
公式查重的实际影响
即使查重系统能够识别某些公式,其在总重复率中的权重通常较低。学术界普遍认为,科学公式、定理(如牛顿第二定律 F=ma、质能方程 E=mc²)属于公共知识,合理引用不会被视为抄袭。但是,如果大段公式推导过程与他人论文高度相似,则可能被标记为潜在问题。
结论
综合来看,论文查重系统对公式的处理较为复杂:图像公式通常不查,编辑器公式可能部分检测,纯文本公式则完全检测。但从学术规范角度,作者不应依赖“公式不查重”来规避问题。正确引用、规范书写、保持原创性才是学术写作的根本原则。
示例:LaTeX格式的公式可能被识别为:
\int_{-\infty}^{\infty} e^{-x^2} dx = \sqrt{\pi}