很多人写论文的时候会遇到查重问题。查重是检查文章和其他文章相似程度的一种方式。学校、期刊、出版社都会用查重系统。查重系统有很多种,中国知网、万方、维普是比较常见的。这些系统会把你的文章和数据库里的文章做对比。数据库里有大量的论文、书籍、报纸、网页内容。对比之后系统会出一个报告。报告里会显示重复的比例,就是查重率。查重率太高就会有问题。查重率太高可能意味着抄袭。抄袭是学术不端行为,后果很严重。学生可能无法毕业,老师可能失去职称,研究人员可能声誉受损。所以大家都很重视查重。
查重是怎么工作的呢?查重系统有复杂的算法。它会将文章分成小段,或者分成连续的几个字。这些字串叫做“指纹”。系统会计算这些指纹的特征。然后去数据库里搜索相似的特征。如果找到了相似的特征,就说明这部分内容可能重复了。系统会用颜色标记重复的部分。通常红色表示高度重复,黄色表示轻度重复,绿色表示没有重复。报告里会列出重复的来源。你可以看到自己的文章和哪篇文章重复了。这可以帮助你修改。
为什么论文会重复呢?原因有很多。有的同学故意抄袭,这是不对的。有的同学是无意的。论文需要引用别人的观点。引用必须注明出处。如果不注明,系统就会认为是抄袭。有的内容是常识,比如“地球是圆的”。这种话在很多文章里都有。查重系统也可能标为重复。这叫做“误标”。论文里必须有一些固定的格式。比如论文题目、学校名称、目录、参考文献。这些部分也可能被标红。通常查重的时候可以去掉这些部分。有的查重系统允许排除参考文献,排除致谢部分。这样可以更准确地看到正文的重复率。
降低查重率是很多学生关心的事。办法不是继续抄袭,而是认真修改。理解原文的意思,然后用自己的话重新写一遍。这叫“复述”。复述不能只改几个字。比如把“因为”改成“由于”,把“所以”改成“因此”,这样不行。查重系统很聪明,它能识别这种简单的替换。你需要改变句子结构,调整语序,更换表达方式。比如原文说“经济增长促进了消费”,你可以改成“消费水平的提升得益于经济的增长”。意思差不多,但说法不一样。这需要真正理解内容。另一种方法是增加自己的分析。在引用别人观点之后,加上自己的评论。自己的评论一般是独特的,不会重复。还可以多找一些资料。综合不同资料的观点,形成自己的叙述。这样内容更丰富,重复的可能性也更小。
直接引用有时候是必要的。比如法律条文、经典定义、名人名言。这些内容必须原样写出来。这时候就需要使用引号,并注明详细出处。引用的篇幅不能太长。大段大段的引用,即使加了引号,也可能让查重率变高。有些学校对引用比例有规定。要注意遵守学校的要求。参考文献的格式必须正确。参考文献列表本身不参与查重,但格式错误可能导致系统识别不出来。系统可能把参考文献里的题目当成正文去查重,那就会出问题。所以学好参考文献格式很重要。
查重工具可以自己先用。在提交学校之前,自己可以先查一次。网上有很多查重服务,有的收费,有的免费。免费的数据库可能小一些,结果不一定准确。收费的往往更可靠,但要注意选择正规平台。不要轻易把论文发给不可靠的网站,防止论文被泄露或盗用。自己查重之后,根据报告修改论文。修改一次,再查一次。直到重复率降到标准以下。这是一个反复的过程,需要耐心。
不同学校对查重率的要求不同。本科毕业论文、硕士论文、博士论文的标准不一样。通常本科要求宽松一些,硕士严格一些,博士最严格。有的学校要求查重率低于百分之二十,有的要求低于百分之十,甚至百分之五。具体数字要看学校的规定。除了总重复率,有些学校还看“章节重复率”。比如每一章的重复率都不能超过一个值。这要求更高。你必须保证论文的每一部分都是原创的。
查重只是一种技术手段。它的目的是防止抄袭,鼓励原创。写论文的根本是做出自己的研究,表达自己的思想。如果只是为了通过查重,想办法东拼西凑,那就失去了意义。好的论文是建立在大量阅读和思考之上的。你读了很多资料,理解了前人的工作,然后发现新的问题,提出自己的解决方法。这个过程本身就会产生原创的内容。你的实验数据、调研结果、理论推导,这些都是别人没有的。这些内容自然不会被查重标红。
查重系统也有局限。数据库不可能包含所有文章。有些最新的研究成果,还没有录入数据库。有些外文资料,可能不在中文查重系统的数据库里。如果你抄袭了这些内容,系统暂时查不出来。但这不意味着你可以这样做。学术诚信是学者的底线。一旦被发现,后果比查重率高严重得多。而且数据库在不断扩大,今天查不到,明天可能就查到了。侥幸心理要不得。
写论文是一段辛苦的经历。从选题到找资料,从写作到修改,每一步都不容易。查重是最后一道关卡。它提醒我们尊重别人的劳动,也尊重自己的劳动。用自己的话写出自己的思考,这是对自己负责。通过查重不是最终目标,写出有价值的论文才是目标。认真对待每一个字,每一句话,每一篇参考文献。这个过程能锻炼你的思维能力,也能培养严谨的习惯。这些习惯对你以后的工作和生活都有好处。