论文查重是一个检查文章有没有抄袭的过程。现在很多学校都要用这个办法。学生写完论文以后,要把文章传到查重系统里。系统会把文章和数据库里的东西进行比对。数据库里有很多已经发表的文章。还有别的学生写过的论文。系统看一段话和数据库里的话有多少是一样的。如果一样的地方太多,系统就会说这篇文章有抄袭的问题。
查重系统用一些特别的词来描述它的工作。比如“重复率”这个词。重复率就是文章里和别人一样的内容占了多少比例。学校会规定一个数字。比如重复率不能超过百分之十。超过了就要修改。或者不能参加答辩。学生很关心自己的重复率是多少。他们希望重复率低一点。
还有一个词叫“数据库”。查重系统不是凭空工作的。它要有一个很大的仓库来放文章。这个仓库就是数据库。数据库里的东西越多,查得就越准。有的数据库专门放学术期刊。有的放学生的毕业论文。有的还能从网上抓取各种网页内容。系统把学生文章和这个仓库里的每一篇进行对照。找出那些长得像的句子。
“比对”也是一个常用词。比对就是比较和对照。系统进行比对的时侯,不是整篇一起看。它会把文章切成一小段一小段。有时是按句子来分。有时是按固定的字数来分。比如每十几个字算一个部分。然后系统拿这一小段去数据库里搜索。看看有没有和它差不多的话。搜索的时候,系统可能不会要求每个字都一样。意思差不多的话也可能被找出来。
“相似度”和重复率有点像。它说的是两段话看起来像的程度。相似度可以用百分比来表示。百分之百就是完全一样。百分之零就是完全不一样。查重报告里会标出哪些段落相似度高。还会给出相似度最高的那些文章的来源。学生一看就知道自己的话和哪篇文章撞上了。
“原创性”是学校最看重的东西。原创性就是文章里有多少是你自己想出来的。有多少是新的内容。查重的根本目的就是保护原创性。系统把那些不是原创的部分找出来。这样就能知道一篇文章的真实水平。如果一篇文章全是抄的,那它就没有原创性。这样的论文是不合格的。
查重系统在工作时会生成一个报告。报告里有很多重要的部分。“总重复率”会写在最前面。这是一个总体的数字。然后报告会把文章里重复的部分用颜色标出来。通常是红色或黄色。红色代表重复程度很高。黄色代表有一些重复。绿色代表没有发现问题。学生可以根据颜色标记来修改论文。把红色的地方都改掉。重复率就能降下来。
报告里还有一个名单叫“相似文献列表”。这个名单列出了和你的文章最像的那些文章。每篇文章会写上标题、作者和来源。有时还会写明具体有多少字是相似的。学生需要仔细看看这个名单。确认自己是不是真的用了别人的话而没有注明。
“引用”和“抄袭”是两件完全不同的事。写论文可以引用别人的观点。但引用必须按照规定的方法来做。要在文章里加上引号。要在文章最后列出参考文献。查重系统能分辨引用和抄袭。有的系统有专门的功能。它可以把引用部分排除在外。不算进重复率里。这样对学生更公平。因为合理的引用是允许的。
有的学生害怕查重。他们想各种办法让重复率变低。比如“改写”就是一种办法。改写就是把别人的话用你自己的方式再说一遍。把句子顺序调一下。把一些词换成同义词。这样系统可能就认不出来了。但这种做法不一定好。因为它没有真正增加文章的原创性。只是躲过了系统的检查。
还有一种办法叫“翻译”。有的学生找到外文的文章。用翻译软件把它变成中文。他们觉得这样查重系统就查不到了。因为数据库里可能没有那篇外文文章的中文翻译。这个办法有时能暂时有用。但风险很大。因为翻译过来的话可能很不通顺。老师一看就能发现问题。而且现在的查重数据库越来越全。可能已经包括了翻译过来的内容。
“自查”是很多学生在交论文前会做的事。他们自己先找查重系统检查一遍。看看重复率有多高。然后根据报告去修改。改完再查一次。直到重复率达标为止。市场上有不少提供自查服务的网站。这些网站和学校用的系统不一定完全一样。但大体原理是相通的。自查可以让学生心里有底。避免正式检查时出问题。
不同的学校用的查重系统可能不同。有的用这个品牌。有的用那个品牌。每个系统的数据库不一样。计算重复率的方法也可能有点不同。所以一篇文章在这个系统里重复率是百分之五。在另一个系统里可能就是百分之八。学生需要了解自己学校用的是什么系统。然后用同样的标准来要求自己。
查重系统不是万能的。它只是一个工具。它只能找出文字上相似的地方。它不能判断一篇文章的思想好不好。它也不能知道学生是不是真的理解了那些话。有的学生把别人的话改得乱七八糟。重复率是低了。但文章根本读不通。这样的论文同样没有意义。老师看论文的时候,不光看重复率。更要看文章的内容和质量。
对于学生来说,最好的办法就是自己写。从一开始就用自己的话来表达。看书的时候记下重要的观点。然后合上书,根据你的理解把观点写出来。这样写出来的东西自然就是原创的。根本不用担心查重的问题。写论文是一个学习的过程。通过自己的思考和研究,你才能真正学到东西。查重只是一个辅助的手段。它的存在是为了提醒学生要诚实。要尊重别人的劳动成果。要珍惜自己的学习机会。
写论文的时候,保持好的习惯很重要。每用到别人的一个想法,就马上记下是从哪里来的。在文章里清楚地标明哪些是引用。最后认真整理参考文献列表。这样做,查重的时候就不会有麻烦。你的论文也会显得更规范、更专业。
查重技术本身也在发展。以前的系统可能只能查文字一模一样。现在的系统更聪明了。它能看出句子结构相似。它能理解词语的替换。未来可能还会有更先进的技术。但不管技术怎么变,核心原则不会变。那就是鼓励原创,反对抄袭。这是学术世界的基础。每个人都应该遵守这个规则。