论文查重是每个学生都要面对的事情。许多人关心一个问题:论文查重的时候,查重系统到底看不看里面的问卷?这个问题看起来简单,其实里面有不少需要弄清楚的地方。
我们首先得知道论文查重是怎么工作的。学校用的查重系统,比如知网、维普、万方这些,主要任务是检查文字。系统把论文拆成一个个小的部分,和它数据库里已有的东西进行比对。数据库里面有很多内容,有以前的学生写的论文,有各种期刊杂志的文章,还有网络上能找到的公开资料。系统比较之后,会算出一个比例,告诉我们哪些部分和别人的东西太像了。它的重点是文字本身,是句子和段落的排列组合。系统不太关心你论文里某个部分是什么内容,是介绍,是分析,还是问卷。它只管这些文字是不是和别人重复了。
那么问卷在论文里是什么样子呢?一份完整的问卷在论文中通常有两个部分。第一个部分是问卷的题目,就是那些问答题和选择题本身。第二个部分是调查得到的数据,这些数据往往被整理成表格或者图表。这两个部分的性质很不一样。
我们先说问卷的题目。问卷的题目是由一句一句的话组成的。比如“您的年龄是?”、“您对这项服务满意吗?”。这些句子本身就是文字。如果你的问卷题目是自己一个字一个字想出来的,是自己写的,那么它和其他人的文字重复的可能性就很小。但实际情况常常不是这样。很多研究主题是相似的,大家用的问卷题目也可能差不多。比如研究学习压力的,可能都会问“你每天学习几个小时?”、“你感到焦虑吗?”。这些问题的问法很可能和别人以前论文里的问法很相似。这样一来,查重系统在比对文字时,就有可能把这些问卷题目标出来,算作重复的部分。这会提高你论文的总重复率。
有的学生会从别人的论文里直接复制一份成熟的问卷来用。这样做就更危险了。查重系统很大概率会发现这些题目和数据库里另一篇论文的文字是完全一样的。这就会被判定为严重的重复。所以,最好的办法是自己设计问卷题目。即使参考别人的,也要用自己的话重新说一遍,改变一下句子的结构,这样能降低被查出来的风险。
我们再说问卷的数据部分。数据通常以数字和图表的形式出现。查重系统主要识别文字,对于单纯的数字表格和图片格式的图表,目前的系统识别能力还比较有限。系统可能不会把这些数字当成“文字”去进行比对。但这并不意味着可以随意复制别人的数据图表。数据是研究的结果,是论文的核心。使用别人的数据是严重的学术不端行为,这和文字抄袭一样严重。虽然查重系统可能一时查不出来,但你的导师、答辩老师很容易从逻辑上发现数据的异常。这种行为一旦被发现,后果非常严重。
有些学生把数据做成图片插入论文,以为这样就能完全躲过查重。这种想法是不对的。首先,这是一种欺骗行为。其次,随着技术发展,查重系统也在进步。一些系统已经开始尝试识别图片中的文字了。依赖这种小技巧是很不可靠的。
我们应该如何看待问卷和查重的关系呢?关键是要理解查重的根本目的。查重不是为了为难学生,是为了保护原创性,鼓励独立思考。问卷是你自己的研究工具,是你收集证据的过程。这份工具最好是你自己参与设计的,数据一定是你自己亲手收集的。当你做到这些,就不用担心查重的问题。你的问卷题目是你的语言,你的数据是你的发现,它们天然就是独一无二的,自然不会和别人重复。
如果你确实使用了标准的、广为流传的问卷量表,比如一些心理学上的经典量表,这些量表的题目是固定不变的。这种情况下,你需要在论文中明确说明。你可以在引言或者研究方法部分写清楚:“本研究采用某某量表,该量表已广泛使用。”这样,即使查重系统标出了这些题目,审核老师也能明白原因,知道这不是抄袭。但这部分文字依然会被计入总重复率,所以你要尽量压缩对标准量表的描述性文字,把写作重点放在你自己的分析和结论上。
写论文是一件需要认真对待的事。问卷是论文的一部分,它应该反映你的真实工作。自己设计问题,自己发放和收集问卷,自己分析数据。这个过程需要时间,需要精力,但它是值得的。当你用自己的努力完成这一切,查重就只是一个简单的技术步骤,而不会成为一个令人焦虑的麻烦。你的论文是你学习的成果,是你思考的记录。保持它的原创性和真实性,是对你自己负责,也是对学术的尊重。