研究需要多少人参加。这是一个问题。做毕业论文的时候经常遇到。人太少结果不可靠。人太多浪费时间和力气。找到合适的数量很重要。
我们用一个例子说明。你想知道一种新药的效果。找一个人吃药没有意义。这个人可能刚好身体好。也可能刚好身体差。一个人的情况不能代表所有人。找十个人试试。结果可能好可能坏。十个人还是太少。如果一百个人吃药效果好。我们更相信这个药有用。样本量就是参加研究的人数。
样本量太小不行。结果可能只是碰巧。比如你抛硬币五次。可能四次都是正面。你不能说硬币总是正面。研究也一样。人太少容易得到错误结论。样本量太大也不好。需要更多时间和金钱。可能找到很小的差别。这个差别没有实际意义。比如药效只快一分钟。这点差别不值得多花钱。
怎么决定样本量呢。首先看研究目的。你想回答什么问题。比较两个组还是看一个组的情况。比较两个组需要更多人。看一个组可以少一些人。比如比较新药和旧药。需要两组人参加。每组都要足够多。如果只看吃药后的效果。只需要一组人。
第二看数据特点。数据分几种类型。计数资料和计量资料。计数资料数人数。比如有效和无效的人数。计量资料测量数值。比如血压和身高的数值。计数资料通常需要更多人。计量资料可以少一些人。
第三看差异大小。你希望找到多大的差别。差别大需要的人少。差别小需要的人多。比如新药比旧药效果好很多。不需要很多人就能发现。如果效果只好一点点。需要很多人才能确认。
第四看数据波动。数据波动大需要更多人。数据波动小需要人少。比如测量小学生身高。大家身高差不多。不需要测很多人。测量成年人收入。收入差别很大。需要测量很多人。
第五看错误允许程度。研究可能犯两种错误。第一类错误说有效其实无效。第二类错误说无效其实有效。通常控制第一类错误在百分之五。第二类错误在百分之二十。把握度是百分之八十。把握度越高需要人越多。
有公式可以计算样本量。需要知道几个数字。基准水平是多少。期望水平是多少。数据波动有多大。错误控制在哪里。把这些数字代入公式。得到需要的样本量。
不会计算怎么办。可以查表找样本量。有些书有现成的表格。找到你的研究类型。对照参数查找数字。也可以使用软件计算。现在有很多统计软件。输入参数自动计算。比手工计算更方便。
可以参考类似研究。看看别人用多少人。如果别人研究类似问题。用了两百个人。你可以参考这个数字。注意研究条件要相似。条件不同需要调整。
需要考虑实际情况。学校可能要求最少人数。比如不能少于三十人。导师可能有具体建议。研究对象不容易找。只能找到有限的人。要在理想和现实间平衡。
特殊研究有特殊要求。问卷调查通常需要多人。几百人算少的。几千人常见。实验研究可以少一些人。几十人到一百人。仪器检测可能更少。十几个人也可以。
长期研究要考虑流失。开始找了一百人。半年后可能只剩八十人。计算时要多算一些。防止后来人不够。
预实验有帮助。先做一个小型研究。看看数据大概情况。用这些数据计算正式研究需要多少人。这样更准确。
分层研究要分别计算。比如按男女分组。每组都要足够人数。如果男女各占一半。总人数要加倍。
多因素研究需要更多人。研究一个因素需要一定人数。研究两个因素需要更多人。因素越多需要人越多。
没有统一的标准答案。不同研究需要不同人数。关键是想清楚研究目的。了解数据特点。合理设置参数。然后计算或查找。最后结合实际条件调整。
样本量影响研究质量。人太少审稿人可能质疑。人太多浪费资源。合适最好。
这些是基本道理。具体操作需要学习统计知识。可以向导师请教。可以咨询统计专家。可以阅读相关书籍。做毕业论文是学习过程。认真对待会有收获。