统计是认识世界的工具。数据是统计的基础。数据来自生活。生活中的数据无处不在。每天的天气温度是数据。超市商品的价格是数据。班级同学的身高是数据。这些数据看起来杂乱。统计帮助我们从杂乱中找到规律。统计不是数字游戏。统计帮助我们做决定。
收集数据是第一步。数据有两种。一种是我们亲自记录的数据。比如记录一周的早餐种类。另一种是别人收集好的数据。比如国家公布的人口数字。收集数据要小心。数据必须真实。不真实的数据没有用。数据也要有代表性。只调查班上三个同学不能代表全班。只调查一个城市不能代表全国。数据代表谁很重要。
整理数据是第二步。原始数据常常很乱。我们需要整理它们。整理数据就像整理房间。把书放在书架上。把衣服放进衣柜。数据整理后看起来清楚。整理数据可以用表格。表格让数据整齐排列。整理数据也可以用图形。图形让数据一目了然。
图形有很多种。柱状图很常见。柱状图用柱子的高低表示多少。比较不同班级的人数可以用柱状图。折线图表示变化。观察一个月气温变化可以用折线图。饼图表示部分和整体的关系。看家庭开支中食物占多少可以用饼图。图形要画得准确。图形不能误导人。图形的刻度要从零开始。不然柱子高低会产生错觉。
数字特征描述是第三步。数据整理好后我们需要几个关键数字。这些数字代表数据的整体情况。平均数是最常用的数字。平均数是所有数据加起来除以个数。平均数代表一般水平。比如班级平均分。但平均数有时会骗人。如果有一个特别大或特别小的数平均数会受影响。
中位数是另一个重要数字。中位数是把数据从小到大排列中间的那个数。中位数不受极端值影响。比如一个班级有五个人。四个人考八十分一个人考二十分。平均数会被拉低。中位数还是八十分。中位数更能代表大多数人的水平。众数是出现次数最多的数。众数告诉我们最普遍的情况。比如鞋店进货要看大众的尺码。
数据分散程度也很重要。光知道平均水平不够。我们需要知道数据是否集中。范围是最简单的测量。范围是最大值减最小值。范围大说明数据分散。范围小说明数据集中。但范围只考虑两个极端值。方差和标准差更全面。方差衡量每个数据与平均数的差距。标准差是方差的平方根。标准差小数据集中在平均数附近。标准差大数据分散。
这些数字特征帮助我们理解数据。只看原始数据我们可能看不清。这些数字给出清晰图画。它们告诉我们数据的位置。它们告诉我们数据的分散程度。它们是数据的总结。
概率是统计的另一个基础。生活中很多事情不确定。明天可能下雨也可能不下雨。抛硬币可能正面可能反面。概率描述可能性的大小。概率在0和1之间。概率为0表示不可能发生。概率为1表示一定发生。概率为0.5表示一半可能性。
我们通过试验认识概率。抛硬币很多次。正面出现的次数接近一半。试验次数越多结果越稳定。概率是长期频率的稳定值。理解概率帮助我们预测。知道下雨概率我们可以决定是否带伞。知道产品合格率工厂可以控制质量。
样本和总体是重要概念。总体是我们想研究的全部对象。比如全国所有中学生。样本是从总体中选出的一部分。我们经常无法研究总体。研究全国每个中学生太困难。我们只能研究一个样本。用样本的情况推断总体的情况。
抽样方法必须科学。抽样要保证公平。每个个体被选中的机会应该相同。简单随机抽样就像抽签。给每个个体编号然后随机抽取。系统抽样是等间隔抽取。比如从名单中每隔十人选一人。分层抽样先分类再抽取。比如按男生女生分类分别抽取。科学抽样得到的样本能代表总体。
统计推断是根据样本推断总体。我们想知道总体平均数。但我们只测量了样本平均数。样本平均数和总体平均数有差距。这种差距叫抽样误差。样本越大抽样误差越小。样本越小抽样误差越大。
置信区间是一个范围。我们有信心认为总体平均数落在这个范围内。比如我们说全校平均身高在160厘米到165厘米之间。我们有95%的信心。这个95%叫置信水平。置信水平越高区间越宽。置信区间给出估计的精确程度。
假设检验是另一种推断。我们先提出一个假设。比如假设新教学方法没有效果。然后我们收集数据。数据可能支持假设也可能反对假设。如果数据与假设矛盾的程度很大我们拒绝假设。假设检验帮助我们做判断。判断差异是真实存在的还是偶然出现的。
相关和回归分析关系。两个变量可能有关联。比如学习时间和考试成绩。相关程度用相关系数表示。相关系数在负1和正1之间。正相关表示一个增加另一个也增加。负相关表示一个增加另一个减少。相关系数为0表示没有线性关系。
回归分析更进一步。回归分析用一个变量预测另一个变量。比如用学习时间预测考试成绩。回归方程就像一条直线。这条直线最好地拟合数据点。回归分析帮助我们理解变量如何影响。
统计应用在生活中广泛。政府用统计制定政策。人口普查数据帮助规划学校医院。企业用统计管理生产。质量控制图监控生产线。医生用统计评估治疗效果。临床试验比较新旧药物。农民用统计提高产量。试验田比较不同肥料。统计在天气预报中。统计在经济预测中。统计在体育分析中。统计无处不在。
学习统计需要动手。只看书不够。必须处理真实数据。从简单问题开始。记录自己每天的睡眠时间。计算一周的平均睡眠时间。画图显示每天的变化。比较不同月份的差异。实践加深理解。
统计思维是一种习惯。看到数据不轻易下结论。先问数据怎么来的。再问数据代表谁。然后看数字特征。最后做谨慎推断。统计思维避免我们被误导。广告中的统计可能不完整。新闻中的图形可能夸张。统计思维帮助我们辨别。
统计工具现在很多。电脑软件可以计算。但工具不能代替思考。我们必须理解方法背后的思想。知道公式为什么这样。知道结果什么意思。工具让计算变快。思考让结论正确。
统计是面对不确定性的方法。世界充满不确定性。统计提供了一种应对方式。通过数据收集整理分析。我们减少盲目猜测。我们提高决策质量。统计让模糊变清晰。统计让复杂变简单。
统计学习需要耐心。概念需要慢慢体会。方法需要反复练习。错误是学习的一部分。算错数字可以重算。理解错误可以纠正。关键是不害怕数字。关键是不逃避数据。统计是每个人可以掌握的。统计是实用的知识。统计是观察世界的眼睛。统计是理解生活的语言。