数据

  从生产建设、科学实验、社会生活或其他活动中收集到的原始数字材料.例如,某地在一年中记录下来的每天的最高气温,某班40名学生考试的得分清单,这些都是数据.数据是以一个一个的数字形式出现的,并且分布在一定的空间和时间的范围内.在调查中会收集到什么样的数据是不由人的主观决定的,一组收集到的数据从表面看来通常是杂乱无章的,但实际上,在一定范围内总是呈现出某种规律性,在统计学中,对这些规律性作了广泛的研究.数据的收集和整理是统计工作的基础.

总体和个体

  在统计学中,人们所研究的对象的全体叫做总体.总体中的每一个研究的对象叫做个体.总体的一部分叫做样本.样本中所含个体的数目叫做样本的容量.例如,要了解一块玉米地里所有单株玉米的平均产量,从中抽取100个单株玉米,用这100个单株玉米的平均产量,去估计这块地里所有单株玉米的平均产量.在这个问题中,玉米地里单株玉米产量的全体是总体;每个单株玉米的产量是个体;从中抽取的100个单株玉米的产量是总体的一个样本;样本的容量是100

  总体中所有个体的平均数叫做总体平均数.样本中所有个体的平均数叫做样本平均数.

  例如,在一块地里,所有单株玉米的平均产量就是总体平均数.从中抽查的部分单株玉米的平均产量就是样本平均数,.通常用样本平均数去估计总体平均数.一般说来,样本容量大,这种估计也就越精确.如抽查的单株玉米株数越多,那么所抽查的单株玉米的平均产量,就越接近所有单株玉米的平均产量.另外,一个总体所含个体的数目可以有很多,因此有时不可能一一加以考察.例如,要调查全国1011岁儿童的身高状况,个体的数目就十分庞大,人们只能通过样本来了解总体.统计的方法就是解决如何从样本来研究总体的问题.

频数和频率

  在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数.某个组的频数与样本容量的比值叫做这个组的频率.有了频数(或频率)就可以知道数的分布情况.例如,为了了解学生的身高情况,可以对某一班学生的身高进行测量,并把每个人的身高都记录下来,这就是原始数据.如果要进一步了解这一班学生身高的发育情况,那就要对原始数据进行整理.这时候,一种方法是分别算出全班学生中男生、女生身高的平均数,把这两个平均数分别同正常情况(在更大范围里调查到的数据)进行比较.如果遇到学生的身高相差悬殊,只用身高的平均数并不能反映出实际的情况,这时候,通常是将学生的身高从最矮的到最高的分成若干组,然后统计出落在各组里的人数(即频数),制成频数分布表,这样,就可以比较全面地反映出这一班男、女生身高的发育情况.如下图就是一个反映某校学生身高的频数分布表.

  制作频数分布表时,先要找出样本中数据的最大值和最小值,以确定数据的变动范围.

  再根据数据的分布情况适当地进行分组,最后数出样本个体落在每个组中的数目,得到频数分布表,制成统计图.