收集相关数据后,我们必须以适当的方式对其进行分析.选择分析技术有三个主要方面需要考虑.
数据的性质
实验目的
设计考虑因素
要分析数据,我们还必须查看数据所代表的较大人口以及该数据的分布.
抽样是从大量人口中选择一组数据的过程.样本统计描述和总结了从一组实验对象获得的测量值.
人口参数表示如果测量所有可能的受试者将获得的值.
人口或样本可以通过集中趋势的度量来描述,例如均值,中位数和模式以及分散度量,例如方差和标准差.许多数据集正常分布,如下图所示.
如上所示,数据将均匀分布在均值上.这是正态分布的重要特征.
其他分布也存在于数据偏斜的地方,因此平均值的一侧有比其他数据点更多的数据点.例如:如果大部分数据出现在均值的左侧,那么我们可以说分布偏向左侧.
通常情况下,实验进行:
确认理论
探索关系
要实现这些目标,应根据假设正式表达目标,并且分析必须直接解决这个假设.
调查必须旨在探索理论的真实性.该理论通常指出,使用某种方法,工具或技术会对受试者产生特别的影响,使其在某种程度上比另一种方式更好.
有两种情况的数据需要考虑:正常数据和非正常数据.
如果数据来自正态分布且有两组比较那么,学生的t检验可以用于分析.如果要比较两个以上的组,可以使用称为F统计的方差测试的一般分析.
如果数据是非正常的,则可以使用Kruskal-Wallis通过排名进行测试.
调查旨在确定描述一个变量或多个变量的数据点之间的关系.
有三种方法可以回答有关关系的问题:箱形图,散点图和相关性分析.
方块图可以表示一组数据范围的摘要.
散点图表示两个变量之间的关系.
相关分析使用统计方法确认两个属性之间是否存在真实关系.
对于正态分布值,请使用 Pearson Correlation Coefficien t 检查两个变量是否高度相关.
对于非正常数据,对数据进行排名并使用 Spearman等级相关系数作为关联度量.非正态数据的另一个衡量指标是 Kendall稳健相关系数,它研究了数据点对之间的关系,可以识别出部分相关性.
如果排名包含大量绑定值,则卡方检验开启列联表可用于测试变量之间的关联.同样,线性回归可以用来生成一个方程来描述变量之间的关系.
对于两个以上的变量,多元回归可以使用.
在选择分析技术时必须考虑调查的设计.同时,分析的复杂性会影响所选择的设计.多组使用F统计而不是学生T检验,分为两组.
对于具有两个以上因子的复杂因子设计,需要更复杂的关联和显着性检验.
统计技术可用于说明一组变量对其他变量的影响,或用于补偿时间或学习效果.