分析软件测量数据

收集相关数据后,我们必须以适当的方式对其进行分析.选择分析技术有三个主要方面需要考虑.

  • 数据的性质

  • 实验目的

  • 设计考虑因素

数据的性质

要分析数据,我们还必须查看数据所代表的较大人口以及该数据的分布.

抽样,人口和数据分布

抽样是从大量人口中选择一组数据的过程.样本统计描述和总结了从一组实验对象获得的测量值.

人口参数表示如果测量所有可能的受试者将获得的值.

人口或样本可以通过集中趋势的度量来描述,例如均值,中位数和模式以及分散度量,例如方差和标准差.许多数据集正常分布,如下图所示.

Population

如上所示,数据将均匀分布在均值上.这是正态分布的重要特征.

其他分布也存在于数据偏斜的地方,因此平均值的一侧有比其他数据点更多的数据点.例如:如果大部分数据出现在均值的左侧,那么我们可以说分布偏向左侧.

实验的目的

通常情况下,实验进行:

  • 确认理论

  • 探索关系

要实现这些目标,应根据假设正式表达目标,并且分析必须直接解决这个假设.

确认理论

调查必须旨在探索理论的真实性.该理论通常指出,使用某种方法,工具或技术会对受试者产生特别的影响,使其在某种程度上比另一种方式更好.

有两种情况的数据需要考虑:正常数据非正常数据.

如果数据来自正态分布且有两组比较那么,学生的t检验可以用于分析.如果要比较两个以上的组,可以使用称为F统计的方差测试的一般分析.

如果数据是非正常的,则可以使用Kruskal-Wallis通过排名进行测试.

探索关系

调查旨在确定描述一个变量或多个变量的数据点之间的关系.

有三种方法可以回答有关关系的问题:箱形图,散点图和相关性分析.

  • 方块图可以表示一组数据范围的摘要.

  • 散点图表示两个变量之间的关系.

  • 相关分析使用统计方法确认两个属性之间是否存在真实关系.

    • 对于正态分布值,请使用 Pearson Correlation Coefficien t 检查两个变量是否高度相关.

    • 对于非正常数据,对数据进行排名并使用 Spearman等级相关系数作为关联度量.非正态数据的另一个衡量指标是 Kendall稳健相关系数,它研究了数据点对之间的关系,可以识别出部分相关性.

如果排名包含大量绑定值,则卡方检验开启列联表可用于测试变量之间的关联.同样,线性回归可以用来生成一个方程来描述变量之间的关系.

对于两个以上的变量,多元回归可以使用.

设计注意事项

在选择分析技术时必须考虑调查的设计.同时,分析的复杂性会影响所选择的设计.多组使用F统计而不是学生T检验,分为两组.

对于具有两个以上因子的复杂因子设计,需要更复杂的关联和显着性检验.

统计技术可用于说明一组变量对其他变量的影响,或用于补偿时间或学习效果.