分析软件测量数据

收集相关数据后，我们必须以适当的方式对其进行分析.选择分析技术有三个主要方面需要考虑.

数据的性质

要分析数据，我们还必须查看数据所代表的较大人口以及该数据的分布.

抽样是从大量人口中选择一组数据的过程.样本统计描述和总结了从一组实验对象获得的测量值.

人口参数表示如果测量所有可能的受试者将获得的值.

人口或样本可以通过集中趋势的度量来描述，例如均值，中位数和模式以及分散度量，例如方差和标准差.许多数据集正常分布，如下图所示.

Population

如上所示，数据将均匀分布在均值上.这是正态分布的重要特征.

其他分布也存在于数据偏斜的地方，因此平均值的一侧有比其他数据点更多的数据点.例如:如果大部分数据出现在均值的左侧，那么我们可以说分布偏向左侧.

通常情况下，实验进行:

要实现这些目标，应根据假设正式表达目标，并且分析必须直接解决这个假设.

调查必须旨在探索理论的真实性.该理论通常指出，使用某种方法，工具或技术会对受试者产生特别的影响，使其在某种程度上比另一种方式更好.

有两种情况的数据需要考虑:正常数据和非正常数据.

如果数据来自正态分布且有两组比较那么，学生的t检验可以用于分析.如果要比较两个以上的组，可以使用称为F统计的方差测试的一般分析.

如果数据是非正常的，则可以使用Kruskal-Wallis通过排名进行测试.

调查旨在确定描述一个变量或多个变量的数据点之间的关系.

有三种方法可以回答有关关系的问题:箱形图，散点图和相关性分析.

对于正态分布值，请使用 Pearson Correlation Coefficien t 检查两个变量是否高度相关.
对于非正常数据，对数据进行排名并使用 Spearman等级相关系数作为关联度量.非正态数据的另一个衡量指标是 Kendall稳健相关系数，它研究了数据点对之间的关系，可以识别出部分相关性.

如果排名包含大量绑定值，则卡方检验开启列联表可用于测试变量之间的关联.同样，线性回归可以用来生成一个方程来描述变量之间的关系.

对于两个以上的变量，多元回归可以使用.