SAS - 相关分析

相关性分析处理变量之间的关系.相关系数是两个变量之间线性关联的度量.相关系数的值总是在-1和+1之间. SAS提供了程序 PROC CORR 来查找数据集中一对变量之间的相关系数.

语法

在SAS中应用PROC CORR的基本语法是 :

PROC CORR DATA = dataset options;
VAR variable;

以下是所用参数的说明及减号;

  • 数据集是数据集的名称.

  • 选项是附加选项绘制矩阵等程序.

  • 变量是用于查找相关性的数据集的变量名.

示例

数据集中可用的一对变量之间的相关系数可以通过使用它们的名称来获得VAR语句.在下面的例子中,我们使用数据集CARS1并得到显示马力和权重之间相关系数的结果.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

执行上述代码后,我们得到以下结果 :

corr_ana_2

所有变量之间的相关性

数据集中所有可用变量之间的相关系数可以通过只需将过程与数据集名称一起使用.

示例

在下面的示例中,我们使用数据集CARS1并获得显示两者之间相关系数的结果每对变量.

proc corr data = cars1 ;
run;

执行上述代码后,我们得到以下结果 :

corr_ana_1

相关矩阵

我们可以通过选择绘制矩阵的选项来获取变量之间的散点图矩阵在 PROC 声明中.

示例

在下面的示例中,我们得到了马力和重量之间的矩阵.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

执行上述代码后,我们得到以下结果 :

corr_ana_3