SAS - Scatter Plots

散点图是一种图形,它使用在笛卡尔平面中绘制的两个变量的值.它通常用于找出两个变量之间的关系.在SAS中,我们使用 PROC SGSCATTER 来创建散点图.

请注意,我们在第一个示例中创建名为CARS1的数据集,并为所有数据集使用相同的数据集后续数据集.此数据集保留在工作库中,直到SAS会话结束.

语法

在SAS中创建散点图的基本语法是 :

PROC sgscatter  DATA = DATASET;
   PLOT VARIABLE_1 * VARIABLE_2
   / datalabel = VARIABLE group = VARIABLE;
RUN;

以下是所用参数的说明及减号;

  • DATASET 是数据集的名称.

  • VARIABLE 是从中使用的变量数据集.

简单散点图

在一个简单的散点图中,我们从数据集中选择两个变量,将它们归为第三个变量.我们也可以标记数据.结果显示两个变量如何分散在笛卡尔平面中.

示例

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

TITLE 'Scatterplot - Two Variables';
PROC sgscatter  DATA = CARS1;
   PLOT horsepower*Invoice 
   / datalabel = make group = type grid;
   title 'Horsepower vs. Invoice for car makers by types';
RUN;

当我们执行上面的代码时,我们得到以下输出 :

sactter_plot1

带预测的散点图

我们可以使用估算参数来预测绘图之间的相关强度围绕值的椭圆.我们使用过程中的其他选项绘制椭圆,如下所示.

示例

proc sgscatter data = cars1; 
compare y = Invoice  x = (horsepower length)  
         / group = type  ellipse =(alpha = 0.05 type = predicted); 
title
'Average Invoice vs. horsepower for cars by length'; 
title2
'-- with 95% prediction ellipse --'
; 
format
Invoice dollar6.0;
run;

当我们执行上面的代码时,我们得到以下输出 :

sactter_plot_eliipse

分散矩阵

我们还可以通过将它们分组成两个变量的散点图.在下面的示例中,我们考虑三个变量并绘制散点图矩阵.我们得到3对结果矩阵.

示例

PROC sgscatter  DATA = CARS1;
   matrix horsepower invoice length
   / group = type;

   title 'Horsepower vs. Invoice vs. Length for car makers by types';
RUN;

当我们执行上面的代码时,我们得到以下输出 :

sactter_plot_matrix