SAS - 频率分布

频率分布是表示数据集中的数据点的频率的表.表中的每个条目都包含特定组或区间内值的出现频率或计数,这样,表格总结了样本中值的分布.

SAS提供了一个名为 PROC FREQ 的过程来计算数据集中数据点的频率分布.

语法

计算SAS中频率分布的基本语法是 :

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是所用参数的说明及减号;

  • 数据集是数据集的名称.

  • Variables_1 是变量名称需要计算频率分布的数据集.

  • 变量_2 是对频率分布结果进行分类的变量.

单变量频率分布

我们可以使用 PROC确定单个变量的频率分布FREQ.在这种情况下,结果将显示变量的每个值的频率.结果还显示百分比分布,累积频率和累积百分比.

示例

在下面的示例中,我们找到变量马力的频率分布对于名为 CARS1 的数据集,它是从库 SASHELP.CARS创建的.我们可以看到结果分为两类结果.每个车型一个.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

执行上述代码后,我们得到以下结果 :

FREQ_By2

多个可变频率分布

我们可以找到多个变量的频率分布,将它们分组为全部可能的组合.

示例

在下面的示例中,我们计算汽车品牌的频率分布按汽车类型分组以及按每个品牌分组的每种类型汽车的频率分布.

proc FREQ data = CARS1 ;
tables make type; 
run;

执行上述代码后,我们得到以下结果 :

FREQ_tables1

带重量的频率分布

使用权重选项,我们可以计算出随重量偏差的频率分布变量.这里变量的值被视为观察数而不是值的数量.

示例

在下面的示例中,我们计算变量的频率分布和权重分配给马力.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

执行上述代码后,我们得到以下结果 :

FREQ_tables3