文档库 最新最全的文档下载
当前位置:文档库 › sas分析方法笔记

sas分析方法笔记

sas分析方法笔记
sas分析方法笔记

sas分析方法笔记

SAS数据分析笔记

1.SASINSIGHT启动:

方法1:Solution→Analysis→InteractiveDateAnalysis 方法2:在命令栏内输入insight

方法3:程序编辑窗口输入以下代码,然后单击Submit按钮; Procinsight; Run;

1.1一维数据分析

用sasinsight做直方图、盒形图、马赛克图。直方图:Analysis→Histogram/BarChart 盒形图:Analysis→Boxplot 马赛克图:Analy sis→Boxplot/Mosaicplot(Y)

1.2二维数据分析

散点图:Analysis→Scatteryplot(YX)

曲线图:Analysis→Lineplot(YX)

1.3三维数据分析

旋转图:Analysis→RotationgPlot

曲面图:Analysis→RotationgPlot设置FitSurface 等高线图:Analysis→Countorplot 1.4分布分析

包括:直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检验。 1.4.1Anal ysis→Distribution (Y)

第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。 1.4.2添加密度估计

A:参数估计:给出各种已知分布(正态,指数等),只需要对其中参数进行估计;Curves→ParametricDensity

B:核估计:对密度函数没有做假设,曲线性状完全依赖于数据;Curves→KernelDensity 1.4.3分布检验

Curves→CDFconfidenceband Curves→TestforDistribution 1.5曲线拟合

Analysis→Fit(YX):分析两个变量之间的关系 1.6多变量回归

Analysis→Fit(YX)

1.7方差分析

Analysis→Fit(YX)

1.8相关系数计算Analysis→Multivariate 1.9主成分分析

Analysis→Multivariate 2.SASANALYST启动:

方法1:Solution→Analysis→Analyst

方法2:在命令栏内输入analyst

2.1分类计算统计量:Data→Summarizebygroup 2.2随机抽样:Data→RandomSle 2.3生成报表:Report→Tables 2.4变量计算:Date→Transform 2.5绘制统计图

2.5.1条形图:Graph→BarChart→Horizontal 2.5.2饼图:Graph→PieChart 2.5.3直方图:Graph→Histogram 2.5.4概率

图:Graph→Probalityplot 2.5.5散点图:Graph→Scatterplot 2.6统计分析与计算 2.6.1计算描述性统计量

Statistics→Descriptive→SummartStatistics只计算简单

统计量Statistics→Descriptive→Distribution可计算一个变

量的分布信息Statistics→Descriptive→Correlations可计算

变量之间的相关关系

Statistics→Descriptive→Frequencycounts可计算频数 2.6.2

列联表分析

Statistics→TableAnalysis 2.7假设检验

2.7.1单样本均值Z检验:检验单样本均值与某个给定的数值之间的关系 Stati stics→Hypothesistests→One-SleZ-testforamean 2.7.2单样本均值t检验:适用于不了解变量的方

差情形

推断该样本来自的总体均数μ与已知的某一总体均属μ0是否相等Statistics→Hypothesistests→One-Slet-testforamean

2.7.3单样本比例检验:检验取离散值的变量取某个值的比例Statistics→Hypothesistests→One-Sletestforaproportion

2.7.4单样本方差检验:检验样本方差是否等于给定的值。零假设方差等于某个给定的。

Statistics→Hypothesistests→One-Sletestforavariance

2.7.5两样本均值t检验:独立的两个总体的均值是否相等或者是否相差给定的值Statistics→Hypothesistests→Two-Slet-testformeans

2.7.6成对样本均值t检验:成对样本检验中总体是相关的。Statistics→Hypothesistests→Two-Slepairedt-testformeans

2.7.7两样本比例检验:检验两个总体中某个比例的值是否相等。Statistics→Hypothesistests→Two-Sletestforproportions 2.7.8两样本方差检验

Statistics→Hypothesistests→TwoSletestforvariance 2.8ANOVA过程

2.8.1单因素ANOVA过程

Statistics→ANOVA→One-WayAnova

2.8.2非参数的单因素方差分析:适用于正态分布假定或方差相等假设不能满足的单因素问题

Statistic s→ANOVA→nonparameterone-wayAnovatest

Wilcoxon法、Median法、VanderWaerden法、Savage法。

2.8.2因素方差分析:实验结果是连续数值而分类变量是两个以上的离散型数值。Statistics→ANOVA→FactorialAnova

2.8.3线性模型:用最小二乘法拟合一般线性模型

Statistics→ANOVA→LinearModel 2.9回归分析:

Statistics→Regression

2.9.1simple回归:简单一类回归分析,单一的自变量,单一的因变量,模型可以是一次、二次、三次。

Statistics→Regression→simple

2.9.2linear回归:线性回归,回归模型可以有多个因变量,多个自变量,但是对因变量分别进行回归

Statistics→Regression→linear

2.9.3logistic回归:用于解决因变量是一个二元变量Statistics→Regression→logistic

3.报表以及图形输出

3.1print过程 Procprintdata=sasuser.score;//数据库.数据集Run; Procprintdata=sasuser.score; VarnamemathChinese;//变量 Run; Procprintdata=sasuser.scorenoobs;//去掉第一列(观测序号)

VarnamemathChinese; Run;

Procprintdata=sasuser.score; Wheresexin(‘f’);//通过where语句 Run; Procprintdata=sasuser.scorenoobslabel;Title‘女生成绩单’;Labelname=‘姓名’ Sex=‘性别’ Math=‘数学’ Chinese=‘语文’ English=‘英语’;Wheresexin(‘f’); Run;Title“thesassystem”;//恢复系统标题 Procprintdata=sasuser.score;Footnote=‘分数列表’;//加分数列表的脚注 Run;

Procsortdata=sasuser.score; Bysex; Run;

Procprintdata=sasuser.score;//使用by分组输出前用sort排

序 Bysex; Run; Procprintdata=sasuser.score; Summath;Run; 3.2tabulate过程 Proctabulatedata=数据集名称; Class 分类变量; Var分析变量; Table页面说明行维说明列维说明/选项; Run; 3.3sort过程 Procsortdata=数据集名称;//默认升序排列 By变量名; Run; Procsortdata=数据集名称;Bydescending变量名;//降序排列 Run; 3.4means过程:数量(N)、均值(Mean)、标准差(StdDev)、最大值(Maximum)、最小值(Minimum) Procmeansdata=sasuser.stock; Varprice; Run;

3.5univariate过程 Procunivariatedata=数据集; Var分析变量; Run;结果: Moments:统计量的各阶矩,例如一阶矩就是均值,二阶矩就是方差等; BasicStatisticalMeasures:基本统计量; Testsforlocation:检验均值是否为零; Quantiles:分位数表; ExtremeObservations:极端观测值。 3.6freq过程:离散变量的分布情况 Procfreqdata=数据集名; Tables变量名;Run;结果:变量取值、频数、百分比、累计频数、;累计百分比 3.7corr过程:相关系数 Proccorrdata=数据集; Var变量名变量名; Run;结果:简单统计量相关系数及p值 3.8gplot 过程:绘制散点图和曲线图,绘制回归曲线。 Procgplotdata=数据集名称; Symbol曲线类型; Plot竖轴变量*横轴变量;Run; Procgplotdata=sasuser.score; SymbolI=nonev=star; PlotEnglish*Chinese; Run; 3.9gchart过程:绘制直方图、饼图、三维直方图等。 Procgchartdata=数据集名称;

Vbar/pie/block=变量; Run; 3.10G3D过程绘制三维曲面

Procg3ddata=数据集; Plot变量x*变量y=变量z; Run;gcontour过程:画出曲面的等高线 Procgcontourdata=数据集名; Plotx*y=z; Run; 4.基本统计分析

4.1正态性检验:univariate过程

Procunivariatedata=sasuser.stocknormal; Vareps; Run; Procunivariatedata=sasuser.stocknormal; Vareps; Histogrameps;//画出直方图 Probploteps;//画出概率分布图Run; 4.2单变量均值检验

4.2.1如果一个变量服从正态分布,那么可以用t检验来对变量进行均值检验 Procttestdata=数据集ho=均值; Var检验变量; Run; 4.2.2t检验还可以检验方差相同的两个独立样本均值是否相等 Procttestdata=数据集; Class分类变量; Var检验变量; Run;结果

相关文档