当前位置：文档库 › SPSS学习资料

SPSS学习资料

SPSS（社会科学统计软件）学习资料

参考书：

SPSS for Windows：Base System User’ s Guide. Marija J. Norusis. SPSS Inc.

卢纹岱等编著：SPSS for Windows 从入门到精通。电子工业出版社，1996年.

SPSS for Windows made Simple. 3rd ed. Paul R. Kinnear & Colin D. Gray

Psychological Press,Ltd.,1999

Electronic Statistical Textbook (from StatSoft) .statsoft./textbook/stathome.html

作业：

必须在次周周一前用电子邮件，磁盘或打印形式交给主讲教师和辅导上机的助教。

讲义：

课前在网上下载或接收电子邮件。

成绩评定方法：

期末考试, 期中考试,和作业，出勤。

期末考试

40%

期中考试

30%

作业，出勤

30%

总成绩

100

第一章数据和文件

1准备分析用数据

1.1数据收集

主要是通过测量方法收集必需的数据。测量方法可以是实验、测验、问卷调查等等。应尽可能包括自己所需要的所有变量，因为从分析中排除不必要的变量比收集附加变量要容易得多。

1.2数据编码

当我们通过问卷或测验收集了很多的数据回来后，接下来的工作就是把这些数据录入到计算机里。为了输入数据简单，一种方法是在录入前用数据或符号表述被试的回答，这就是数据编码。下面是一个编码表：

些特殊信息的Case。

（编码示例）

不管你自己对SPSS使用多么熟悉，在数据录入前对数据进行系统的编码是非常必要的，它可以使你避免混乱，清楚了解数据的意义。

1.3数据文件

SPSS有三种文件：SYNTAX 文件（文本文件，以.sps为后缀）、DATA文件（数

据文件，以.sav为后缀）、OUTPUT文件（结果文件，以.spo为后缀）。SYNTAX 文件主要是保存命令及相关的文本资料；DATA文件则是保存供SPSS统计的数据，只有这种文件里的数据才可以直接进行统计使用；OUTPUT文件保存统计的结果。

SPSS所用的数据文件有很多种，主要是根据自己分析数据的量及每一Case 包括变量多少来选择适当的文件形式。

当数据较少及Case不多时，可以直接在SPSS的数据文件里加入数据。

（录入数据示例）

当数据较多时，一般习惯用一编辑系统来录入数据（如SPSS中的SYNTAX文件），然后再通过定义命令把数据读入统计用的数据文件里。这样录入的速度较快，不过可能不容易查找在录入过程中的错误。这里只介绍用SPSS中的SYNTAX 文件录入数据的方法，并且在以下的其它内容中，也相应只介绍一些习惯的方法。

（录入数据示例）

2数据定义与转换

2.1数据定义（DATA LIST）

在用SPSS中的SYNTAX 文件录入的数据文件中，每一个人的资料都排在一行上（可以多行）。这样任何一个变量的数据都在相同的列里。SPSS在使用这些数据时，必须对这些数据进行定义。即告诉计算机各列数据代表什么。

DATA LIST命令用以给变量命名，并定义它们在Case中的位置和属性，把数据变成能被SPSS命令或过程使用的现用文件。下面只介绍用固定格式引用外部数据文件的命令：

DATA LIST FILE=‘C：\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-7

a1 to a10 8-17.

FILE子命令指定从外部文件C：\YLX\STRESS.SPS读入数据。接着是各个变量的名称及所在位置（字符宽）。

（1）当数据里有小数应该怎么表示？

如，语文成绩里有85.3分，小数点不用录入，我们只要在程式里告诉电脑哪位是小数就可以了。如：

DATA LIST FILE=‘C：\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-8（1） a1 to a10 9-18....

chi 6-8（1）中括号里的1表示有一位小数。如果是两位小数就用（2）。

（2）当你的数据中每个被试的数据有两行或者多行时应该怎么办？

下面的例子是一个case有三行数据的情况：

data list file='d:\data\2002\study.sps'records=3/1 school 1 numb 2-3 sex 4 grade 5 chinese 6-7 math 8-9 english 10-11 s1 to s60 12-71

/2 s61 to s90 1-30 b1 to b44 31-74

/3 a1 to a41 1-41 d1 to d42 42-83.

用records=3指明每个被试有三行数据，在定义的时候，用/1 /2 /3 指明是第几行的数据。

（结合学生前面录入的数据示例）

2.2变量值的重编码（RECODE）

在统计数据处理时，经常需要对数据进行某些变换以适应不同处理的要求。所谓数据变换是利用现存变量，或改变它们的值，或利用它们产生新的变量。

RECODE可以对现存变量的值作指定的变换。如我们有一个题目是:“我不能满足学生的期待。”要求老师在下面五个选择中选一个“1从来没有、2很少、3有时、4经常、5总是”。我们在录入数据时只是按老师选择的数字录入。但现在我们想统计“有时+经常+总是”和“从来没有+很少”的人数及比例。这时我们可以用RECODE命令进行变换。

RECODE ITEM1（1,2=1）（3,4,5=2）.

这样我们就用1代表“从来没有+很少”，用2 代表“有时+经常+总是”。

另，如年龄这一变量，我们可能在录入时是按实际年龄的数字录入，但如果我们想把它们分老、中、青三组以比较三种年龄的人的差异时，就可以用RECODE 命令对原数据中的年龄变量进行变换。

RECODE AGE（LO THRU 35=1）（36 THRU 45=2）（46 THRU HI=3）.

把最小到35岁为青年组，用1表示；36到45岁为中年组，用2 表示；46到最老为老年组，用3 表示；这样就对原来变量的值重新进行了编码。

这里大家应该记住：THRU表示“至”。第一个命令里是确定的值“（1，2=1）”，而第二个命令是一个范围“（LOWEST THRU 35=1）”。

（结合学生前面录入的数据示例）

2.3计算变量（COMPUTE）

有时我们想对数据进行组合，形成一个新的变量。如我们用10道题来测量学生对学校的态度，但我们并不想对这10道题进行一一的分析，我们想对它们进行合并来说明该学生对学校的态度情况。这时我们可以用COMPUTE命令来组合成新的变量。

COMPUTE ATTITUDE=（ITEM1+ITEM2+ITEM3+ITEM4+...+ITEM10）/10.

把十个项目的分析的相加的平均分成一个新的变量ATTITUDE。也可以是其它的运算关系，如减、乘、除、平方、开方等。

当然你可以不除以10，这样得到的是10道题的总分，除以10是项目平均分。但有时因为可能有几个维度，而这几个维度的项目数不一样多，我们又想比较各维度的水平，这时我们除以项目数，得到项目平均分以利于比较。

又如你用学生的语文、数学、英语三科的总成绩作为学生的学业成绩。

compute total=chinese+math+english.

除以3就可以得到平均每科的成绩。写成：

compute total=（chinese+math+english）/3.

（结合学生前面录入的数据示例）

2.4条件变换（IF）

IF命令根据逻辑条件执行类似于recode的变换。如当我们想把男生且考试分数不合格的作一组，男生且考试分数合格至良好的作一组，男生且考试分数优秀的作一组，以比较三组学生在某一方面的差异时，我们可以用IF命令来形成一个新的变量。

IF(SEX=1 AND SCORE<=60)SEXSC=1.

IF(SEX=1 AND SCORE>60 AND SCORE<=80)SEXSC=2.

IF(SEX=1 AND SCORE>80)SEXSC=3.

这样我们就变换成一个新的变量SEXSC，进而比较SEXSC在某一方面的差异，即上述三组学生的差异。

（结合学生前面录入的数据示例）

当然，我们可以IF命令来获得很多种我们想要的变换。注意和RECODE的差异。其实RECODE AGE（LO THRU 35=1）（36 THRU 45=2）（46 THRU HI=3）.也可以用IF来实现：

IF（AGE<=35）AGE1=1.

IF（AGE>35 AND AGE<=45）AGE1=2.

IF（AGE>45）AGE1=3.

不过，这样就会产生了一个新的变量“AGE1”，当然原来的变量“AGE”也保持不变。

（结合学生前面录入的数据示例）

2.5缺失数据的定义（MISSING）

我们在做调查时，经常遇到一些被试对某一问题漏答的情况。但由于该被试的其他资料还是可以用的，不想把他剔除。在编码时，我们用一个答案上没有的数字表示缺失。一般习惯是用“0”、“9”或“00”、“99”等，但注意这些数字必须是答案中没有的，否则重复了会把原来具有其它意义的变成了缺失。

在用SPSS进行统计，我们就必须告诉计算机，某一变量如果数值是“0”、“9”或“00”、“99”时，就表示缺失。如某些学生忘记填写性别，我们用9来表示缺失。

MISSING VALUE SEX（9）.

告诉计算机，当SEX是9时，表明该学生没有填写性别。在做涉及到该变量的某些计算时，如比较男女学生的差异，可以考虑剔除丢失该变量资料的人。

第二章描述统计过程

1频数

这是对数据的一般整理，了解样本的分布：离散性、变异性和规律性。统计学中的分布是指一个变量的各种情况或取值出现的次数或频数，所以又叫做频数分布。如家长的职业，我们可以用变量名“JOB”，不同的职业我们给予不同的数字表示：1-干部、2-教师、3-研究员等，分布是指被调查的学生中各种职业的家长数。频数分布反映出落入每一组的观察值个数。还可以用分数、小数或百分数表示。

1.1命令FREQUENCES

FREQUENCES计算单个变量值的频数、百分数和各种描述统计量。如上述，我

们要计算各种职业的父母的人数。

FREQUENCES VARIABLES=JOB. (可以简写成：FRE VAR=JOB.)

1.2输出结果的解释

Statistics

1.3分位点的确定—子命令PERCENTILES和NTILE

利用子命令PERCENTILES和NTILE得到所有待分析变量的百分位数。如果指定多个PERCENTILES和NTILE子命令，显示所有选择的百分位数的一个表。

1.3.1 PERCENTILES子命令

PERCENTILES子命令显示落在指定值（或者值列表）的case的百分数。如命令：FREQUENCES VARIABLES=SCORE /PERCENTILES=10 25 50 75.

计算变量SCORE在百分位点10，25，50，75的值。

1.3.2 N分位点—NTILE子命令

NTILE计算百分数，它把一个分布划分成指定类数。并显示一个值，case的请求百分数落在那个值下。如：

FREQ VAR=math/NTILE=4.

确定math的四分位点值。

2平均数、标准差、最大/最小值

某一变量得分的平均数、标准差及最大/最小值，可以说明数据的一般情况：均数、离散程度等信息。计算这些数据的命令是DESCRIPTIVES或MEANS。

2.1命令DESCRIPTVES

DESCRPTIVES可以计算单个数值变量的描述性统计量，包括平均数、标准差、最大/最小值等。如我们想了解学生语文考试的平均分与标准差，就可以用

DESCRIPTIVES命令来计算。

DESCRPTIVES VARIABLES=CHINESE.(可以简写成：DES VAR=CHINESE.)

输出结果的解释：

如果我们想还同时知道数学、英语等科的平均数分与标准差，可以把该命令写成：

DESCRIPITVES VARIABLES=CHINESE MATH ENGLISH.

计算机就会同时告诉我们这三门学科学生的平均等分、标准差、最大/最小值、有效Case数等。

输出结果的解释：

2.2命令MEANS

MEAANS与DESCRIPITVES不同，MEANS是计算由一个或多个独立变量定义的分组内，因变量的平均数、标准差和组数。

如我们要了解男女学生的语文、数学和英语的平均数、标准差等，就可以用MEANS计算。

MEANS TABLES= CHINESE MATH ENGLISH BY SEX.

执行这一命令，会给出男女学生的语文、数学和英语的平均分、标准差等。

MEANS命令还可以计算更多的变量的分组。如不同性别、不同年级学生的语文成绩平均数与标准差等。命令可写成：

MEANS TABLES= CHINESE BY SEX BY GRADE.

输出结果的解释：

Report

CHINESE

第三章相关分析和回归分析

1相关

1.1相关分析的意义

我们常用相关系数来表示两变量的关系程度。当然我们在计算相关，应该考虑这两个变量之间的关系是否线性。如果不是线性的关系，而使用相关系数来表示两变量间的关系的话，就会错误估计它们的关系。如生活压力与心理健康之间的关系，很多研究结果都表明，它们之间关系应该是一倒U型的曲线，也就是非线性的关系。因此，我们就不能用相关系数来表示它们之间关系的量。但很多变量之间关系是线性的，如学习的努力程度与学习成绩的关系，我们可以用相关系数来说明它们之间关系的程度。当然，计算相关有很多种公式，对公式的选择与变量的性质有关：是连续变量还是二分变量或是等级变量等等。一般没有注明的时候是用皮尔逊积差相关。

1.2命令CORRELATION

如我们要计算学生的语文成绩（CHINESE）与英语成绩（ENGLISH）之间的关系，

可以用以下命令：

CORRELATION VARIABLES=CHINESE WITH ENGLISH.

输出结果的解释：

这一命令还可以同时计算多个变量与多个变量两两之间的相关。如语文成绩、数学成绩、英语成绩之间的两两相关，可以用如下命令：

CORRELATION VARIABLES=CHINESE MATH ENGLISH WITH CHINESE MATH ENGLISH.

或：CORRELATION VARIABLES=CHINESE MATH ENGLISH.

输出结果的解释：

结果除给出两两相关系数（相关矩阵）外，还显示出双尾显著性检测的结果。

SPSS可以指定所用的相关公式，如果没有指定，一般默认为皮尔逊积差相关。用什么公式，应该要根据数据来决定。

2回归分析

回归分析的目的是建立两列或多列变量之间的数量关系模型（即回归方程）。也就是确定了自变量与因变量的关系模型，利用这个数学模型，我们可以从一个变量或多个变量来预测或估计另一个变量的变化。例如，我们知道学习基础（X）对成绩（Y）有密切关系，我们想建立一个回归方程，根据学生原来的学习水平高低来估计其未来成绩：Y=a+bX。这里所提到的是指线性关系的，而对于非线性关系的回归，则是另一回事。

2.2 命令REGRESSION

REGRESSION是计算多元回归的命令。提供五种建立回归方程的方法：向前选择（Rorward）、向后剔除(Backward)、逐步选择(Stepwise)、强制进入(Enter)和强制剔除(Remove)。假如我们用逐步选择方法进行回归分析，命令格式如下：REGRESSION VARIABLES={varlist}/dependent=varlist/method=stepwise.

或：

REGRESSION

/DEPENDENT varlist

/METHOD=STEPWISE varlist.

DEPENDENT里的变量名必须在前面的变量名里。一般如果不指定方法，即为默认的逐步选择方法。

2．3 输出结果的解释

第四章差异检验

1 两组平均数的差异检验

1．1 平均数的差异检验的意义

当我们想检验两样本之间是否存在差异，可以使用平均数的差异检验。例如比较男女学生在数学学习上是否存在差异。一般我们可以用T检验来证明两组是否差异显著。

1．2 命令T-TEST

T-TEST用以检验独立样本或配对样本的平均数差异显著性。当两列变量的样本不一样时，统计是不同的。

1．3 独立样本

例如：比较男女学生在学习上（包括数学、语文、英语成绩）是否存在差异。

T-TEST GROUPS=SEX（1,2）/VARIABLES=MATH CHINESE ENGLISH.

结果会告诉我们男女学生在数学、语文、英语三门学科的平均数、标准差、T 值、显著水平。

1．4 相关样本：

例如：为了比较单眼与双眼对深度知觉的影响，50名学生分别用单眼与双眼

进行了实验，等到单眼观察的一列数（A）双眼观察的一列数(B).我们比较这两列数的差异是否显著，以了解单、双眼对深度知觉的差异。

T-TEST PAIRS=A WITH B.

结果会给出两列数的平均数、标准差、T值、显著水平等。

1．5 输出结果的解释

2 单因素方差分析

2．1 单因素方差分析的意义

但大多数时，我们要比较不止两组平均数的差异，而可能是两个以上的样本平均数。这种多个样本平均数差异的检验需要通过方差分析进行。在这种意义上，可以把方差分析看作T检验扩展。有很多也用T检验来两两样本进行差异检验，但这是不对的。

2．2命令ONEWAY

ONEWAY命令用以检验单因素的几个组间的差异。例如，要比较初一、初二、初三学生心理健康（SCL）是否存在差异，可用如下命令格式：

ONEWAY VARIABLES=SCL BY GRADE（1,3）.

执行这一命令后，计算机会告诉我们三个年级学生在心理健康上的是否存在差异，即给出F值、显著性水平等。

2．3 输出结果的解释

2．4 多重比较

但当三个年级之间存在显著差异时，我们并不知道哪两个年级之间差异显著或差异不显著。这就需要进行多重比较。命令格式为：

ONEWAY VARIABLES=SCL BY GRADE（1,3）/RANGE=SCHEEFE.

多重比较的方法有好几种，可以根据需要选择。我们一般用费舍法或涂凯法。以上是用费舍法。执行以上命令，会告诉我们F值、显著性水平，如果差异显著，还会告诉我们各组的平均及哪两组之间差异显著。

3 多因素方差分析

3．1 多因素方差分析的意义

前面介绍的方差点分析是属于单因素实验设计，即实验中只有一个自变量。但心理的影响因素是多种的，单因素设计只是人为地只取一个因素作为自变量。大多数情况下，是多因素的设计。例如：不同的教学方法（因素A）和不同的教学态

度（因素B）对学生的学习成绩（因变量）的影响。这种情况下，我们必须使用多因素方差分析方法对自变量的影响进行检验。

3．2 命令ANOVA

ANOVA执行多因素实验设计的方差分析，一个ANOVA可以分析多个因素（多个自变量）和几个因变量。例如：我们考察不同年级（初一、初二、初三）、不同性别（男、女）学生心理健康情况的差异，可用以下命令格式工：

ANOVA VARLABLES=SCL BY GRADE（1,3）SEX（1,2）.

执行这一命令，会给出一个方差分析表，包括各因素的效应的F值、显著性、因素间的交互作用的效应的检验。若交互作用效应不显著，主效应的检验是非常重要的，但当交互作用显著时，主效应的检验意义就不大了。

3．3 输出结果的解释

第五章因子分析

1 因子分析的意义

因子分析的目的是用少数几个变量（即因子）去代替原来较多的变量间，而这些较少的变量应该尽可能反映原来变量的信息。因子分析主要是基于这样的思想：根据相关性的大小把变量分组，使得同组内的变量之间相关较高，不同组变量间的相关较低。这样每变量代表一个基本结构，或称因子。如SCL-90，有90道题，也即个原来的变量，我们对那么多的变量进行分析的话会太每繁且不容易清楚。因此，我们可以通过因子分析的方法，发现阶段这90个变量可以归于9个因子。这样我们就可以对象9个因子进行分析，以代替90个变量。

2 命令FACTOR

FACTOR可以完成因子分析的工作。如上例，对SCL-90的题的结果进行因子分析。

FACTOR VARIABLES=ITEM1 TO ITEM90.

执行这一命令，计算机会对象90个题进行因子分析。告诉我们各题的共同性、因素矩阵、解释量、因素负荷等。但因为分析较为繁复，需要较大的内存，当题目太多时可能做不了。

我们还可以选择因子提取方法、因子数及因素旋转方法（正交、斜交）等。

3 因子数的确定

我们可以确定我们所需的因子个数。确定因子个数的方法主要有两种：根据特征与根据碎石图。一般以特征值大于等于1为原则选取因子数。也可根据碎石图的明显折点确定因子个数。

4 输出结果的解释

第六章 X2检验

1 X2检验的意义

前面所介绍的统计方法，基本都是针对连续变量的。但在很多时候，研究问题只能划分为不同性质的类别，各类别之间没有量的联系。例如：性别分为男、女，职业可以分为干部、教师、...，教师的职称又可分为教授，副教授、讲师...等。另外，有些问题虽然有量的关系，因研究需要将其按一定的标准分为不同的类别。例如学习成绩、能力水平等等，都有连续性的数量描述它们，只是研究者依一定标准将其划分为优、良、中、差等少数类别。这样的数据我们称为计数数据。这种数据不能使用前面所介绍的统计方法进行统计。对计数数据的统计方法是X2检验。

例如：某校对学生的课外活动内容进行调查，结果整理成一个二维表，示于表达式。

表1 课外活动调查表

课外活动内容

和三类（体育、文娱、阅读）。这就是一个列联表。我们的问题也许是想看看男女学生的课外活动内容是否有差异？这时就应该用X2检验。

6．2命令CROSSTABS

要产生列联表和对计数数据进行差异检验，SPSS里用CROSSTABS命令来执行。CROSSTABS可以产生两个或多个变量的列联表。如上例，我们只需把各个Case的命令就可以生成上述的列联表。

CROSSTABS TABLES=ACT BY SEX.

以上命令将生成一个列联表。如果我们还想对它们的差异进行检验，应该把命令写成：

CROSSTABS TABLES=ACT BY SEX/STATISTIS=1.

结果将会显示列联表、X2、S2值、自由度、显著性等。

6．3 输出结果的解释

SPSS基本操作傻瓜教程

目录一、SPSS界面介绍 (2) 1、如何打开文件 (2) 2、如何在SPSS中打开excel表 (3) 3、数据视图界面 (3) 4、变量视图界面 (4) 二、如何用SPSS进行频数分析 (11) 三、如何用SPSS进行多变量分析 (15) 四、如何对多选题进行数据分析 (18) 1、对多选题进行变量集定义 (18) 2、对多选题进行频数分析 (21) 3、对多选题进行多变量交互分析 (24) 五、如何就SPSS得出的表在excel中作图 (27)

一、SPSS界面介绍提前说明：第一，我这里用的是SPSS 20.0 中文汉化版。第二，我教的是傻瓜操作，并不涉及理论讲解，具体的为什么和用什么理论公式来解释请认真去听《社会统计学》的课程。第三，因为是根据我自己的操作和理解来写的，所以可能有些地方显的不那么科学，仍然要说请大家认真去听《社会统计学》的课程，那个才是权威的。 1、如何打开文件这个东西打开之后界面是这样的：我们打开一个文件：

要提的一点就是，SPSS保存的数据拓展名是.sav： 2、如何在SPSS中打开excel表在上图的下拉箭头里找到excel这个选项：然后你就能找到你要打开的excel表了。 3、数据视图界面我现在打开了一个数据库。可以看到左下角这个地方有两个框，两个是可以互相切换的，跟excel切换表一样，跟excel切换表一样：现在的页面是数据视图，也就是说这一页都是原始数据，这里的一行就是一张问卷，一列就是一个问题，白框里的1234代表的是选项。这个表当时录数据的时候为了方便看，是把ABCD都转换成了1234，所以显示的是1234，当然直接录ABCD也可以，根据具体情况看怎么录，只要能看懂。多选题的录入全部都是细化到每个选项，比如第四题，选项A选了就是“是”，没选就是

SPSS操作步骤汇总

S P S S操作步骤汇总 Company Document number：WUUT-WUUY-WBBGB-BWYTT-1982GT

SPSS学习第一章数据文件的建立数据编码 Type：Numeric：数值型 string：字符串型 Missing： Measure：scale定量变量 nominal定性变量根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if 中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理检查：analysis-description statistic-frequencies—选入要检查的数据—OK 结果：频数统计表—看是否有错误—missing system 清理： 1.对系统缺失值的清理

Data—select case—if condition is satisfied—if—function group（missing）--下面选（missing）--continue—output（delete unselected cases）--OK—对num为哪一位的进行修改 2.对sex=3的清理（直接就清除了） Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output（delete unselected cases）--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式（前后逻辑不相符合的表达式）-- continue-- output（delete unselected cases）--OK—对num为哪一位的进行修改 3.统计描述正态分布统计描述 1、正态性检验：Analysis—nonparametric tests—legacy dialogs—1-sample K-S—one-sample Kolomogorov Smirnov test –normal—ok/ 2、统计描述：Analysis—descriptives--time选入—options—ok 3、按照男女统计描述：data—split file –compare group –sex调入—ok Analysis-descriptive statistic – descriptive—time 调入—options选择—OK非正态分布资料统计描述 1、正态性检验nonparametric 2、Analysis—descriptive statistics—frequencies 选入-- statistics选择—OK 第三章T检验

SPSS中主成分分析的基本操作1

SPSS 中主成分分析的基本操作 Xiaowenzi22与pinksss 共同制作阐述主成分分析法的原理主成分分析是设法将原来众多具有一定相关性（比如P 个指标），重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合，作为新的综合指标。最经典的做法就是用F 1（选取的第一个线性组合，即第一个综合指标）的方差来表达，即Var(F 1)越大，表示F 1包含的信息越多。因此在所有的线性组合中选取的F 1应该是方差最打的，故称F 1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息，再考虑选取F 2即选第二个线性组合，为了有效地反映原来信息，F 1已有的信息就不需要再出现再F 2中，用数学语言表达就是要求Cov(F 1, F 2)=0，则称F 2为第二主成分，依此类推可以构造出第三、第四，……，第P 个主成分。主成分模型： F 1=a 11X 11+a 21X 21+……+a p1X p F 2=a 12X 12+a 22X 22+……+a p2X p …… F p =a 1m X 11+a 2m X 22+……+a pm X p 其中a 1i, a 2i, ……,a pi (i=1,……,m)为X 的协差阵Σ的特征值多对应的特征向量，X 1, X 2, ……, X p 是原始变量经过标准化处理的值（因为在实际应用中，往往存在指标的量纲不同，所以在计算之前先消除量纲的影响，而将原始数据标准化）。 A=(ij a )m p ×=(,1α,2α…,m α),i i i R αλα=, R 为相关系数矩阵, i i αλ、是相应的特征值和单位特征向量, 1λ≥2λ≥…≥p λ≥0 上述方程组要求： 1、a 21i +a 22i +……+a 2pi =1 (i=1,……,m) 2、m I A A =′ (A=(ij a )m p ×=(,1α,2α…,m α)，A 为正交矩阵) 3、Cov(F i ,F j )=ij i δλ, =01 ij δj i j i ≠= 操作步骤：一、数据标准化

SPSS_操作要点整理--详细版解读

Spss操作要点详细版第一章导论——SPSS介绍学习目标：初步认识SPSS软件的内容一、SPSS界面说明 SPSS for Windows是SPSS/PC的Windows版本，具有Windows软件的共同特点，其界面十分友好，打开SPSS程序就会出现图1-2界面。标题栏菜单栏工具栏数据栏标签图1-2 SPSS 11.5 for Windows 界面该界面为SPSS 的数据编辑窗口，其组成部分及主要功能如下： 1。标题栏：功能与其它Windows软件一致。 2．菜单栏：由10个菜单项组成，每个菜单包括一系列功能。各菜单的主要功能如下。 2．1 File：文件操作菜单。单击Fil e，有图1-3下拉菜单，主要功能包括：·New：新建数据编辑窗口、语句窗口、结果输出窗口等； ·Open和Open Database：打开数据编辑窗口、语句窗口、结果输出窗口等； ·Read Text Data：读入文本文件； ·Save和Save As：保存文件； ·Display Data Info：显示数据的基本信息； ·Prin t和Print Preview：将数据管理窗口中的数据以表格的形式打印出来。

图1-3 File菜单项的下拉菜单图1-4 Edit菜单项的下拉菜单 2．2 Edit：文件编辑菜单。主要用于数据编辑，如图1-4，主要功能包括：·UndoRedo或modify cell values：撤消或恢复刚修改过的观测值； ·cut，copy，paste：剪切、拷贝、粘贴指定的数据； ·paste variables：粘贴指定的变量； ·clear：清除所选的观测值或变量； ·find：查找数据。 2．3 View：视图编辑菜单。用于视图编辑，进行窗口外观控制。包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。 2．4 Data：数据文件建立与编辑菜单。主要用于变量和观测量的编辑和整理。如图1-5，主要功能包括： ·Define Variable Properties：定义变量属性； ·Copy Data Properties：复制数据文件属性； ·Insert Variable：插入变量； ·Insert Cases：插入变量或观测值； ·Sort Cases：按照某个变量值重新排列观测值在数据文件中的顺序； ·Transpose：把数据文件的行列进行转置； ·Restructure：数据重组； ·Aggregate：对数据进行分类汇总，即按指定的变量将观测值进行汇总，以求得每组

SPSS基本操作步骤详解

SPSS基本操作步骤详解本文采用SPSS21.0版本，其它版本操作步骤大体相同一、基本步骤（一）检查数据在进行项目分析或统计分析之前，要检核输入的数据文件有无错误，即检核missing。例，“XX量表”采用Likert scale五点量表式填答，每个题项的数据只有五个水平：1,2,3,4,5。 1.执行次数分布表的程序 Analyze（分析）→Descriptive statistics（描述统计）→将题项变量【例，a1—a10】键入至Variables（变量）框中→Frequencies（频率）→Statistics（统计量）→Minimum （最小值）、Maximum（最大值）→Continue(继续)→OK（确定） 2.执行描述统计量的程序 Analyze（分析）→（描述统计）→将题项变量【例，a1—a10】键入至Variables（变量）框中→Descriptives（描述）→Options（选项）→Minimum（最小值）、Maximum（最大值）【此处一般为默认状态即可】→Continue(继续)→OK（确定）（二）反项计分若是分析的预试量表中没有反向题，则此操作步骤可以省略；量表或问卷题中如果有反向题，则在进行题项加总之前将反向题反向计分，否则测量分数所表示的意义刚好相反。例，“XX量表”采用Likert scale五点量表式填答，反向题重向编码计分：1→5,2→4,3→3【可不写】,4→2,5→1。 Transform（转换）→Recode into same Variables（重新编码为相同变量）→将要反向的题目键入至Variables（变量）框中【例，a1，a3，a5】→Old and new values（旧值和新值）→在左边Old value—value中键入1，在右边New value—value中键入5，Add （添加）→……依次进行此步骤……在左边Old value—value中键入5，在右边New value —value中键入1，Add（添加）→Continue(继续)→OK（确定）【注意不同量表计分方式不同，因而反向编码计分也不同，常见的有四点量表、五点量表和六点量表等】（三）题项加总量表题项加总的目的在于便于进行观察值得高低分组。例，“XX量表”采用Likert scale五点量表式填答，题项为：a1，a2……a10，记总分为：az。 Transform（转换）→Computer Variable（计算变量)→在左边Target Variable（目标变量）中键入az，在右边Numeric Expression（数字表达式）中键入a1+a2+……+a10

SPSS操作方法

统计分析软件SPSS操作方法 SPSS for Windows的启动和退出图2 软件启动在鼠标顺序单击“开始”——“程序”——“SPSS 10.0 for Windows”——“SPSS 10.0 for Windows”启动条之后，SPSS启动界面如图2所示。

图3 启动界面如需要退出程序可单击右上角的“×”或左上角“File”下的“Exit”即可退出。如果在本次SPSS期间激活的窗口如DATA窗口、OUTPUT窗口的有关内容已经作为文件存盘，则系统直接退出SPSS系统。否则系统会对各窗口一一提问：是否保存×××窗口的内容。用户可按自己的意愿一一给以回答。随后，结束本次SPSS期间，退出SPSS系统。菜单及窗口介绍由图3所示，SPSS软件的主菜单主要包括10项： ①File：文件操作；②Edit：文件编辑；③View：视图；④Data：数据文件建立与编辑；⑤Transform：数据转换；⑥Analyze：统计分析；⑦Graphs：统计图表的建立与编辑；⑧Utilities：实用程序；⑨Window：窗口控制；⑩Help：帮助。而数据窗口主要包括两部分内容，data view和variable view两个表格，这一点与EXCEL 软件极为相似，data view主要用来显示需要处理的数据，而variable view则用来为数据不同的变量的性质进行设置，如名字name、类型type、宽度width、小数点位数Decimals等。以下为下一级子菜单的介绍。 1 File 鼠标单击“File”后即打开下一级下拉子菜单。共计包括16项。现主要介绍常用的命令。图4 File子菜单 “New”与“Open”命令分别为新建和打开一个文件（包括数据文件data、程序文件syntax、结果文件output、脚本文件script、其他文件other）。需要注意的是SPSS10.0可以直接打开EXCEL2000和数据库的文件（其他还有systat、文本、Lotus等格式的文件）。

spss操作步骤

Data weight cases Analyze->nonparametric test ->binomial

Ok Binomial Test 例7-1

Data weight cases

Ok Analyze->descriptive statistics->crosstabs statistics Continue->ok Chi-Square Tests

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 12.857(b) 1 .000 Continuity Correction(a) 11.392 1 .001 Likelihood Ratio 13.588 1 .000 Fisher's Exact Test .001 .000 Linear-by-Linear Association 12.793 1 .000 N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.48. 7.3 Data weight cases

Analyze->descriptive statistics->crosstabs Continue->ok Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 14.154(b) 1 .000 Continuity Correction(a) 11.836 1 .001 Likelihood Ratio 14.550 1 .000 Fisher's Exact Test .000 .000 Linear-by-Linear Association 13.910 1 .000 McNemar Test .013(c)

SPSS操作步骤

【关于SPSS正确操作步骤】------这东西太有用了~作者：张程龙一、统计报告 l 在线分析处理报告Analyze→Reports→OLAP Cubes l 个案摘要报告Analyze→Reports→Summarize Cases l 行形式摘要报告Analyze→Reports→Report Summaries in Rows l 列形式摘要报告Analyze→Reports→Report Summaries in Columns 二、描述性统计分析 1.频数分析Analyze→Descriptive Statistic→Frequencies (1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形 2.基本描述统计量Analyze→Descriptive Statistic→Descriptives l 集中趋势(Central Tendency)的统计量 l 离散趋势(Dispersion)的统计量 l 分布形态(Distribution)的统计量 3.探索性分析Analyze→Descriptive Statistic→Explore l 茎叶图 l 箱图 l 正态分布检验Q－Q概率图 l 方差齐性检验的散点－分层图 4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs 三、两总体均值比较 l 单样本T检验Analyze→Compare Means→One-Sample T Test l 独立样本T检验Analyze→Compare Means→Independent-Samples T Test l 配对样本T检验Analyze→Compare Means→Paired-Samples T Test 四、方差分析 l 单因素方差分析Analyze→Compare Means→One-way ANOVA l 多因素方差分析Analyze→General Linear Model→Univariate l 协方差分析Analyze→General Linear Model→Univariate u 假设检验的步骤

实验三-IBM-SPSS软件的基本操作

云南大学软件学院实验报告课程：大数据分析及应用任课教师：蔡莉实验指导教师（签名）：学号： 20131170142 姓名：郭昱专业：软件工程日期： 2015/11/01 成绩：实验三 IBM SPSS软件的基本操作一、实验目的 1．熟悉SPSS的菜单和窗口界面，熟悉SPSS 各种参数的设置； 2．掌握SPSS的数据管理功能。二、实验内容及步骤（一）数据的输入和保存 1. SPSS界面当打开SPSS后，展现在我们面前的界面如下：菜单栏工具栏

注意：窗口顶部显示为“SPSS for Windows Data Editor”，表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似，很多操作也与EXCEL类似。 2.定义变量选择菜单Data==>Define Variable。系统弹出定义变量对话框如下：对话框最上方为变量名，现在显示为“VAR00001”，这是系统的默认变量名；往下是变量情况描述，可以看到系统默认该变量为数值型，长度为8，有两位小数位，尚无缺失值，显示对齐方式为右对齐；第三部分为四个设置更改按钮，分别可以设定变量类型、标签、缺失值和列显示格式；第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量，现在系统默认新变量为数值变量；最下方则依次是确定、取消和帮助按钮。

假如有两组数据如下： GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP，然后单击OK按钮。现在SPSS的数据管理窗口如下所示：第一列的名称已经改为了“group”，这就是我们所定义的新变量“group”。现在我们来建立变量X。单击第一行第二列的单元格，然后选择菜单Data==>Define Variable，同样，将变量名改为X，然后确认。此时SPSS的数据管理窗口如下所示：现在，第一、第二列的名称均为深色显示，表明这两列已经被定义为变量，其余各列的名称仍为灰色的“var”，表示尚未使用。同样地，各行的标号也为灰色，表明现在还未输入过数据，即该数据集内没有记录。 3.输入数据我们先来输入变量X的值，请确认一行二列单元格为当前单元格，弃鼠标而用键盘，输入第一

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注：syntax窗口的菜单和SPSS窗口的菜单功能基本一致，区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序二、熟用Paste 按钮在SPSS所有菜单对话框中均有Paste功能，在所有对话框选择完毕后，不选择 OK，而使用Paste，则程序编辑窗口会自动生成程序。此功能使得SPSS编程操作变得简单易行，只需要对生成的程序适当加以修改即可。示例：运用Paste创建一个程序文件。以xuelin.sav.为例，产生P50页的程序语句，并保存在桌面上备用。

该程序文件可以保存，当下次做相同的分析时，无需重新进行复杂的菜单选择，直接在原有程序文件上进行适当的修改，运行即可。三、编程进行对话框无法完成的工作示例１：见书示例２：怎么产生连续自然数１～２００ Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介一、分支语句（条件语句） ①ＩＦ语句ＳＰＳＳ程序格式：ＩＦ逻辑表达式目标表达式逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。注：编程基本小知识： ①每句命令完成后，以点号结束，否则程序不被执行。 ②全部命令编辑完成后，以Execute.结束，否则程序不被执行. ③学会使用help——command syntax reference自学编程。示例１：打开案例数据brain1.sav,要求将年龄小于20，性别为1（男）的病人归为第一组（group=1）. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.（目标表达式）Execute. 示例2：打开案例数据brain1.sav，要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1：将血小板大于等于100的列为组1 练习2：打开brain1.sav，创造一个新的字符型变量sex1，当sex 取值为1时，sex1取值为f, 当sex取值为2时，sex1取值为m. GET

SPSS基本功能及操作

统计分析模型（1）信度分析文献[558] 操作步骤：分析—度量—可靠性分析（R）—移动变量到项目（I）框内—统计量—描述性（项+度量+如果。）—项之间（相关性）—继续—确定信度系数界限值：0．60—0．65认为不可信；0．65—0．70认为是最小可接受值：0．70～0．80认为相当好；0．80—0．90就是非常好。因此，—份信度系数好的量表或问卷最好在0．80以上，0．70—0．80之间还算是可以接受的范围；分量表最好在0．70以上：0．60—0．70之间可以接受。若分量表的内部一致性系数在0．60以下或者总量表的信度系数在0．80以下，应该考虑重新修订量表或增删题目。删除任何题项后的Cronbach’s α系数也无显著提高。可见核心知识性员工激励组合量表的内部一致性高，信度较好。信度分析说明该问卷的整体结构设计具有较高的可信度。由此可以认为，该问卷具有较好的内在信度，依此调查得到的数据是可信的，基于该问卷进行的数据统计分析结果也是比较可靠的。

从工作满意度与员工参与的相关分析结果中可以看出，工作满意度的6个维度均与员工参与有相关关系，且都为正向相关，显著性水平均达到0.05的显著性水平，可证明薪酬激励量表具有较高的收敛效度，可以进行后续研究，他们之间的相关性也可以说明本文的研究具有一定的意义。对比上面相关系数表，项间相关性矩阵中相关系数判别标准：》=0.1(强相关)

（3）频数分析 P66 文献[558] 操作步骤：分析—描述统计—（123）频率（F）—移动变量到变量（V）框内—显示频率表格√—统计量—分布（偏度+峰度）—继续—确定频率也称频数，就是一个变量在各个变量值上取值的个案数。SPSS中的频数分析过程可以方便地产生详细的频数分布表，即对数据按组进行归类整理，形成各变量的不同水平的频数分布表和常用的图形，以便对各变量的数据特征和观测量分布状况有一个概括的认识。描述总体分布形态的统计量主要有偏度和峰度两种。偏度(Skewness)是描述取值分布形态对称性的统计量，由Pearson在1895年提出。偏度由样本的3阶中心矩与样本方差的3／2次方的比值而得，偏度的绝对值越大，表示数据分布的偏斜程度越高。来自正态总体的样本偏度近似为0。偏度系数有两种测量方式，分别为皮尔逊偏度系数1和皮尔逊偏度系数2。偏度系数等于0的时候属于正态分布；偏度系数大于0的时候是右偏分布，表明较低的值占多数；偏度系数小于0的时候为左偏分布，表明较高的值占多数。峰度(Kutosis)是描述变量取值分布形态扁平程度的统计量，由Pearson 在1905年提出。峰度等于0的时候表示数据分布的扁平程度适中，即正态分布；峰度大于0的时候表示数据呈扁平分布；峰度小于0表明数据呈尖峰分布。