文档库 最新最全的文档下载
当前位置:文档库 › SPSS学习资料

SPSS学习资料

SPSS学习资料
SPSS学习资料

SPSS(社会科学统计软件)学习资料

参考书:

SPSS for Windows:Base System User’ s Guide. Marija J. Norusis. SPSS Inc.

卢纹岱等编著:SPSS for Windows 从入门到精通。电子工业出版社,1996年.

SPSS for Windows made Simple. 3rd ed. Paul R. Kinnear & Colin D. Gray

Psychological Press,Ltd.,1999

Electronic Statistical Textbook (from StatSoft) .statsoft./textbook/stathome.html

作业:

必须在次周周一前用电子邮件,磁盘或打印形式交给主讲教师和辅导上机的助教。

讲义:

课前在网上下载或接收电子邮件。

成绩评定方法:

期末考试, 期中考试,和作业,出勤。

期末考试

40%

期中考试

30%

作业,出勤

30%

总成绩

100

第一章数据和文件

1准备分析用数据

1.1数据收集

主要是通过测量方法收集必需的数据。测量方法可以是实验、测验、问卷调查等等。应尽可能包括自己所需要的所有变量,因为从分析中排除不必要的变量比收集附加变量要容易得多。

1.2数据编码

当我们通过问卷或测验收集了很多的数据回来后,接下来的工作就是把这些数据录入到计算机里。为了输入数据简单,一种方法是在录入前用数据或符号表述被试的回答,这就是数据编码。下面是一个编码表:

些特殊信息的Case。

(编码示例)

不管你自己对SPSS使用多么熟悉,在数据录入前对数据进行系统的编码是非常必要的,它可以使你避免混乱,清楚了解数据的意义。

1.3数据文件

SPSS有三种文件:SYNTAX 文件(文本文件,以.sps为后缀)、DATA文件(数

据文件,以.sav为后缀)、OUTPUT文件(结果文件,以.spo为后缀)。SYNTAX 文件主要是保存命令及相关的文本资料;DATA文件则是保存供SPSS统计的数据,只有这种文件里的数据才可以直接进行统计使用;OUTPUT文件保存统计的结果。

SPSS所用的数据文件有很多种,主要是根据自己分析数据的量及每一Case 包括变量多少来选择适当的文件形式。

当数据较少及Case不多时,可以直接在SPSS的数据文件里加入数据。

(录入数据示例)

当数据较多时,一般习惯用一编辑系统来录入数据(如SPSS中的SYNTAX文件),然后再通过定义命令把数据读入统计用的数据文件里。这样录入的速度较快,不过可能不容易查找在录入过程中的错误。这里只介绍用SPSS中的SYNTAX 文件录入数据的方法,并且在以下的其它内容中,也相应只介绍一些习惯的方法。

(录入数据示例)

2数据定义与转换

2.1数据定义(DATA LIST)

在用SPSS中的SYNTAX 文件录入的数据文件中,每一个人的资料都排在一行上(可以多行)。这样任何一个变量的数据都在相同的列里。SPSS在使用这些数据时,必须对这些数据进行定义。即告诉计算机各列数据代表什么。

DATA LIST命令用以给变量命名,并定义它们在Case中的位置和属性,把数据变成能被SPSS命令或过程使用的现用文件。下面只介绍用固定格式引用外部数据文件的命令:

DATA LIST FILE=‘C:\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-7

a1 to a10 8-17.

FILE子命令指定从外部文件C:\YLX\STRESS.SPS读入数据。接着是各个变量的名称及所在位置(字符宽)。

(1)当数据里有小数应该怎么表示?

如,语文成绩里有85.3分,小数点不用录入,我们只要在程式里告诉电脑哪位是小数就可以了。如:

DATA LIST FILE=‘C:\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-8(1) a1 to a10 9-18....

chi 6-8(1)中括号里的1表示有一位小数。如果是两位小数就用(2)。

(2)当你的数据中每个被试的数据有两行或者多行时应该怎么办?

下面的例子是一个case有三行数据的情况:

data list file='d:\data\2002\study.sps'records=3/1 school 1 numb 2-3 sex 4 grade 5 chinese 6-7 math 8-9 english 10-11 s1 to s60 12-71

/2 s61 to s90 1-30 b1 to b44 31-74

/3 a1 to a41 1-41 d1 to d42 42-83.

用records=3指明每个被试有三行数据,在定义的时候,用/1 /2 /3 指明是第几行的数据。

(结合学生前面录入的数据示例)

2.2变量值的重编码(RECODE)

在统计数据处理时,经常需要对数据进行某些变换以适应不同处理的要求。所谓数据变换是利用现存变量,或改变它们的值,或利用它们产生新的变量。

RECODE可以对现存变量的值作指定的变换。如我们有一个题目是:“我不能满足学生的期待。”要求老师在下面五个选择中选一个“1从来没有、2很少、3有时、4经常、5总是”。我们在录入数据时只是按老师选择的数字录入。但现在我们想统计“有时+经常+总是”和“从来没有+很少”的人数及比例。这时我们可以用RECODE命令进行变换。

RECODE ITEM1(1,2=1)(3,4,5=2).

这样我们就用1代表“从来没有+很少”,用2 代表“有时+经常+总是”。

另,如年龄这一变量,我们可能在录入时是按实际年龄的数字录入,但如果我们想把它们分老、中、青三组以比较三种年龄的人的差异时,就可以用RECODE 命令对原数据中的年龄变量进行变换。

RECODE AGE(LO THRU 35=1)(36 THRU 45=2)(46 THRU HI=3).

把最小到35岁为青年组,用1表示;36到45岁为中年组,用2 表示;46到最老为老年组,用3 表示;这样就对原来变量的值重新进行了编码。

这里大家应该记住:THRU表示“至”。第一个命令里是确定的值“(1,2=1)”,而第二个命令是一个范围“(LOWEST THRU 35=1)”。

(结合学生前面录入的数据示例)

2.3计算变量(COMPUTE)

有时我们想对数据进行组合,形成一个新的变量。如我们用10道题来测量学生对学校的态度,但我们并不想对这10道题进行一一的分析,我们想对它们进行合并来说明该学生对学校的态度情况。这时我们可以用COMPUTE命令来组合成新的变量。

COMPUTE ATTITUDE=(ITEM1+ITEM2+ITEM3+ITEM4+...+ITEM10)/10.

把十个项目的分析的相加的平均分成一个新的变量ATTITUDE。也可以是其它的运算关系,如减、乘、除、平方、开方等。

当然你可以不除以10,这样得到的是10道题的总分,除以10是项目平均分。但有时因为可能有几个维度,而这几个维度的项目数不一样多,我们又想比较各维度的水平,这时我们除以项目数,得到项目平均分以利于比较。

又如你用学生的语文、数学、英语三科的总成绩作为学生的学业成绩。

compute total=chinese+math+english.

除以3就可以得到平均每科的成绩。写成:

compute total=(chinese+math+english)/3.

(结合学生前面录入的数据示例)

2.4条件变换(IF)

IF命令根据逻辑条件执行类似于recode的变换。如当我们想把男生且考试分数不合格的作一组,男生且考试分数合格至良好的作一组,男生且考试分数优秀的作一组,以比较三组学生在某一方面的差异时,我们可以用IF命令来形成一个新的变量。

IF(SEX=1 AND SCORE<=60)SEXSC=1.

IF(SEX=1 AND SCORE>60 AND SCORE<=80)SEXSC=2.

IF(SEX=1 AND SCORE>80)SEXSC=3.

这样我们就变换成一个新的变量SEXSC,进而比较SEXSC在某一方面的差异,即上述三组学生的差异。

(结合学生前面录入的数据示例)

当然,我们可以IF命令来获得很多种我们想要的变换。注意和RECODE的差异。其实RECODE AGE(LO THRU 35=1)(36 THRU 45=2)(46 THRU HI=3).也可以用IF来实现:

IF(AGE<=35)AGE1=1.

IF(AGE>35 AND AGE<=45)AGE1=2.

IF(AGE>45)AGE1=3.

不过,这样就会产生了一个新的变量“AGE1”,当然原来的变量“AGE”也保持不变。

(结合学生前面录入的数据示例)

2.5缺失数据的定义(MISSING)

我们在做调查时,经常遇到一些被试对某一问题漏答的情况。但由于该被试的其他资料还是可以用的,不想把他剔除。在编码时,我们用一个答案上没有的数字表示缺失。一般习惯是用“0”、“9”或“00”、“99”等,但注意这些数字必须是答案中没有的,否则重复了会把原来具有其它意义的变成了缺失。

在用SPSS进行统计,我们就必须告诉计算机,某一变量如果数值是“0”、“9”或“00”、“99”时,就表示缺失。如某些学生忘记填写性别,我们用9来表示缺失。

MISSING VALUE SEX(9).

告诉计算机,当SEX是9时,表明该学生没有填写性别。在做涉及到该变量的某些计算时,如比较男女学生的差异,可以考虑剔除丢失该变量资料的人。

第二章描述统计过程

1频数

这是对数据的一般整理,了解样本的分布:离散性、变异性和规律性。统计学中的分布是指一个变量的各种情况或取值出现的次数或频数,所以又叫做频数分布。如家长的职业,我们可以用变量名“JOB”,不同的职业我们给予不同的数字表示:1-干部、2-教师、3-研究员等,分布是指被调查的学生中各种职业的家长数。频数分布反映出落入每一组的观察值个数。还可以用分数、小数或百分数表示。

1.1命令FREQUENCES

FREQUENCES计算单个变量值的频数、百分数和各种描述统计量。如上述,我

们要计算各种职业的父母的人数。

FREQUENCES VARIABLES=JOB. (可以简写成:FRE VAR=JOB.)

1.2输出结果的解释

Statistics

1.3分位点的确定—子命令PERCENTILES和NTILE

利用子命令PERCENTILES和NTILE得到所有待分析变量的百分位数。如果指定多个PERCENTILES和NTILE子命令,显示所有选择的百分位数的一个表。

1.3.1 PERCENTILES子命令

PERCENTILES子命令显示落在指定值(或者值列表)的case的百分数。如命令:FREQUENCES VARIABLES=SCORE /PERCENTILES=10 25 50 75.

计算变量SCORE在百分位点10,25,50,75的值。

1.3.2 N分位点—NTILE子命令

NTILE计算百分数,它把一个分布划分成指定类数。并显示一个值,case的请求百分数落在那个值下。如:

FREQ VAR=math/NTILE=4.

确定math的四分位点值。

2平均数、标准差、最大/最小值

某一变量得分的平均数、标准差及最大/最小值,可以说明数据的一般情况:均数、离散程度等信息。计算这些数据的命令是DESCRIPTIVES或MEANS。

2.1命令DESCRIPTVES

DESCRPTIVES可以计算单个数值变量的描述性统计量,包括平均数、标准差、最大/最小值等。如我们想了解学生语文考试的平均分与标准差,就可以用

DESCRIPTIVES命令来计算。

DESCRPTIVES VARIABLES=CHINESE.(可以简写成:DES VAR=CHINESE.)

输出结果的解释:

如果我们想还同时知道数学、英语等科的平均数分与标准差,可以把该命令写成:

DESCRIPITVES VARIABLES=CHINESE MATH ENGLISH.

计算机就会同时告诉我们这三门学科学生的平均等分、标准差、最大/最小值、有效Case数等。

输出结果的解释:

2.2命令MEANS

MEAANS与DESCRIPITVES不同,MEANS是计算由一个或多个独立变量定义的分组内,因变量的平均数、标准差和组数。

如我们要了解男女学生的语文、数学和英语的平均数、标准差等,就可以用MEANS计算。

MEANS TABLES= CHINESE MATH ENGLISH BY SEX.

执行这一命令,会给出男女学生的语文、数学和英语的平均分、标准差等。

MEANS命令还可以计算更多的变量的分组。如不同性别、不同年级学生的语文成绩平均数与标准差等。命令可写成:

MEANS TABLES= CHINESE BY SEX BY GRADE.

输出结果的解释:

Report

CHINESE

第三章相关分析和回归分析

1相关

1.1相关分析的意义

我们常用相关系数来表示两变量的关系程度。当然我们在计算相关,应该考虑这两个变量之间的关系是否线性。如果不是线性的关系,而使用相关系数来表示两变量间的关系的话,就会错误估计它们的关系。如生活压力与心理健康之间的关系,很多研究结果都表明,它们之间关系应该是一倒U型的曲线,也就是非线性的关系。因此,我们就不能用相关系数来表示它们之间关系的量。但很多变量之间关系是线性的,如学习的努力程度与学习成绩的关系,我们可以用相关系数来说明它们之间关系的程度。当然,计算相关有很多种公式,对公式的选择与变量的性质有关:是连续变量还是二分变量或是等级变量等等。一般没有注明的时候是用皮尔逊积差相关。

1.2命令CORRELATION

如我们要计算学生的语文成绩(CHINESE)与英语成绩(ENGLISH)之间的关系,

可以用以下命令:

CORRELATION VARIABLES=CHINESE WITH ENGLISH.

输出结果的解释:

这一命令还可以同时计算多个变量与多个变量两两之间的相关。如语文成绩、数学成绩、英语成绩之间的两两相关,可以用如下命令:

CORRELATION VARIABLES=CHINESE MATH ENGLISH WITH CHINESE MATH ENGLISH.

或:CORRELATION VARIABLES=CHINESE MATH ENGLISH.

输出结果的解释:

结果除给出两两相关系数(相关矩阵)外,还显示出双尾显著性检测的结果。

SPSS可以指定所用的相关公式,如果没有指定,一般默认为皮尔逊积差相关。用什么公式,应该要根据数据来决定。

2回归分析

回归分析的目的是建立两列或多列变量之间的数量关系模型(即回归方程)。也就是确定了自变量与因变量的关系模型,利用这个数学模型,我们可以从一个变量或多个变量来预测或估计另一个变量的变化。例如,我们知道学习基础(X)对成绩(Y)有密切关系,我们想建立一个回归方程,根据学生原来的学习水平高低来估计其未来成绩:Y=a+bX。这里所提到的是指线性关系的,而对于非线性关系的回归,则是另一回事。

2.2 命令REGRESSION

REGRESSION是计算多元回归的命令。提供五种建立回归方程的方法:向前选择(Rorward)、向后剔除(Backward)、逐步选择(Stepwise)、强制进入(Enter)和强制剔除(Remove)。假如我们用逐步选择方法进行回归分析,命令格式如下:REGRESSION VARIABLES={varlist}/dependent=varlist/method=stepwise.

或:

REGRESSION

/DEPENDENT varlist

/METHOD=STEPWISE varlist.

DEPENDENT里的变量名必须在前面的变量名里。一般如果不指定方法,即为默认的逐步选择方法。

2.3 输出结果的解释

第四章差异检验

1 两组平均数的差异检验

1.1 平均数的差异检验的意义

当我们想检验两样本之间是否存在差异,可以使用平均数的差异检验。例如比较男女学生在数学学习上是否存在差异。一般我们可以用T检验来证明两组是否差异显著。

1.2 命令T-TEST

T-TEST用以检验独立样本或配对样本的平均数差异显著性。当两列变量的样本不一样时,统计是不同的。

1.3 独立样本

例如:比较男女学生在学习上(包括数学、语文、英语成绩)是否存在差异。

T-TEST GROUPS=SEX(1,2)/VARIABLES=MATH CHINESE ENGLISH.

结果会告诉我们男女学生在数学、语文、英语三门学科的平均数、标准差、T 值、显著水平。

1.4 相关样本:

例如:为了比较单眼与双眼对深度知觉的影响,50名学生分别用单眼与双眼

进行了实验,等到单眼观察的一列数(A)双眼观察的一列数(B).我们比较这两列数的差异是否显著,以了解单、双眼对深度知觉的差异。

T-TEST PAIRS=A WITH B.

结果会给出两列数的平均数、标准差、T值、显著水平等。

1.5 输出结果的解释

2 单因素方差分析

2.1 单因素方差分析的意义

但大多数时,我们要比较不止两组平均数的差异,而可能是两个以上的样本平均数。这种多个样本平均数差异的检验需要通过方差分析进行。在这种意义上,可以把方差分析看作T检验扩展。有很多也用T检验来两两样本进行差异检验,但这是不对的。

2.2命令ONEWAY

ONEWAY命令用以检验单因素的几个组间的差异。例如,要比较初一、初二、初三学生心理健康(SCL)是否存在差异,可用如下命令格式:

ONEWAY VARIABLES=SCL BY GRADE(1,3).

执行这一命令后,计算机会告诉我们三个年级学生在心理健康上的是否存在差异,即给出F值、显著性水平等。

2.3 输出结果的解释

2.4 多重比较

但当三个年级之间存在显著差异时,我们并不知道哪两个年级之间差异显著或差异不显著。这就需要进行多重比较。命令格式为:

ONEWAY VARIABLES=SCL BY GRADE(1,3)/RANGE=SCHEEFE.

多重比较的方法有好几种,可以根据需要选择。我们一般用费舍法或涂凯法。以上是用费舍法。执行以上命令,会告诉我们F值、显著性水平,如果差异显著,还会告诉我们各组的平均及哪两组之间差异显著。

3 多因素方差分析

3.1 多因素方差分析的意义

前面介绍的方差点分析是属于单因素实验设计,即实验中只有一个自变量。但心理的影响因素是多种的,单因素设计只是人为地只取一个因素作为自变量。大多数情况下,是多因素的设计。例如:不同的教学方法(因素A)和不同的教学态

度(因素B)对学生的学习成绩(因变量)的影响。这种情况下,我们必须使用多因素方差分析方法对自变量的影响进行检验。

3.2 命令ANOVA

ANOVA执行多因素实验设计的方差分析,一个ANOVA可以分析多个因素(多个自变量)和几个因变量。例如:我们考察不同年级(初一、初二、初三)、不同性别(男、女)学生心理健康情况的差异,可用以下命令格式工:

ANOVA VARLABLES=SCL BY GRADE(1,3)SEX(1,2).

执行这一命令,会给出一个方差分析表,包括各因素的效应的F值、显著性、因素间的交互作用的效应的检验。若交互作用效应不显著,主效应的检验是非常重要的,但当交互作用显著时,主效应的检验意义就不大了。

3.3 输出结果的解释

第五章因子分析

1 因子分析的意义

因子分析的目的是用少数几个变量(即因子)去代替原来较多的变量间,而这些较少的变量应该尽可能反映原来变量的信息。因子分析主要是基于这样的思想:根据相关性的大小把变量分组,使得同组内的变量之间相关较高,不同组变量间的相关较低。这样每变量代表一个基本结构,或称因子。如SCL-90,有90道题,也即个原来的变量,我们对那么多的变量进行分析的话会太每繁且不容易清楚。因此,我们可以通过因子分析的方法,发现阶段这90个变量可以归于9个因子。这样我们就可以对象9个因子进行分析,以代替90个变量。

2 命令FACTOR

FACTOR可以完成因子分析的工作。如上例,对SCL-90的题的结果进行因子分析。

FACTOR VARIABLES=ITEM1 TO ITEM90.

执行这一命令,计算机会对象90个题进行因子分析。告诉我们各题的共同性、因素矩阵、解释量、因素负荷等。但因为分析较为繁复,需要较大的内存,当题目太多时可能做不了。

我们还可以选择因子提取方法、因子数及因素旋转方法(正交、斜交)等。

3 因子数的确定

我们可以确定我们所需的因子个数。确定因子个数的方法主要有两种:根据特征与根据碎石图。一般以特征值大于等于1为原则选取因子数。也可根据碎石图的明显折点确定因子个数。

4 输出结果的解释

第六章 X2检验

1 X2检验的意义

前面所介绍的统计方法,基本都是针对连续变量的。但在很多时候,研究问题只能划分为不同性质的类别,各类别之间没有量的联系。例如:性别分为男、女,职业可以分为干部、教师、...,教师的职称又可分为教授,副教授、讲师...等。另外,有些问题虽然有量的关系,因研究需要将其按一定的标准分为不同的类别。例如学习成绩、能力水平等等,都有连续性的数量描述它们,只是研究者依一定标准将其划分为优、良、中、差等少数类别。这样的数据我们称为计数数据。这种数据不能使用前面所介绍的统计方法进行统计。对计数数据的统计方法是X2检验。

例如:某校对学生的课外活动内容进行调查,结果整理成一个二维表,示于表达式。

表1 课外活动调查表

课外活动内容

和三类(体育、文娱、阅读)。这就是一个列联表。我们的问题也许是想看看男女学生的课外活动内容是否有差异?这时就应该用X2检验。

6.2命令CROSSTABS

要产生列联表和对计数数据进行差异检验,SPSS里用CROSSTABS命令来执行。CROSSTABS可以产生两个或多个变量的列联表。如上例,我们只需把各个Case的命令就可以生成上述的列联表。

CROSSTABS TABLES=ACT BY SEX.

以上命令将生成一个列联表。如果我们还想对它们的差异进行检验,应该把命令写成:

CROSSTABS TABLES=ACT BY SEX/STATISTIS=1.

结果将会显示列联表、X2、S2值、自由度、显著性等。

6.3 输出结果的解释

SPSS基本操作傻瓜教程

目录 一、SPSS界面介绍 (2) 1、如何打开文件 (2) 2、如何在SPSS中打开excel表 (3) 3、数据视图界面 (3) 4、变量视图界面 (4) 二、如何用SPSS进行频数分析 (11) 三、如何用SPSS进行多变量分析 (15) 四、如何对多选题进行数据分析 (18) 1、对多选题进行变量集定义 (18) 2、对多选题进行频数分析 (21) 3、对多选题进行多变量交互分析 (24) 五、如何就SPSS得出的表在excel中作图 (27)

一、SPSS界面介绍 提前说明:第一,我这里用的是SPSS 20.0 中文汉化版。第二,我教的是傻瓜操作,并不涉及理论讲解,具体的为什么和用什么理论公式来解释请认真去听《社会统计学》的课程。第三,因为是根据我自己的操作和理解来写的,所以可能有些地方显的不那么科学,仍然要说请大家认真去听《社会统计学》的课程,那个才是权威的。 1、如何打开文件 这个东西打开之后界面是这样的: 我们打开一个文件:

要提的一点就是,SPSS保存的数据拓展名是.sav: 2、如何在SPSS中打开excel表 在上图的下拉箭头里找到excel这个选项: 然后你就能找到你要打开的excel表了。 3、数据视图界面 我现在打开了一个数据库。 可以看到左下角这个地方有两个框,两个是可以互相切换的,跟excel切换表一样,跟excel切换表一样: 现在的页面是数据视图,也就是说这一页都是原始数据,这里的一行就是一张问卷,一列就是一个问题,白框里的1234代表的是选项。这个表当时录数据的时候为了方便看,是把ABCD都转换成了1234,所以显示的是1234,当然直接录ABCD也可以,根据具体情况看怎么录,只要能看懂。 多选题的录入全部都是细化到每个选项,比如第四题,选项A选了就是“是”,没选就是

SPSS操作步骤汇总

S P S S操作步骤汇总 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

SPSS学习 第一章数据文件的建立 数据编码 Type:Numeric:数值型 string:字符串型 Missing: Measure:scale定量变量 nominal定性变量 根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if 中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理 检查:analysis-description statistic-frequencies—选入要检查的数据—OK 结果:频数统计表—看是否有错误—missing system 清理: 1.对系统缺失值的清理

Data—select case—if condition is satisfied—if—function group(missing)--下面选 (missing)--continue—output(delete unselected cases)--OK—对num为哪一位的进行修改 2.对sex=3的清理(直接就清除了) Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式(前后逻辑不相符合的表达式)-- continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 3.统计描述 正态分布统计描述 1、正态性检验:Analysis—nonparametric tests—legacy dialogs—1-sample K-S—one-sample Kolomogorov Smirnov test –normal—ok/ 2、统计描述:Analysis—descriptives--time选入—options—ok 3、按照男女统计描述:data—split file –compare group –sex调入—ok Analysis-descriptive statistic – descriptive—time 调入—options选择—OK非正态分布资料统计描述 1、正态性检验nonparametric 2、Analysis—descriptive statistics—frequencies 选入-- statistics选择—OK 第三章T检验

SPSS中主成分分析的基本操作1

SPSS 中主成分分析的基本操作 Xiaowenzi22与pinksss 共同制作 阐述主成分分析法的原理 主成分分析是设法将原来众多具有一定相关性(比如P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。最经典的做法就是用F 1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F 1)越大,表示F 1包含的信息越多。因此在所有的线性组合中选取的F 1应该是方差最打的,故称F 1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F 2即选第二个线性组合,为了有效地反映原来信息,F 1已有的信息就不需要再出现再F 2中,用数学语言表达就是要求Cov(F 1, F 2)=0,则称F 2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分。 主成分模型: F 1=a 11X 11+a 21X 21+……+a p1X p F 2=a 12X 12+a 22X 22+……+a p2X p …… F p =a 1m X 11+a 2m X 22+……+a pm X p 其中a 1i, a 2i, ……,a pi (i=1,……,m)为X 的协差阵Σ的特征值多对应的特征向量,X 1, X 2, ……, X p 是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。 A=(ij a )m p ×=(,1α,2α…,m α),i i i R αλα=, R 为相关系数矩阵, i i αλ、是相应的特征值和单位特征向量, 1λ≥2λ≥…≥p λ≥0 上述方程组要求: 1、a 21i +a 22i +……+a 2pi =1 (i=1,……,m) 2、m I A A =′ (A=(ij a )m p ×=(,1α,2α…,m α),A 为正交矩阵) 3、Cov(F i ,F j )=ij i δλ, =01 ij δj i j i ≠= 操作步骤: 一、 数据标准化

SPSS_操作要点整理--详细版解读

Spss操作要点详细版 第一章导论——SPSS介绍 学习目标:初步认识SPSS软件的内容 一、SPSS界面说明 SPSS for Windows是SPSS/PC的Windows版本,具有Windows软件的共同特点,其界面十分友好,打开SPSS程序就会出现图1-2界面。 标题栏 菜单栏 工具栏 数据栏 标签 图1-2 SPSS 11.5 for Windows 界面 该界面为SPSS 的数据编辑窗口,其组成部分及主要功能如下: 1。标题栏:功能与其它Windows软件一致。 2.菜单栏:由10个菜单项组成,每个菜单包括一系列功能。各菜单的主要功能如下。 2.1 File:文件操作菜单。单击Fil e,有图1-3下拉菜单,主要功能包括:·New:新建数据编辑窗口、语句窗口、结果输出窗口等; ·Open和Open Database:打开数据编辑窗口、语句窗口、结果输出窗口等; ·Read Text Data:读入文本文件; ·Save和Save As:保存文件; ·Display Data Info:显示数据的基本信息; ·Prin t和Print Preview:将数据管理窗口中的数据以表格的形式打印出来。

图1-3 File菜单项的下拉菜单 图1-4 Edit菜单项的下拉菜单 2.2 Edit:文件编辑菜单。主要用于数据编辑,如图1-4,主要功能包括:·UndoRedo或modify cell values:撤消或恢复刚修改过的观测值; ·cut,copy,paste:剪切、拷贝、粘贴指定的数据; ·paste variables:粘贴指定的变量; ·clear:清除所选的观测值或变量; ·find:查找数据。 2.3 View:视图编辑菜单。用于视图编辑,进行窗口外观控制。包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。 2.4 Data:数据文件建立与编辑菜单。主要用于变量和观测量的编辑和整理。如图1-5,主要功能包括: ·Define Variable Properties:定义变量属性; ·Copy Data Properties:复制数据文件属性; ·Insert Variable:插入变量; ·Insert Cases:插入变量或观测值; ·Sort Cases:按照某个变量值重新排列观测值在数据文件中的顺序; ·Transpose:把数据文件的行列进行转置; ·Restructure:数据重组; ·Aggregate:对数据进行分类汇总,即按指定的变量将观测值进行汇总,以求得每组

SPSS基本操作步骤详解

SPSS基本操作步骤详解 本文采用SPSS21.0版本,其它版本操作步骤大体相同 一、基本步骤 (一)检查数据 在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。 例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。 1.执行次数分布表的程序 Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定) 2.执行描述统计量的程序 Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定) (二)反项计分 若是分析的预试量表中没有反向题,则此操作步骤可以省略; 量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。 例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。 Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】 (三)题项加总 量表题项加总的目的在于便于进行观察值得高低分组。 例,“XX量表”采用Likert scale五点量表式填答,题项为:a1,a2……a10,记总分为:az。 Transform(转换)→Computer Variable(计算变量)→在左边Target Variable(目标变量)中键入az,在右边Numeric Expression(数字表达式)中键入a1+a2+……+a10

SPSS操作方法

统计分析软件SPSS操作方法 SPSS for Windows的启动和退出 图2 软件启动 在鼠标顺序单击“开始”——“程序”——“SPSS 10.0 for Windows”——“SPSS 10.0 for Windows”启动条之后,SPSS启动界面如图2所示。

图3 启动界面 如需要退出程序可单击右上角的“×”或左上角“File”下的“Exit”即可退出。如果在本次SPSS期间激活的窗口如DATA窗口、OUTPUT窗口的有关内容已经作为文件存盘,则系统直接退出SPSS系统。否则系统会对各窗口一一提问:是否保存×××窗口的内容。用户可按自己的意愿一一给以回答。随后,结束本次SPSS期间,退出SPSS系统。 菜单及窗口介绍 由图3所示,SPSS软件的主菜单主要包括10项: ①File:文件操作;②Edit:文件编辑;③View:视图;④Data:数据文件建立与编辑;⑤Transform:数据转换;⑥Analyze:统计分析;⑦Graphs:统计图表的建立与编辑;⑧Utilities:实用程序;⑨Window:窗口控制;⑩Help:帮助。 而数据窗口主要包括两部分内容,data view和variable view两个表格,这一点与EXCEL 软件极为相似,data view主要用来显示需要处理的数据,而variable view则用来为数据不同的变量的性质进行设置,如名字name、类型type、宽度width、小数点位数Decimals等。以下为下一级子菜单的介绍。 1 File 鼠标单击“File”后即打开下一级下拉子菜单。共计包括16项。现主要介绍常用的命令。 图4 File子菜单 “New”与“Open”命令分别为新建和打开一个文件(包括数据文件data、程序文件syntax、结果文件output、脚本文件script、其他文件other)。需要注意的是SPSS10.0可以直接打开EXCEL2000和数据库的文件(其他还有systat、文本、Lotus等格式的文件)。

spss操作步骤

Data weight cases Analyze->nonparametric test ->binomial

Ok Binomial Test 例7-1

Data weight cases

Ok Analyze->descriptive statistics->crosstabs statistics Continue->ok Chi-Square Tests

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 12.857(b) 1 .000 Continuity Correction(a) 11.392 1 .001 Likelihood Ratio 13.588 1 .000 Fisher's Exact Test .001 .000 Linear-by-Linear Association 12.793 1 .000 N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.48. 7.3 Data weight cases

Analyze->descriptive statistics->crosstabs Continue->ok Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 14.154(b) 1 .000 Continuity Correction(a) 11.836 1 .001 Likelihood Ratio 14.550 1 .000 Fisher's Exact Test .000 .000 Linear-by-Linear Association 13.910 1 .000 McNemar Test .013(c)

SPSS操作步骤

【关于SPSS正确操作步骤】------这东西太有用了~作者:张程龙 一、统计报告 l 在线分析处理报告Analyze→Reports→OLAP Cubes l 个案摘要报告Analyze→Reports→Summarize Cases l 行形式摘要报告Analyze→Reports→Report Summaries in Rows l 列形式摘要报告Analyze→Reports→Report Summaries in Columns 二、描述性统计分析 1.频数分析Analyze→Descriptive Statistic→Frequencies (1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形 2.基本描述统计量Analyze→Descriptive Statistic→Descriptives l 集中趋势(Central Tendency)的统计量 l 离散趋势(Dispersion)的统计量 l 分布形态(Distribution)的统计量 3.探索性分析Analyze→Descriptive Statistic→Explore l 茎叶图 l 箱图 l 正态分布检验Q-Q概率图 l 方差齐性检验的散点-分层图 4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs 三、两总体均值比较 l 单样本T检验Analyze→Compare Means→One-Sample T Test l 独立样本T检验Analyze→Compare Means→Independent-Samples T Test l 配对样本T检验Analyze→Compare Means→Paired-Samples T Test 四、方差分析 l 单因素方差分析Analyze→Compare Means→One-way ANOVA l 多因素方差分析Analyze→General Linear Model→Univariate l 协方差分析Analyze→General Linear Model→Univariate u 假设检验的步骤

实验三-IBM-SPSS软件的基本操作

实验三-IBM-SPSS软件的基本操作

云南大学软件学院 实验报告 课程:大数据分析及应用任课教师:蔡莉实验指导教师(签名): 学号: 20131170142 姓名:郭昱专业:软件工程日期: 2015/11/01 成绩: 实验三 IBM SPSS软件的基本操作 一、实验目的 1.熟悉SPSS的菜单和窗口界面,熟悉SPSS 各种参数的设置; 2.掌握SPSS的数据管理功能。 二、实验内容及步骤 (一)数据的输入和保存 1. SPSS界面 当打开SPSS后,展现在我们面前的界面如下: 菜单栏 工具栏

注意:窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似,很多操 作也与EXCEL类似。 2.定义变量 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

假如有两组数据如下: GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 现在SPSS的数据管理窗口如下所示: 第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。 现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示: 现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。 3.输入数据 我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门 一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注:syntax窗口的菜单和SPSS窗口的菜单功能基本一致,区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序 二、熟用Paste 按钮 在SPSS所有菜单对话框中均有Paste功能,在所有对话框选择完毕后,不选择 OK,而使用Paste,则程序编辑窗口会自动生成程序。 此功能使得SPSS编程操作变得简单易行,只需要对生成的程序适当加以修改即可。 示例:运用Paste创建一个程序文件。以xuelin.sav.为例,产生P50页的程序语句,并保存在桌面上备用。

该程序文件可以保存,当下次做相同的分析时,无需重新进行复杂的菜单选择,直接在原有程序文件上进行适当的修改,运行即可。 三、编程进行对话框无法完成的工作 示例1:见书 示例2:怎么产生连续自然数1~200 Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介 一、分支语句(条件语句) ①IF语句 SPSS程序格式: IF逻辑表达式目标表达式 逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。 注:编程基本小知识: ①每句命令完成后,以点号结束,否则程序不被执行。 ②全部命令编辑完成后,以Execute.结束,否则程序不被执行. ③学会使用help——command syntax reference自学编程。 示例1:打开案例数据brain1.sav,要求将年龄小于20,性别为1(男)的病人归为第一组(group=1). GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.(目标表达式)Execute. 示例2:打开案例数据brain1.sav,要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1:将血小板大于等于100的列为组1 练习2:打开brain1.sav,创造一个新的字符型变量sex1,当sex 取值为1时,sex1取值为f, 当sex取值为2时,sex1取值为m. GET

SPSS基本功能及操作

统计分析模型 (1)信度分析文献[558] 操作步骤:分析—度量—可靠性分析(R)—移动变量到项目(I)框内—统计量—描述性(项+度量+如果。)—项之间(相关性)—继续—确定 信度系数界限值:0.60—0.65认为不可信;0.65—0.70认为是最小可接受值:0.70~0.80认为相当好;0.80—0.90就是非常好。因此,—份信度系数好的量表或问卷最好在0.80以上,0.70—0.80之间还算是可以接受的范围;分量表最好在0.70以上:0.60—0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应该考虑重新修订量表或增删题目。 删除任何题项后的Cronbach’s α系数也无显著提高。可见核心知识性员工激励组合量表的内部一致性高,信度较好。信度分析说明该问卷的整体结构设计具有较高的可信度。由此可以认为,该问卷具有较好的内在信度,依此调查得到的数据是可信的,基于该问卷进行的数据统计分析结果也是比较可靠的。

从工作满意度与员工参与的相关分析结果中可以看出,工作满意度的6个维度均与员工参与有相关关系,且都为正向相关,显著性水平均达到0.05的显著性水平,可证明薪酬激励量表具有较高的收敛效度,可以进行后续研究,他们之间的相关性也可以说明本文的研究具有一定的意义。 对比上面相关系数表,项间相关性矩阵中相关系数判别标准:》=0.1(强相关)

(3)频数分析 P66 文献[558] 操作步骤:分析—描述统计—(123)频率(F)—移动变量到变量(V)框内—显示频率表格√—统计量—分布(偏度+峰度)—继续—确定 频率也称频数,就是一个变量在各个变量值上取值的个案数。SPSS中的频数分析过程可以方便地产生详细的频数分布表,即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用的图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。描述总体分布形态的统计量主要有偏度和峰度两种。偏度(Skewness)是描述取值分布形态对称性的统计量,由Pearson在1895年提出。偏度由样本的3阶中心矩与样本方差的3/2次方的比值而得,偏度的绝对值越大,表示数据分布的偏斜程度越高。来自正态总体的样本偏度近似为0。偏度系数有两种测量方式,分别为皮尔逊偏度系数1和皮尔逊偏度系数2。偏度系数等于0的时候属于正态分布;偏度系数大于0的时候是右偏分布,表明较低的值占多数;偏度系数小于0的时候为左偏分布,表明较高的值占多数。峰度(Kutosis)是描述变量取值分布形态扁平程度的统计量,由Pearson 在1905年提出。峰度等于0的时候表示数据分布的扁平程度适中,即正态分布;峰度大于0的时候表示数据呈扁平分布;峰度小于0表明数据呈尖峰分布。

相关文档