文档库 最新最全的文档下载
当前位置:文档库 › spss教程第十三章

spss教程第十三章

spss教程第十三章
spss教程第十三章

第十三章活着--Survival菜单详解(上)

(医学统计之星:董伟)

上次更新日期:

13.1 Life Tables过程

13.1.1界面说明

13.1.2 结果解释

13.2 Kaplan-Meier过程

13.2.1 界面说明

13.2.2结果解释

13.3 Cox Regression过程

13.3.1界面说明

13.3.2结果解释

13.4 Cox w/Time-Dep Cov过程

13.4.1界面说明

13.4.2 结果解释

对于急性病的疗效考核,一般可以用治愈率、病死率等指标来评价,但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,这时可以对病人进行长期随访,统计一定期限后的生存和死亡情况以判断疗效,这就是生存分析。

生存分析是用于以处理生存时间(survival time)为反应变量、含有删失数

据一类资料的统计方法。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地说,“死亡”可定义为某研究目的“结果”的发生,如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各“死亡”为失效)。此类资料的生存时间变量多不符从正态分布,且常含有删失值,故不

适于用传统的数据分析方法如t检验或线性回归进行分析。根据不同的研究目的

和资料类型,可采用不同的分析方法,如寿命表、Kaplan-Meier法、Cox回归模型等分析方法进行分析。而这正是下面我将要给大家介绍的主要内容。

“喂,你在这里说的都是些什么呀?又是删失、又是Cox的,搞的我一头

雾水。”那位给我提意见了。

列位看官切莫着急,且听在下慢漫道来。

所谓删失值,就是因各种原因对随访对象的随访可能失访或终检(censoring),

如研究对象由于其他原因死亡、研究者与病人失去了联系及直到对资料作总结时随访对象还活着但尚未发生所规定的事件。这种数据就叫做删失值,也叫做截尾数据。能处理截尾数据是生存分析的一个优点。

Cox回归是一种多变量的生存分析方法。这是本世纪60~70年代发展起来的、应用于生存资料分析的比例分险模型(the proportional hazard model)。1972年,英国统计学家D.R.Cox的研究工作使得比例分险模型的理论和实用性更大地推进了一步。因此许多统计学者就把它称为Cox比例风险或Cox回归。

§13.1 Life Tables过程

Life Tables过程用于:

1、制作寿命表。

2、绘制各种曲线如生存函数、风险函数曲线等。

3、对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对

研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。

例13.1 某临床试验对20名第Ⅲ或第Ⅳ期黑色素瘤患者进行随访研究,截至

注:数据后跟符号“+”表示该数据为删失数据。

13.1.1 界面说明

图1寿命表主对话框

【Time】框

选入生存时间变量。

【Display Time Intervals】框

欲输出生存时间范围及组距。

在by前面的框内填入生存时间上限,本例填入200(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入20,以保证结果列出“100-”的组段。

【Status】框

选入生存状态变量,并定义终结事件的标记值。

选入变量“Status”后,【Define Event】钮被激活变黑,击该按钮,弹出定义终结事件标记值的对话框(图1)。对二分类变量,一般以死亡、复发、恶化等表示终结事件。本例以死亡为终结事件,其标记值为1,故在Single value 框内填入1。击Continue钮。若生存状态变量取值为一连续型变量,如反应变量为收缩压,则在下面的Range of values 框中输入140 through 400,此处上限输入400是我随便输入的一个上限,目的是为了定义高血压患者,实际上恐怕

没有人的血压能达到400,这样才能保证包括所有的高血压病例,具体情况具体分析。

图2 定义终结事件标记值的对话框

【Factor】框

定义第1层因素,即分组因素。

【By Factor】框

定义第2层因素,即分层因素。

【Options】选项

击Options按钮,弹出选项对话框。(图3)

图3 寿命表选项对话框

Life Table(s):输出寿命表,系统默认。

Plot:统计图。

Survival:累积生存函数曲线。

Hazard:累积风险函数散点图。

One minus survival:生存函数被1减后的曲线。

Log survival:对数累积生存函数曲线。

Density:密度函数散点图。

Compare Levels of First Factor:对第1层因素不同水平的比较,即主对话框(图1)中的factor框中所选入的因素。

None:不做比较。系统默认。

Overall:整体比较。

Pairwise:两两比较。

本例因没有分组因素,故Compare Levels of First Factor选项均不可选。

13.1.2 结果解释

1、寿命表

This subfile contains: 20 observations

Life Table

Survival Variable TIME survival time(week)

说明:20例观察单位,生存变量为“Time”,变量标签为“survival time(week)”

Number Number Number Number Cumul

I n tr vl E n tr ng W d ra wn E x po sd O f P r op n P r op n P r op n P r ob a-

Start this During to Termnl Termi-Sur-Surv bility Hazard Time Intrvl Intrvl Risk Events nating viving at End Densty Rate ------------------------------------------------------------.020.0.020.0 2.0.1000.9000.9000.0050.0053

20.018.0 2.017.0 3.0.1765.8235.7412.0079.0097

40.013.0 1.012.5 1.0.0800.9200.6819.0030.0042

60.011.0 1.010.5 1.0.0952.9048.6169.0032.0050

80.09.0 3.07.5 1.0.1333.8667.5347.0041.0071

100.0 5.0 3.0 3.5.0.0000 1.0000.5347.0000.0000 120.0 2.0.0 2.0.0.0000 1.0000.5347.0000.0000 140.0 2.0 1.0 1.5.0.0000 1.0000.5347.0000.0000

160.0 1.0 1.0.5.0.0000 1.0000.5347.0000.0000 The median survival time for these data is 160.00+

SE of SE of

Intrvl Cumul Proba- SE of

Start Sur- bility Hazard

Time viving Densty Rate

------- ------ ------ ------

.0 .0671 .0034 .0037

20.0 .0999 .0042 .0056

40.0 .1081 .0029 .0042

60.0 .1157 .0031 .0050

80.0 .1261 .0039 .0071

100.0 .1261 .0000 .0000

120.0 .1261 .0000 .0000

140.0 .1261 .0000 .0000

160.0 .1261 .0000 .0000

?Intrvl Start Time:生存时间的组段下限。

?Number Entrng this Intrvl:进入该组段的观察例数。

?Number Wdrawn During Intrval:该组段的删失例数。

?Number Exposed to Risk:暴露于危险因素的例数,即有效观察例数。

?Number of Termnl Events:终结事件的例数,即死亡例数。

?Propn Terminating:终结事件比例,即死亡比例。

?Propn Surviving:生存比例。

?Cumul Propn Surv at End:至本组段上限的累积生存率。

?Probability Densty:概率密度。

?Hazard Rate:风险率。

?SE of Cumul Surviving:累积生存率的标准误。

?SE of Probability Densty:概率密度的标准误。

?SE of Hazard Rate:风险率的标准误。

?The median survival time for these data is 160.00+:本例的中位生存时间为“160.00+”,从下图的累积生存函数曲线看,曲线与生存率等于0.5的横线不相交,故中位生存时间无法估计。

?本例的100周生存率为53.47%。

2、累积生存函数曲线:图4。

图4累积生存函数曲线

§13.2 Kaplan-Meier过程

Kaplan-Meier法用于:

1、估计某研究因素不同水平的中位生存时间。

2、比较该研究因素不同水平的生存时间有无差异。

3、控制一分层因素后对研究因素不同水平的生存时间比较(此时将按分层

因素的不同水平对研究因素对生存时间的影响分别进行分析)。怎么样,有点拗口吧?

例13.2 3种疗法治疗66例白血病患者的缓解时间(天)

注:数据后跟符号“+”表示该数据为删失数据。13.2.1 界面说明

图5Kaplan-Meier法主对话框

【Time】框

选入生存时间变量。

【Status】框

选入生存状态变量。

【Factor】框

选入分组变量。

【Strata】框

选入分层变量。

【Lables Cases】框

给个体标记。

【Compare Factor】选项

击Compare Factor按钮,弹出选项对话框。(图6)

图6分组因素水平间比较对话框

Test Statistics:检验统计量。

Log rank:检验生存分布是否相同,各时间点权重一样。

Breslow:检验生存分布是否相同,以各时间点的观察例数为权重。

Tarone-Ware:检验生存分布是否相同,以各时间点的观察例数的平方根为权重。

Linear trend for factor levels:分组因素水平间的线性趋势检验。

Pooled over strata:水平间的整体比较。系统默认。

For each stratum:按分层变量,对每一层进行分组因素各水平间的整体比较。

Pairwise over strata:分组因素各水平间的两两比较。

Pairwise for each stratum:按分层变量,对每一层进行分组因素各水平间的两两比较。

【Save】选项

击Save按钮,弹出Save New Variables(保存新变量)对话框(图7)。

图7 保存新变量对话框

Survival:累积生存率估计。

Standard error of survival:累积生存率估计的标准误。

Hazard:累积风险函数估计。

Cumulative events:终结事件的累积频数。在各水平内,按生存时间和生

存状态排序。

【Options】选项

击Options按钮,弹出选项对话框(图8)。

图8 K-M法选项对话框

●Statistics:统计量。

Survival table(s):生存分析表。

Mean and median survival:平均生存时间和中位生存时间及其标准误和可信区间。

Quartiles:生存时间的第25百分位数、中位生存时间、第75百分位数。

●Plot:统计图。

Survival:累积生存函数曲线。

One minus survival:生存函数被1减后的曲线。

Hazard:累积风险函数散点图。

Log survival:对数累积生存函数曲线。

操作如下:

1.Analyze==>Survival ==>Life Tables

2.Time框:选入remission time

3.Status框:选入status;击define events钮,在single value框右边的空格中输入1

4.Factor框:选入group;

https://www.wendangku.net/doc/b19066953.html,pare factors列表框:

●Test Statistics:选择Log rank、Breslow、Tarone-Ware

●Linear trend for factor levels:选Pooled over strata或Pairwise over strata

6.Option列表框:

●Statistics: 选Survival table(s)、Mean and median、Survival

●Plots: 选Survival

单击OK钮

13.2.2 结果说明

1、生存分析表

Survival Analysis for TIME remission time(days)

对生存时间变量Time进行分析,其变量标签是remission time(days)。

Factor GROUP = A疗法

Time Status Cumulative Standard Cumulative Number

Survival Error Events Remaining

5 恶化.9200 .0543 2 23

9 恶化.8800 .0650 3 22

10 恶化 .8400 .0733 4 21

11 恶化 .8000 .0800 5 20

12 恶化 .7600 .0854 6 19

13 恶化 .7200 .0898 7 18 20 删失7 17 23 恶化 .6776 .0940 8 16 28 恶化9 15 28 恶化10 14

28 恶化 .5506 .1010 11 13

29 恶化 .5082 .1017 12 12

31 恶化 .4659 .1017 13 11

32 恶化 .4235 .1009 14 10 37 恶化 .3812 .0993 15 9 41 恶化16 8 41 恶化 .2965 .0936 17 7 57 恶化 .2541 .0893 18 6 62 恶化 .2118 .0838 19 5 74 恶化 .1694 .0770 20 4 100 恶化.1271 .0684 21 3

258 删失22 1 269 删失22 0 Number of Cases: 25 Censored: 3 ( 12.00%) Events: 22 Survival Time Standard Error 95% Confidence Interval

Mean: 57 15 ( 28, 86 )

(Limited to 269 )

Median: 31 3 ( 25, 37 )

说明:

?限于篇幅原因,此处仅列出A治疗组的结果。

?Time:观察时间。

?Status:生存状态。

?Cumulative Survival:累积生存率。

?Standard Error: 累积生存率的标准差。

?Cumulative Events:累计死亡数。

?Number remaining: 组中剩余人数,即在时间Time的暴露人数。

2、生存时间估计

Survival Analysis for TIME remission time(days)

Factor GROUP = A疗法

Survival Time Standard Error 95% Confidence Interval

Mean: 57 15 ( 28, 86 )

(Limited to 269 )

Median: 31 3 ( 25, 37 ) Factor GROUP = B疗法

Survival Time Standard Error 95% Confidence Interval Mean: 112 20 ( 72, 152 )

(Limited to 245 )

Median: 99 24 ( 52, 146 )

Factor GROUP = C疗法

Survival Time Standard Error 95% Confidence Interval

Mean: 95 19 ( 58, 132 )

(Limited to 219 )

Median: 40 11 ( 18, 62 )

Total Number Number Percent

Events Censored Censored GROUP A疗法25 22 3

12.00

GROUP B疗法19 15 4

21.05

GROUP C疗法22 15 7

31.82

Overall 66 52 14 21.21说明:

?Mean是生存时间的算术均数。

?“Limit to 269”表示A疗法组的最长生存时间为219天。

?Median为中位生存时间,即生存率为50%所对应的生存时间。A、B、C

疗法的中位生存时间分别为31、99、40。

?A、B、C疗法组中位生存时间的95%可信区间分别为(25,37)、(52,146)、(18,62)。

?A、B、C疗法的删失例数分别为3、4、7,删失率分别为12%、21.05%、

31.82%。

3、水平间的整体比较

Test Statistics for Equality of Survival Distributions for GROUP

Statistic df Significance

Log Rank 4.31 2 .1158

Breslow 3.67 2 .1595

Tarone-Ware 4.35 2 .1137

说明:

3种疗法的生存时间差异无显著性意义,3个检验统计量的P值均大于

0.1。在实际分析中,当各组的总体水平比较无统计学意义时,不宜再进

行两两比较,此处仅是为了演示一下。

4、水平间的两两比较

Log Rank Statistic and (Significance)

Factor 1 2

2 3.65

( .0561)

3 2.8

4 .03

( .0917) ( .8677)

Breslow Statistic and (Significance)

Factor 1 2

2 3.23

( .0722)

3 1.77 .07

( .1832) ( .7967)

Tarone-Ware Statistic and (Significance)

Factor 1 2

2 3.85

( .0498)

3 2.26 .07

( .1324) ( .7981)

说明:

3种检验方法两两比较差异均无显著性意义。括号外数值为检验统计量,括号内数值为P值。

4、生存曲线

第十四章活着--Survival菜单详解(下)

(医学统计之星:董伟)

上次更新日期:

13.1 Life Tables过程

13.1.1界面说明

13.1.2 结果解释

13.2 Kaplan-Meier过程

13.2.1界面说明

13.2.2结果解释

13.3 Cox Regression过程

13.3.1界面说明

13.3.2结果解释

13.4 Cox w/Time-Dep Cov过程

13.4.1 界面说明

13.4.2 结果解释

§13.3 Cox Regression过程

上面给大家介绍的是两种生存分析方法,但它们只能研究一至两个因素对生存时间的影响,当对生存时间的影响因素有多个时,它们就无能为力了,下面我给大家介绍Cox Regression过程,这是一种专门用于生存时间的多变量分析的统计方法。

Cox Regression过程主要用于:

1、用以描述多个变量对生存时间的影响。此时可控制一个或几个因素,考察其他因素对生存时间的影响,及各因素之间的交互作用。

例13.3 40名肺癌患者的生存资料(详见胡克震主编的《医学随访统计方法》1993,77页)

注:原数据库是用亚变量定义肺癌分类:0,0,0为其它癌;1,0,0为鳞癌;0,1,0为小细胞癌;0,0,1为腺癌。表中的最后一个变量是我加上去的癌症类别,1为鳞癌;2为小细胞癌;3为腺癌;4为其它癌。实践表明结果与用亚变量计算一样。

13.3.1 界面说明

图9 Cox回归主对话框

【Time】框、【Status】框前文已经介绍过了,这里我就不再废话唠叨的了。Block 1 of 1右边的Next钮被激活。这个按钮用于确定不同自变量进入回归方程的方法,详见Method框的内容。用同一种方法进入回归方程的自变量在同一个Covariates框内。

【Covariates】框

选入自/协变量,即选入你认为可能对生存时间有影响的变量。

【Method】框

选择自变量进入Cox回归方程的方法,SPSS提供下面几种方法:?Enter: Covariates框内的全部变量均进入回归模型。

?Forward: Conditional: 基于条件参数估计的向前法。

?Forward: LR: 基于偏最大似然估计的向前法。

?Forward: Wald: 基于Wald统计量的向前法。

?Backward: Conditional: 基于条件参数估计的后退法。

?Backward: LR: 基于偏最大似然估计的后退法。

?Backward: Wald: 基于Wald统计量的后退法。

【Strata】框

定义分层因素,将生存时间按分层因素分别进行Cox回归。

【Categorical】选项

用于告诉系统,Covariates框内的变量中哪些是分类变量或字符型变量。系统默认字符型变量为分类变量,数字型变量为连续型变量。

选入自变量后,categorical钮被激活。按categorical钮,进入确定分类变量的对话框。见图10。

图10 确定分类变量对话框

左边的Covariates框中列出了刚刚被选取的自变量,将分类变量选入Categorical Covariates框中。此时Change Contrast框被激活,请你选择比较方法,即计算参数OR/βi的方法。当选入分类变量后,Change Contrast框被激活,此时可选择比较方法。SPSS提供下面几种比较方法。

?Indicator:指示对比。用于指定某一分类变量的基线,即参照水平。这

样计算出来的参数OR/βi是以该变量的第一个或最后一个水平为基准水

平(取决于下面的reference category中你选择的是last还是first)。

在这里SPSS自动创建亚变量,对照水平在对比分类矩阵中用0行代表。

在这里我再多说两句,如本例中的肿瘤类型,若规定鳞癌为1,小细胞癌

为2,腺癌为3,其它癌为4。若选indicator及last,则以其它癌为参照,计算出来的OR及βi是以其它癌为基准,即其它癌的OR为1,其他计算出来的OR值是与其它癌相比的结果。

?Simple:差别对比。可计算该分类变量的各水平与参照水平相比的OR值。

参照水平自己当然就不用跟自己相比了。对于本例来说,Simple与

Indicator选项是一样的,前提是下面的Reference Category中你所选

择的同是last(或first)。

?Difference:差别对比。分类变量欲比较水平与其前面的各水平平均值进行比较,当然也不包括第一水平。与Helmert法相反,因此也叫反Helmert 法。如3水平与1、2水平的平均值相比,下同。

? Helmert:赫尔默特对比。分类变量欲比较水平与其后面各水平平均值进行比较,当然不包括最后一个水平。

? Repeated:重复对比。分类变量的各水平与其前面相邻的水平相比较(第一水平除外)。

? Polynomial:多项式对比。仅用于数字型的分类变量。无效假设是假设各水平是等距离的(可以是线性的关系,也可以是立方、四次方的关系)。

例如年龄每增加10岁,死亡风险的增加值是一样的,但实际情况常常与此相反,如在20岁与60岁年龄段,年龄都增加10岁,所增加的死亡风险肯定是不一样的,具体情况需根据各人的研究课题,专业而定。

? Deviation:离差对比。除了所规定的参照水平外,其余每个水平均与总体水平相比。

?Reference category:如果你选择了Deviation, Simple, 或Indicator 三个选项,就必须选择First或Last作为参照水平。

完成上述选择后,击change钮,确认选择。

你若对上面写的一段不感兴趣的话,可跳过去,直接用系统默认的选项。【Plots】选项

图11 Cox回归统计图对话框

Survival:累积生存函数曲线。

Hazard:累积风险函数曲线。

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

实验一 SPSS简介及统计整理教学内容

实验一S P S S简介及 统计整理

实验一SPSS简介及统计整理 一、实验目的和要求 1掌握SPSS安装、启动、主界面和退出; 2掌握SPSS的变量定义信息; 3掌握SPSS的数据录入与保存方法; 4掌握在SPSS中的实现各种统计描述参数的计算。引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 5理解并掌握SPSS软件包有关数据文件创建和整理的基本操作 6学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件 7掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序8 实验类型:验证型;实验时间:2学时 二、实验主要仪器和设备 计算机一台,Windows XP操作系统,SPSS环境。 三、实验原理 SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。 SPSS变量的属性

SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。 四、实验内容与步骤 实验1.1数据文件管理 1.创建一个数据文件 数据文件的创建分成三个步骤: (1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界面,根据实验的设计定义每个变量类型。 (3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。 2.读取外部数据

(完整版)SPSS简明教程(绝对受用)

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS基本操作傻瓜教程

目录 一、SPSS界面介绍 (2) 1、如何打开文件 (2) 2、如何在SPSS中打开excel表 (3) 3、数据视图界面 (3) 4、变量视图界面 (4) 二、如何用SPSS进行频数分析 (11) 三、如何用SPSS进行多变量分析 (15) 四、如何对多选题进行数据分析 (18) 1、对多选题进行变量集定义 (18) 2、对多选题进行频数分析 (21) 3、对多选题进行多变量交互分析 (24) 五、如何就SPSS得出的表在excel中作图 (27)

一、SPSS界面介绍 提前说明:第一,我这里用的是SPSS 20.0 中文汉化版。第二,我教的是傻瓜操作,并不涉及理论讲解,具体的为什么和用什么理论公式来解释请认真去听《社会统计学》的课程。第三,因为是根据我自己的操作和理解来写的,所以可能有些地方显的不那么科学,仍然要说请大家认真去听《社会统计学》的课程,那个才是权威的。 1、如何打开文件 这个东西打开之后界面是这样的: 我们打开一个文件:

要提的一点就是,SPSS保存的数据拓展名是.sav: 2、如何在SPSS中打开excel表 在上图的下拉箭头里找到excel这个选项: 然后你就能找到你要打开的excel表了。 3、数据视图界面 我现在打开了一个数据库。 可以看到左下角这个地方有两个框,两个是可以互相切换的,跟excel切换表一样,跟excel切换表一样: 现在的页面是数据视图,也就是说这一页都是原始数据,这里的一行就是一张问卷,一列就是一个问题,白框里的1234代表的是选项。这个表当时录数据的时候为了方便看,是把ABCD都转换成了1234,所以显示的是1234,当然直接录ABCD也可以,根据具体情况看怎么录,只要能看懂。 多选题的录入全部都是细化到每个选项,比如第四题,选项A选了就是“是”,没选就是

SPSS教程(完整)

第二章 SPSS统计应用 第一节 SPSS基础 SPSS(Statistical Package for the Social Sciences)即社会科学统计软件包,是当今世界上公认的最流行、最强大的三大统计分析软件(SPSS、SAS和BMDP)之一。SPSS从10.0版本开始就基于Microsoft Windows 95操作系统上运行,具有Windows软件的共同特征。由于SPSS具有统计、绘图功能强、使用简单方便等优点。受到广大科研工作者的青睐。 在这里主要以12.0版为基础,介绍SPSS的基本使用方法。 一、SPSS安装和运行 1 SPSS v12.0 安装 打开计算机,启动Windows XP操作系统。 1) 将课程配备的光碟放入光盘驱动器中。 2) 启动Windows资源管理器,双击光盘驱动器图标,在目录窗口中找到“SPSS12 install”文件夹,双击进入该文件夹;找到“setup”应用程序,双击后就启动安装。显示欢迎安装SPSS 12.0版以及版权声明(图2-1),浏览后单击“Next”按钮进入下一个画面。 图2-1 SPSS12.0欢迎窗口 3)同意SPSS12.0软件协议 用户阅读“协议”,同意协议,单击“I accept the terms in license agreement”选项。 否则单击“Cancel”退出安装,如图2-2。

图2-2 软件协议窗口 4)阅读SPSS 12.0 自述文件后,单击“Next”按钮,进入下一个界面。5)填写用户信息。 例如:在用户名“Name:”栏填写: Student 在单位名称“Organization:”栏填写: SWU 如图2-3。单击“Next”按钮,进入下一个界面。 图2-3填写用户信息 5)指定SPSS12.0系统的安装目录(图2-4)

SPSS使用简介

第一章 SPSS10.0 for Windows简介 SPSS软件是由美国SPSS公司研制的。SPSS的全称为Statistical Program for Social Sciences,即“社会科学统计程序”。SPSS10.0 for Windows是在Windows操作系统下运行的社会科学统计软件包,该软件是国际上公认的最优秀的统计分析软件包之一。它在经济、工业、管理、心理、教育、医学等许多领域应用广泛,在科研工作中发挥了巨大的作用。SPSS 最初的版本是建立在D0S基础上的,但在80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。并不断推出SPSS软件的新版本。SPSS for Windows版本从6.0、7.0、8.0、9.0,至1999年底,正式推出SPSS10.0 for Windows版本。该版本相对于一些早期的版本而言,不仅改写了一些模块,使运行速度大大提高,而且根据统计理论与技术的发展,增加了许多新的统计分析方法,使之功能日趋完善。近年由推出11.0和12.0 版本,这两新版本主要提高运行速度和增加了一些新统计学方法,其余与10.0 版本基本相同。本书以10.0版本介绍SPSS for Windows的使用方法。 第一节 SPSS10.0 for Windows的特点 SPSS软件风靡世界并为各个领域的广大科研工作者及其他用户所钟爱,原因在于它有以下的特点; 1、多种实用分析力法。SPSS提供了多种分析方法,包括了从基本的统计特征描述到诸如非参数检验、生存分析等各种高层次的分析。除此之外,SPSS还具有强大的绘制图形、编辑图形的能力。 2、易于学习,易于使用。对于SPSS for Windows而言,除了数据输入工作要使用键盘之外,其他的大部分操作均可以通过“菜单”、“对话框”来完成,使用户不必记忆大量的命令,操作更简单。 3、文件易于转换。与其他软件有数据转换接口。 Excel文件、文本文件等均可以转换成相应的SPSS数据文件。 4、操作方法多种多样。不仅有灵活的菜单对话框式操作,而且用户也可以自已编写SPSS 语句来进行数据统计分析工作。 第二节 SPSSl0.0 for Windows对环境的要求 一、对硬件的要求 由于SPSS主要用途是面向大型数据库的,它的运算一般涉及的数据量比较多。故而用户一般需要有较大的内存,而且如果用户还要进行多因素分析、生存分析之类的大运算量的分析,计算机至少要有16M的内存。 二、对软件的要求 SPSS for W1ndows目前没有汉化版本。一般用户可以在以下环境中运行SPSS。 1、中文Windows95、Windows98、Windows me、Windows2000 SPSS for W1ndows在此环境下运行,对话框中的按钮功能能以中文显示。可以使用中文设置变量标签和值标签。在要点表中显示中文标签。打印的时候,只能把正排汉字正常打印,图形中被旋转了的汉字打印的结果是乱码。 2、英文Windows95、Windows98、Windows me、Windows2000加中文平台,以便定义和输出中文标签。

SPSS操作步骤汇总

S P S S操作步骤汇总 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

SPSS学习 第一章数据文件的建立 数据编码 Type:Numeric:数值型 string:字符串型 Missing: Measure:scale定量变量 nominal定性变量 根据已有的变量建立新变量 1、对于数据进行重新编码 Transform—recode into different variables—选择input variable output variable –定义新变量的名称—change—开始定义新旧变量—continue 2、通过SPSS函数建立新变量 Transform—compute variable –从function group中选择公式范围下面选择具体的公式—if 中设置要改变—continue—OK(可以对变量进行各种计算) 第二章清除数据与基本统计分析 1、对不合理的数据检查并清理 检查:analysis-description statistic-frequencies—选入要检查的数据—OK 结果:频数统计表—看是否有错误—missing system 清理: 1.对系统缺失值的清理

Data—select case—if condition is satisfied—if—function group(missing)--下面选 (missing)--continue—output(delete unselected cases)--OK—对num为哪一位的进行修改 2.对sex=3的清理(直接就清除了) Data—select case—if condition is satisfied—if—sex调入再输入=3—continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 2. 对相关变量间逻辑性检查和清理 Data—select case—if condition is satisfied—if—输入表达式(前后逻辑不相符合的表达式)-- continue-- output(delete unselected cases)--OK—对num为哪一位的进行修改 3.统计描述 正态分布统计描述 1、正态性检验:Analysis—nonparametric tests—legacy dialogs—1-sample K-S—one-sample Kolomogorov Smirnov test –normal—ok/ 2、统计描述:Analysis—descriptives--time选入—options—ok 3、按照男女统计描述:data—split file –compare group –sex调入—ok Analysis-descriptive statistic – descriptive—time 调入—options选择—OK非正态分布资料统计描述 1、正态性检验nonparametric 2、Analysis—descriptive statistics—frequencies 选入-- statistics选择—OK 第三章T检验

SPSS中主成分分析的基本操作1

SPSS 中主成分分析的基本操作 Xiaowenzi22与pinksss 共同制作 阐述主成分分析法的原理 主成分分析是设法将原来众多具有一定相关性(比如P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。最经典的做法就是用F 1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F 1)越大,表示F 1包含的信息越多。因此在所有的线性组合中选取的F 1应该是方差最打的,故称F 1为第一主成分。如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F 2即选第二个线性组合,为了有效地反映原来信息,F 1已有的信息就不需要再出现再F 2中,用数学语言表达就是要求Cov(F 1, F 2)=0,则称F 2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分。 主成分模型: F 1=a 11X 11+a 21X 21+……+a p1X p F 2=a 12X 12+a 22X 22+……+a p2X p …… F p =a 1m X 11+a 2m X 22+……+a pm X p 其中a 1i, a 2i, ……,a pi (i=1,……,m)为X 的协差阵Σ的特征值多对应的特征向量,X 1, X 2, ……, X p 是原始变量经过标准化处理的值(因为在实际应用中,往往存在指标的量纲不同,所以在计算之前先消除量纲的影响,而将原始数据标准化)。 A=(ij a )m p ×=(,1α,2α…,m α),i i i R αλα=, R 为相关系数矩阵, i i αλ、是相应的特征值和单位特征向量, 1λ≥2λ≥…≥p λ≥0 上述方程组要求: 1、a 21i +a 22i +……+a 2pi =1 (i=1,……,m) 2、m I A A =′ (A=(ij a )m p ×=(,1α,2α…,m α),A 为正交矩阵) 3、Cov(F i ,F j )=ij i δλ, =01 ij δj i j i ≠= 操作步骤: 一、 数据标准化

SPSS_操作要点整理--详细版解读

Spss操作要点详细版 第一章导论——SPSS介绍 学习目标:初步认识SPSS软件的内容 一、SPSS界面说明 SPSS for Windows是SPSS/PC的Windows版本,具有Windows软件的共同特点,其界面十分友好,打开SPSS程序就会出现图1-2界面。 标题栏 菜单栏 工具栏 数据栏 标签 图1-2 SPSS 11.5 for Windows 界面 该界面为SPSS 的数据编辑窗口,其组成部分及主要功能如下: 1。标题栏:功能与其它Windows软件一致。 2.菜单栏:由10个菜单项组成,每个菜单包括一系列功能。各菜单的主要功能如下。 2.1 File:文件操作菜单。单击Fil e,有图1-3下拉菜单,主要功能包括:·New:新建数据编辑窗口、语句窗口、结果输出窗口等; ·Open和Open Database:打开数据编辑窗口、语句窗口、结果输出窗口等; ·Read Text Data:读入文本文件; ·Save和Save As:保存文件; ·Display Data Info:显示数据的基本信息; ·Prin t和Print Preview:将数据管理窗口中的数据以表格的形式打印出来。

图1-3 File菜单项的下拉菜单 图1-4 Edit菜单项的下拉菜单 2.2 Edit:文件编辑菜单。主要用于数据编辑,如图1-4,主要功能包括:·UndoRedo或modify cell values:撤消或恢复刚修改过的观测值; ·cut,copy,paste:剪切、拷贝、粘贴指定的数据; ·paste variables:粘贴指定的变量; ·clear:清除所选的观测值或变量; ·find:查找数据。 2.3 View:视图编辑菜单。用于视图编辑,进行窗口外观控制。包含显示/隐藏切换、表格特有的隐藏编辑/显示功能及字体设置等功能。 2.4 Data:数据文件建立与编辑菜单。主要用于变量和观测量的编辑和整理。如图1-5,主要功能包括: ·Define Variable Properties:定义变量属性; ·Copy Data Properties:复制数据文件属性; ·Insert Variable:插入变量; ·Insert Cases:插入变量或观测值; ·Sort Cases:按照某个变量值重新排列观测值在数据文件中的顺序; ·Transpose:把数据文件的行列进行转置; ·Restructure:数据重组; ·Aggregate:对数据进行分类汇总,即按指定的变量将观测值进行汇总,以求得每组

SPSS基本操作步骤详解

SPSS基本操作步骤详解 本文采用SPSS21.0版本,其它版本操作步骤大体相同 一、基本步骤 (一)检查数据 在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。 例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。 1.执行次数分布表的程序 Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定) 2.执行描述统计量的程序 Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定) (二)反项计分 若是分析的预试量表中没有反向题,则此操作步骤可以省略; 量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。 例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。 Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】 (三)题项加总 量表题项加总的目的在于便于进行观察值得高低分组。 例,“XX量表”采用Likert scale五点量表式填答,题项为:a1,a2……a10,记总分为:az。 Transform(转换)→Computer Variable(计算变量)→在左边Target Variable(目标变量)中键入az,在右边Numeric Expression(数字表达式)中键入a1+a2+……+a10

SPSS操作方法

统计分析软件SPSS操作方法 SPSS for Windows的启动和退出 图2 软件启动 在鼠标顺序单击“开始”——“程序”——“SPSS 10.0 for Windows”——“SPSS 10.0 for Windows”启动条之后,SPSS启动界面如图2所示。

图3 启动界面 如需要退出程序可单击右上角的“×”或左上角“File”下的“Exit”即可退出。如果在本次SPSS期间激活的窗口如DATA窗口、OUTPUT窗口的有关内容已经作为文件存盘,则系统直接退出SPSS系统。否则系统会对各窗口一一提问:是否保存×××窗口的内容。用户可按自己的意愿一一给以回答。随后,结束本次SPSS期间,退出SPSS系统。 菜单及窗口介绍 由图3所示,SPSS软件的主菜单主要包括10项: ①File:文件操作;②Edit:文件编辑;③View:视图;④Data:数据文件建立与编辑;⑤Transform:数据转换;⑥Analyze:统计分析;⑦Graphs:统计图表的建立与编辑;⑧Utilities:实用程序;⑨Window:窗口控制;⑩Help:帮助。 而数据窗口主要包括两部分内容,data view和variable view两个表格,这一点与EXCEL 软件极为相似,data view主要用来显示需要处理的数据,而variable view则用来为数据不同的变量的性质进行设置,如名字name、类型type、宽度width、小数点位数Decimals等。以下为下一级子菜单的介绍。 1 File 鼠标单击“File”后即打开下一级下拉子菜单。共计包括16项。现主要介绍常用的命令。 图4 File子菜单 “New”与“Open”命令分别为新建和打开一个文件(包括数据文件data、程序文件syntax、结果文件output、脚本文件script、其他文件other)。需要注意的是SPSS10.0可以直接打开EXCEL2000和数据库的文件(其他还有systat、文本、Lotus等格式的文件)。

最新的SPSS21使用教程哦

SPSS工具简介 最新 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有SAS,SPSS,MINITAB,EXCEL等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows大同小异,在本试验课程中我们选择PASW Statistics 20.0作为统计分析应用试验活动的工具。 1.SPSS的运行模式 SPSS主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式 这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。 本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。2.SPSS的启动 (1)在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS 12.0 for Windows”即可启动SPSS软件,进入SPSS for Windows对话框,如图1.1, 图1.2所示。

SPSS基本概述与介绍

SPSS基本概述与介绍 在教育技术学研究中,常常需要对大量的数据进行统计处理,这是一项细致而繁琐的工作,如果完全依靠手工来进行,工作量较大,且难以保证准确性,也得不到高的精度。为了减轻整理和计算大量数据的负担,提高工作效率,我们必须充分利用现代化的技术手段。随着计算机软件技术的发展,计算机在分析数据方面发挥了相当大的作用,它功能多、速度快、计算精确、较易利用,并且计算机统计软件可以完成更为精确系统的数据分析与统计计算。 在教育技术研究资料统计处理中常采用的统计软件有SPSS INC公司的SPSS统计软件系统、SAS统计分析系统和Microsoft公司的Excel软件等。SPSS是Statistics Package for Social Sciences(社会科学统计软件包)的缩写,它是社会科学研究人员首选的统计软件,也是目前世界上最流行的统计软件之一。因而被广泛应用于社会科学和自然科学的各个领域中。 一、SPSS统计软件概况 SPSS是专业的通用统计软件包,它是一个组合式软件包,兼有数据管理、统计分析、统计绘图和统计报表功能,界面友好,使用简单,广泛用于教育、心理、医学、市场、

人口、保险等研究领域,也用于产品质量控制、人事档案管理和日常统计报表等。 SPSS对硬件系统的要求较低,普通配置的计算机都可以运行该软件;对运行的软件环境要求宽松,有各种版本可运行在WINDOWS 3X、9X、2000环境下,现在较新的10.0版可运行在WINDOWS 2000中(SPSS早期版本运行于DOS下,这里不再进行介绍,本节以SPSS 10.0版本为例介绍的该软件的使用)。SPSS 10.0有英文版和汉化版两种版本,可运行在中英文平台上。 SPSS统计软件采用电子表格的方式输入与管理数据,能方便地从其他数据库中读入数据(如Dbase,Excel,Lotus 等)。它的统计过程包括描述性统计、平均值比较、相关分析、回归分析、聚类分析、数据简化、生存分析、多重响应等几大类,每类中又下含同类多种统计过程,比如回归分析中又分线形回归分析、非线性回归分析、曲线估计等多个统计过程,而且每个过程中允许用户选择不同的方法及参数进行统计分析,因此除可以实现常规的各种统计外,还可用来做一些不常用的分析处理。 SPSS采用Sax Basic引擎,允许用户使用类Basic的语

spss操作步骤

Data weight cases Analyze->nonparametric test ->binomial

Ok Binomial Test 例7-1

Data weight cases

Ok Analyze->descriptive statistics->crosstabs statistics Continue->ok Chi-Square Tests

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 12.857(b) 1 .000 Continuity Correction(a) 11.392 1 .001 Likelihood Ratio 13.588 1 .000 Fisher's Exact Test .001 .000 Linear-by-Linear Association 12.793 1 .000 N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.48. 7.3 Data weight cases

Analyze->descriptive statistics->crosstabs Continue->ok Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 14.154(b) 1 .000 Continuity Correction(a) 11.836 1 .001 Likelihood Ratio 14.550 1 .000 Fisher's Exact Test .000 .000 Linear-by-Linear Association 13.910 1 .000 McNemar Test .013(c)

SPSS操作步骤

【关于SPSS正确操作步骤】------这东西太有用了~作者:张程龙 一、统计报告 l 在线分析处理报告Analyze→Reports→OLAP Cubes l 个案摘要报告Analyze→Reports→Summarize Cases l 行形式摘要报告Analyze→Reports→Report Summaries in Rows l 列形式摘要报告Analyze→Reports→Report Summaries in Columns 二、描述性统计分析 1.频数分析Analyze→Descriptive Statistic→Frequencies (1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形 2.基本描述统计量Analyze→Descriptive Statistic→Descriptives l 集中趋势(Central Tendency)的统计量 l 离散趋势(Dispersion)的统计量 l 分布形态(Distribution)的统计量 3.探索性分析Analyze→Descriptive Statistic→Explore l 茎叶图 l 箱图 l 正态分布检验Q-Q概率图 l 方差齐性检验的散点-分层图 4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs 三、两总体均值比较 l 单样本T检验Analyze→Compare Means→One-Sample T Test l 独立样本T检验Analyze→Compare Means→Independent-Samples T Test l 配对样本T检验Analyze→Compare Means→Paired-Samples T Test 四、方差分析 l 单因素方差分析Analyze→Compare Means→One-way ANOVA l 多因素方差分析Analyze→General Linear Model→Univariate l 协方差分析Analyze→General Linear Model→Univariate u 假设检验的步骤

实验三-IBM-SPSS软件的基本操作

实验三-IBM-SPSS软件的基本操作

云南大学软件学院 实验报告 课程:大数据分析及应用任课教师:蔡莉实验指导教师(签名): 学号: 20131170142 姓名:郭昱专业:软件工程日期: 2015/11/01 成绩: 实验三 IBM SPSS软件的基本操作 一、实验目的 1.熟悉SPSS的菜单和窗口界面,熟悉SPSS 各种参数的设置; 2.掌握SPSS的数据管理功能。 二、实验内容及步骤 (一)数据的输入和保存 1. SPSS界面 当打开SPSS后,展现在我们面前的界面如下: 菜单栏 工具栏

注意:窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似,很多操 作也与EXCEL类似。 2.定义变量 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下: 对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。

假如有两组数据如下: GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 现在SPSS的数据管理窗口如下所示: 第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。 现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示: 现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。 3.输入数据 我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一

SPSS编程操作入门知识讲解

S P S S编程操作入门

第四章 SPSS编程操作入门 4.1程序编辑窗口操作入门 一、进入程序编辑窗口界面 ①创建一个新程序 File——new——syntax ②打开一个旧程序 File——open——syntax 程序文件的扩展名为*.sps 注:syntax窗口的菜单和SPSS窗口的菜单功能基本一致,区别在于RUN菜单。 RUN ALL——运行全部程序 RUN SELECTION——运行所选择的部分程序 二、熟用Paste 按钮 在SPSS所有菜单对话框中均有Paste功能,在所有对话框选择完毕后,不选择 OK,而使用Paste,则程序编辑窗口会自动生成程序。 此功能使得SPSS编程操作变得简单易行,只需要对生成的程序适当加以修改即可。 示例:运用Paste创建一个程序文件。以xuelin.sav.为例,产生P50页的程序语句,并保存在桌面上备用。

该程序文件可以保存,当下次做相同的分析时,无需重新进行复杂的菜单选择,直接在原有程序文件上进行适当的修改,运行即可。 三、编程进行对话框无法完成的工作 示例1:见书 示例2:怎么产生连续自然数1~200 Input program. Loop #i=1 to 200. Compute x=#i. end case. End loop. End file. End input program. Execute. 4.2结构化语句简介 一、分支语句(条件语句) ①IF语句 SPSS程序格式: IF逻辑表达式目标表达式 逻辑表达式用于给出判断条件。

目标比达式表示如果满足逻辑表达式后该如何操作。 注:编程基本小知识: ①每句命令完成后,以点号结束,否则程序不被执行。 ②全部命令编辑完成后,以Execute.结束,否则程序不被执行. ③学会使用help——command syntax reference自学编程。 示例1:打开案例数据brain1.sav,要求将年龄小于20,性别为1(男)的病人归为第一组(group=1). GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age<20 & sex=1( 逻辑表达式) group=1.(目标表达式)Execute. 示例2:打开案例数据brain1.sav,要求将年龄小于等于40岁的女性病人归为组2. GET FILE='F:\chenghongli\spss\数据集\brain1.sav'. if age le 40 group=2. execute. 练习1:将血小板大于等于100的列为组1 练习2:打开brain1.sav,创造一个新的字符型变量sex1,当sex 取值为1时,sex1取值为f, 当sex取值为2时,sex1取值为m. GET

实验一-SPSS简介及统计整理

实验一SPSS简介及统计整理 一、实验目的和要求 1掌握SPSS安装、启动、主界面和退出; 2掌握SPSS的变量定义信息; 3掌握SPSS的数据录入与保存方法; 4掌握在SPSS中的实现各种统计描述参数的计算。引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 5理解并掌握SPSS软件包有关数据文件创建和整理的基本操作 6学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件 7掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序8 实验类型:验证型;实验时间:2学时 二、实验主要仪器和设备 计算机一台,Windows XP操作系统,SPSS环境。 三、实验原理 SPSS数据文件是一种结构性数据文件,由数据的结构和数据的容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。 表2.1 SPSS数据文件结构 SPSS变量的属性 SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度

(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。 四、实验容与步骤 实验1.1数据文件管理 1.创建一个数据文件 数据文件的创建分成三个步骤: (1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界面,根据实验的设计定义每个变量类型。 (3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格。 2.读取外部数据 当前版本的SPSS可以很容易地读取Excel数据,步骤如下: (1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图2.2所示。

相关文档