文档库 最新最全的文档下载
当前位置:文档库 › 卫生统计学spss操作

卫生统计学spss操作

卫生统计学spss操作

个人总结

星期二,2017年6月20日

07:20

1、卡方检验、涉及到等级资料的需要加权

2、卡方检验列数参照标目来定

1、t检验:analyze--compare mean

2、方差分析:

完全随机设计:analyze--compare means--one-way ANOVA

随机区组、交叉设计、析因设计:Analyze--general linear model(一般线性模型)--univariate(单因素)

重复测量设计的方差分析:Analyze--general linear model(一般线性模型)--repeated measures

3、卡方检验:加权

完全随机设计、配对设计、行乘列表:analyze--descriptive statistics--crosstabs(交叉表)

4、秩和检验:

配对设计、单一样本:Analyze--nonparametric tests--legacy dialogs(旧对话

框)--2 related samples

完全随机设计两样本:Analyze--nonparametric tests--legacy dialogs(旧对话

框)--2 independent samples

完全随机设计多样本:Analyze--nonparametric tests--legacy dialogs(旧对话框)--K independent samples

随机区组设计:Analyze--nonparametric tests--legacy dialogs(旧对话框)--K related samples

完全随机(成组)设计两两比较:analyze--nonparametric tests--K independent samples

随机区组设计的两两比较:analyze--nonparametric tests--K related samples

分区个人经验的第1 页

实验一 SPSS简介及统计整理教学内容

实验一S P S S简介及 统计整理

实验一SPSS简介及统计整理 一、实验目的和要求 1掌握SPSS安装、启动、主界面和退出; 2掌握SPSS的变量定义信息; 3掌握SPSS的数据录入与保存方法; 4掌握在SPSS中的实现各种统计描述参数的计算。引到学生利用正确的统计方法对数据进行适当的整理和显示,描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 5理解并掌握SPSS软件包有关数据文件创建和整理的基本操作 6学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件 7掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序8 实验类型:验证型;实验时间:2学时 二、实验主要仪器和设备 计算机一台,Windows XP操作系统,SPSS环境。 三、实验原理 SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1 所示。 SPSS变量的属性

SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。 四、实验内容与步骤 实验1.1数据文件管理 1.创建一个数据文件 数据文件的创建分成三个步骤: (1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“PASW Statistics数据编辑器”。 (2)单击左下角【变量视窗】标签进入变量视图界面,根据实验的设计定义每个变量类型。 (3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。 2.读取外部数据

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

spss作业15-17

CHAPTER 15 西北研究院蔡嘉驰131246 15.4 (i) What we choose is part of u t. Then gMIN t and u t are correlated, which causes OLS to be biased and inconsistent. (ii) I think it is uncorrelate because gGDP t controls for the overall performance of the U.S. economy. (iii) The change of U.S. minimum may someway change the state minimum and vice versa. If the state minimum is always the U.S. minimum, then gMIN t is exogenous in this equation and we would just use OLS. 15.7 (i) Because students that would do better anyway are also more likely to attend a choice school. (ii) Since u1 does not contain income, random assignment of grants within income class means that grant designation is not correlated with unobservables such as student ability, motivation, and family support. (iii) The reduced form is choice= π0 + π1faminc + π2grant + v2, and we need π2≠ 0. (iv) The reduced form for score is just a linear function of the exogenous variables: score= α0 + α1faminc + α2grant + v1. This equation allows us to directly estimate the effect of increasing the grant amount on the test score, holding family income fixed.So it is useful. C15.1 (i) The regression of log(wage) on sibs gives

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

SPSS软件在医学科研中的应用-Logistic回归分析

SPSS软件在医学科研中的应用计算机实习(SPSS10.0) 何平平 北大医学部流行病与卫生统计学系

实习六Logistic回归分析

(一)Logistic回归分析的任务 影响因素分析在流行病学研究中,logistic回归常用于疾病 的危险 因素分析,logistic回归分析可以提供一个重要的指标: OR。 (二)Logistic回归分析的基本原理 1.变量特点因变量:二分类变量,若令因变量为y,则常 用y=1表 示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。

2.Logistic模型 Log P 1 P = ? +? 1 x 1 + ? 2 x 2 + ...... + ? m x m P=P(y=1|x),为发病概率;1-P=P(y=0|x),为不发病概率。?0为常数项,?1 ,?2 ….. ?m分别为m个自变量的回归系数。 模型估计方法:最大似然法(Maximum Likelihood Method)。构造似然函数(L ikelihood function )L= P(y=1|x) P(y=0|x),通过迭代法估计一组参数(?0,?1 ,?2 ….. ?m)使L达到最大。

3.自变量的相对重要性分析 衡量变量相对重要性的指标 (1)Wald值:(?i /SE(?i ))2,近似?2分布,用于检验自变量的显著性。 (2)对自变量作显著性检验的概率P值。当Wald值越大,P值越小时,自变量的影响就越大。 4.自变量的筛选与多元线性回归分析类似,有Forward法(实际上是逐 步向前法)、Backward法(默认方法为Enter,即所有自变量一次全部进入方程)。

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1) 作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。然而,当代大学生对华夏文明究竟知道多少呢 某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。请利用这些资料,分析以下问题。 问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。 问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。 要求: 直接导出查看器文件为.doc后打印(导出后不得修改) 对分析结果进行说明,另附(手写、打印均可)。 于作业布置后,1周内上交 本次作业计入期末成绩

答案 问题一 操作过程 1.打开数据文件作业。同时单击数据浏览窗口的【变量视图】按钮,检查各个 变量的数据结构定义是否合理,是否需要修改调整。 2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对 话框。在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。 3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字 “5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。再单击【继续】按钮,返回【频率】对话框。

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

SPSS使用简介

第一章 SPSS10.0 for Windows简介 SPSS软件是由美国SPSS公司研制的。SPSS的全称为Statistical Program for Social Sciences,即“社会科学统计程序”。SPSS10.0 for Windows是在Windows操作系统下运行的社会科学统计软件包,该软件是国际上公认的最优秀的统计分析软件包之一。它在经济、工业、管理、心理、教育、医学等许多领域应用广泛,在科研工作中发挥了巨大的作用。SPSS 最初的版本是建立在D0S基础上的,但在80年代末,Microsoft推出Windows后,SPSS迅速向Windows移植。并不断推出SPSS软件的新版本。SPSS for Windows版本从6.0、7.0、8.0、9.0,至1999年底,正式推出SPSS10.0 for Windows版本。该版本相对于一些早期的版本而言,不仅改写了一些模块,使运行速度大大提高,而且根据统计理论与技术的发展,增加了许多新的统计分析方法,使之功能日趋完善。近年由推出11.0和12.0 版本,这两新版本主要提高运行速度和增加了一些新统计学方法,其余与10.0 版本基本相同。本书以10.0版本介绍SPSS for Windows的使用方法。 第一节 SPSS10.0 for Windows的特点 SPSS软件风靡世界并为各个领域的广大科研工作者及其他用户所钟爱,原因在于它有以下的特点; 1、多种实用分析力法。SPSS提供了多种分析方法,包括了从基本的统计特征描述到诸如非参数检验、生存分析等各种高层次的分析。除此之外,SPSS还具有强大的绘制图形、编辑图形的能力。 2、易于学习,易于使用。对于SPSS for Windows而言,除了数据输入工作要使用键盘之外,其他的大部分操作均可以通过“菜单”、“对话框”来完成,使用户不必记忆大量的命令,操作更简单。 3、文件易于转换。与其他软件有数据转换接口。 Excel文件、文本文件等均可以转换成相应的SPSS数据文件。 4、操作方法多种多样。不仅有灵活的菜单对话框式操作,而且用户也可以自已编写SPSS 语句来进行数据统计分析工作。 第二节 SPSSl0.0 for Windows对环境的要求 一、对硬件的要求 由于SPSS主要用途是面向大型数据库的,它的运算一般涉及的数据量比较多。故而用户一般需要有较大的内存,而且如果用户还要进行多因素分析、生存分析之类的大运算量的分析,计算机至少要有16M的内存。 二、对软件的要求 SPSS for W1ndows目前没有汉化版本。一般用户可以在以下环境中运行SPSS。 1、中文Windows95、Windows98、Windows me、Windows2000 SPSS for W1ndows在此环境下运行,对话框中的按钮功能能以中文显示。可以使用中文设置变量标签和值标签。在要点表中显示中文标签。打印的时候,只能把正排汉字正常打印,图形中被旋转了的汉字打印的结果是乱码。 2、英文Windows95、Windows98、Windows me、Windows2000加中文平台,以便定义和输出中文标签。

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS结果窗口用法详解

第四章:SPSS结果窗口用法详解 §4.1结果窗口元素介绍 SPSS实际上提供了两个结果窗口--结果浏览窗口和结果草稿浏览窗口。前者最为常用,显示美观,但非常消耗系统资源;后者实际上是一个RTF格式文档,显示简单朴素,但节省资源。我们可以根据所用计算机的情况选择使用哪一种窗口。 结果草稿浏览窗口的内容虽然是RTF格式,但由于中、英文兼容性的问题, 其中的表格读入WORD以后会变的面目全非,因此对我们不是很适用。 4.1.1 结果浏览窗口 SPSS的输出结果美观大方,是该软件的一大特色,下面是一个典型的结果浏览窗口。 相信99%的人都用过资源管理器,SPSS的结果浏览窗口和Windows资源管理器的结构完全相同,操作也几乎相同。除了上面的菜单栏、工具栏以外,绝大部分窗口被纵向一分为二!左侧是大纲视图(Outline view),又称结构视图,右侧则

显示详细的统计结果(统计表、统计图和文本结果),两侧的元素是完全一一对应的,即选中一侧的某元素,在另一侧该元素也会被选中。例如左侧的Title 图标旁有一个红色的箭头,表明该内容为结果窗口当前所在位置,相应的,右侧的标题Descriptives旁也出现一个红色三角,表明这就是Title图标所代表的内容。下面解释一下大纲视图的各个元素。 大纲视图顾名思义,大纲视图用于概略显示结果的结构,用于在宏观上对结果进行管理,如移动,删除等。里面采取和资源管理器类似的层次方式排列元素,每个元素用一个小图标来表示。常见的图标有: 大纲图标,代表一段或整个输出结果,含下级元素,单击左侧的减号就可以 将下级元素折叠,折叠后减号变为加号,图标则变为。 运行记录图标,代表系统操作产生的一段运行记录。 警告图标,代表输出结果中的系统警告。 注解图标,代表系统自动产生的注解,默认情况下注解内容在输出结果中是隐藏的。 标题图标,代表输出标题。 页标题图标,代表输出标题,较少出现。 表格图标,代表输出结果中的统计表(Pivot table,字面意思为数据透视表)。 统计图图标,代表统计图。 文本图标,代表文本输出结果。 交互式统计图图标,代表交互式统计图。 统计地图图标,代表统计地图。 单击图标会选中所代表的一块或一段输出结果,双击图标可以让对应输出在显示、隐藏间切换,选中后单击图标的名称则可以对图标改名。 4.1.2 结果草稿浏览窗口 和它漂亮的兄弟相比,结果草稿浏览窗口就朴素的多了,什么花样也没有。当然,系统资源也要少占用许多,前面的输出结果在结果草稿浏览窗口中的显示如下:

卫生统计学习题软件分析教程习题SPSS03

第三篇常用推断方法 二、综合分析题 1.略 2.略 3.为了解某校本科学生体质合格率的性别差异,随机抽查了本科男生 110人和女生 130 人,其中男生有 100 人合格,女生有 70 人合格,请问该校本科男女生体质合格率是否不同? 表3-1某校本科学生体质合格率 体质状况合格不合格合计 男100 10 110 女70 60 130 合计170 160 240 【操作】 (1)数据准备 1)定义变量:性别(Value定义:1=男,2=女)、结果(Value定义:0=合格,1=不合格)、频数。输入数据,如图3-1所示。 图3-1 SPSS的Date View窗口 2)频数加权:点击Data菜单下的Weigh Cases选项,弹出Weigh Cases对话框,如图3-2,选择Weigh cases by,选中变量“频数”将其送入Frequency Variable框中,如图3-3所示,单击OK。

图3-2 Data→Weigh Cases 图3-3 Weigh Cases对话框 (2)统计分析 1)点击Analyze菜单下的Descriptive Statistics子菜单,选择Crosstabs选项,如图3-4所示,系统弹出Crosstabs主对话框,选择变量“性别”将其送入Row(s)框内,选择变量“体质状况”将其送入Column(s)框中,如图3-5所示。

图3-4Analyze→DescriptiveStatistics→Crosstabs 图3-5 Crosstabs主对话框 2)单击右侧的Statistics,弹出Statistics子对话框,选择Chi-square,如图3-6所示,单击Continue返回。 图3-6 Statistics子对话框图9-13 Cells子对话框

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

SPSS实际操作练习题

实习一SPSS基本操作 第1题:请把下面的频数表资料录入到SPSS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加 入Variable框━点击Statistics按钮━选中Mean和 Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第2题某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆 固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。

spss统计软件期末课程考试题

《SPSS统计软件》课程作业 要求:数据计算题要求注明选用的统计分析模块和输出结果;并解释结果的意义。完成后将作业电子稿发送至 1. 某单位对100名女生测定血清总蛋白含量,数据如下: 计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。 解: 描述 统计量标准误 血清总蛋白含量均值.39389 均值的95% 置信区间下限 上限 5% 修整均值 中值 方差

标准差 极小值 极大值 范围 四分位距 偏度.054.241 峰度.037.478 样本均值为:;中位数为:;方差为:;标准差为:;最大值为:;最小值为:;极差为:;偏度为:;峰度为:;均值的置信水平为95%的置信区间为:【,】。 2. 绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。解:

正态性检验 Kolmogorov-Smirnov a Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 血清总蛋白含量 .073 100 .200* .990 100 .671 a. Lilliefors 显着水平修正 *. 这是真实显着水平的下限。 表中显示了正态性检验结果,包括统计量、自由度及显着性水平,以K-S 方法的自由度sig.=,明显大于,故应接受原假设,认为数据服从正态分布。 3. 正常男子血小板计数均值为9 22510/L , 今测得20名男性油漆工作者的血小板计数值(单位:9 10/L )如下: 220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无异常

spss统计入门基础

Spss基础入门 1. 个案排序:对数据视图中的某个个案进行排序,具体排序规则可以点进去选择 2. 变量排序:对变量视图中某个变量进行排序,具体规则可以点进去选择 3. 转置:行列互转 4. 合并文件:有两种文件的合并,添加个案可以实现两个文件的纵向合并,添加变量可以两个文件的横向合并 5. 重构:实现把一个表格的若干个变量变为同一个变量等进行表格的合适转换 6. 汇总:对数据按照类别进行汇总,比如三个班级的学生成绩表格,可以按照班级把学生成绩的平均值等等汇总到另外一个表格,该表格就会显示比如按班级显示各个班级的成绩平均值等 7. 拆分文件:实现输出图形表格的合理拆分,比如一个公司有8个部门,现要求分男女比较各个部门的人员工资情况,理论上我们用选择个案(见下条),逐个选择男女与部门需要操作2*8次,由此画出2*8张图表。利用拆分文件,这个时候可以选择 比较组或者按组来组织输出,然后分组依据就是部门与性别,在利用下面会讲到的数据描述就可以实现预期效果。 8. 选择个案:实现选择表格中符合条件的个案然后对其进行相应操作,点击进去后会有各种选择方式,比如如果满足什么条件才选择,随机选择百分之多少等等 一.转换 1. 重新编码为不同变量:可以把原来的变量或者变量的范围重新定义为新的变量,比如现有一个班级的学生成绩,要求分心50-70分,70-90分90-100分的同学所占比例,平均值等,现在就可以利用重新编码为不同变量,把上述范围重新编码为新的变量(名字可以自己任意选取),具体操作点击进去之后比较清楚。 2. 计算变量:实现对原来变量的重新计算从而产生新的变量,比如对原来变量进行乘以10操作产生新的变量等等,产生的变量名都是可以自己选择的 一.分析 1.描述统计:实现对表格中变量的各种类型的描述统计

SPSS数理统计软件与应用作业

《统计软件及应用》课程论文

我国区域农业经济聚类分析 一、提出问题 农业是通过培育动植物生产食品及工业原料的产业,是支撑国民经济建设与发展的基础产品。农业问题的本质及其重大意义。农业是国之根本,它的发展关系到其他两大产业的繁荣与否。与此同时,面对复杂多变的国内国际政治、经济环境,中国在农业方面的基础地位日渐薄弱。然而,在强劲的GDP增速背后,农民的收入水平却提高不够。由于受自然、经济等因素的影响,农业发展具有很强的区域性。不同地区农业发展水平发展方式很是不同。对区域农业进行聚类分析对针对性的制定区域农业发展战略政策有很强的指导性。 二、数据收集 为了对我国区域农业经济进行聚类分析,这里选择与区域农业发展相关的11个评价指标,它们分别代表农业发展的总量方面,水利设施、除涝面积方面,家庭土地经营方面。具体而言,总量方面包括地区生产总值x1(亿元),农业生产总值x2(亿元);水利设施、除涝面积方面包括水库数x3 座),水库总容量x4(亿立方米),除涝面积x5(千公顷),水土流失治理面积x6(百万元)四项;家庭土地经营方面包括经营耕地面积x7(亩/人),经营山地面积x8(亩/人),园地面积x9(亩/人)、牧草地面积x10(亩/人)、养殖水面面积x11(亩/人)五项。 这些指标中国统计年鉴上取得,其原始数据如表1 。 表1 房地产业发展水平的原始数据 地区x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 北京14113. 58 124.36 82 93.8716 149.77 542.8 0.5335 0.061 0.140 6 0.053 9 天津9224.4 6 145.58 28 26.21342 9 377.22 46.43 1.4862 0.006 5 0.024 8 0.037 河北20394. 26 2562.8 1 1066 161.3647 2 1648.6 4 6290.31 1.981 0.118 1 0.079 4 山西9200.8 6 554.48 733 57.53152 6 89.13 5352.495 2.4314 0.034 8 0.200 7 0.0079 内蒙古11672 1095.2 8 497 167.891 277 10897.47 9.6537 0.232 2 0.021 9 126.75 57 辽宁18457. 27 1631.0 8 951 359.2693 6 985.25 3 6333.716 3.4984 0.197 4 0.084 7 0.039 6 吉林8667.5 8 1050.1 5 1643 320.3943 17 1021.4 3586.565 7.7491 0.135 7 0.020 1 黑龙江10368. 6 1302.9 913 178.7056 3334.9 4690.5 11.678 1 0.009 5 0.005 3 0.0217 上海17165. 98 114.15 55.35 0.2826 0.046 5 0.052 9 江苏41425. 48 2540.1 910 189.1796 59 2802.5 06 1052.269 1 1.1232 0.008 9 0.017 8 0.142 8 浙江27722. 31 1360.5 6 4217 398.0666 96 496.71 2431.64 0.6027 0.425 5 0.152 3 0.059 安徽12359. 33 1729.0 2 4819 326.5100 56 2269.0 5 2136.082 1.8662 0.336 7 0.048 1 0.107 2 福建14737. 12 1363.6 7 3225 185.3876 2 129.58 3 1470.802 6 0.8831 1.235 9 0.290 3 0.089 3 江西9451.2 6 1206.9 8 9809 293.7193 72 375.71 5 4514.041 62 1.6078 1.047 9 0.064 7 0.049 2 山东39169. 92 3588.2 8 6291 227.6167 92 2651.8 4651.521 1.5554 0.042 7 0.101 7 0.014 2 河南23092. 36 3258.0 9 2352 402.2094 67 1958.9 7 4428.695 1.68 0.023 8 0.034 0.007 5 湖北15967. 61 2147 5848 992.1486 1219.1 71 4666.472 1.6932 0.668 8 0.053 4 0.127 5 湖南16037. 96 2325.5 1209 2 402.29 3 486.3 4 2898.99 5 1.2504 0.531 2 0.074 4 0.0259 0.056 7 广东46013. 06 2286.9 8 7437 429.0038 88 514.49 1378.454 0.6475 0.308 8 0.117 2 0.069 7 广西9569.8 5 1675.0 6 4367 378.4462 97 209.57 2 1873.769 3 1.4335 0.641 1 0.142 9 0.0331 0.022 2 海南2064.5 539.83 996 100.0175 17.513 32.726 1.2842 0.818 7 0.577 3 0.024 5 重庆7925.5 8 685.38 2840 74.06409 3 2312.33 1.1854 0.343 9 0.066 1 0.005 0.019 2 四川17185. 48 2482.8 9 6759 214.9343 93.98 6329.638 1.0835 0.264 5 0.048 2 0.025 8

相关文档
相关文档 最新文档