文档库 最新最全的文档下载
当前位置:文档库 › spss知识点

spss知识点

spss知识点
spss知识点

第一章

社会科学统计软件包——statistical package for the social science,SPSS

统计产品与服务解决方案——statistical product and service solutions,SPSS

1968年,三位斯坦福大学的学生开发了最早的SPSS系统。

SPSS主要有三种运行方式:批处理方式、完全窗口菜单运行方式、程序运行方式。

SPSS界面主要有两个:SPSS数据编辑窗口和SPSS输出窗口。

数据编辑窗口分为数据视图和变量视图。

第二章

SPSS对数据的处理是以变量为前提的。

变量的命名规则;

变量类型,数值、字符、日期。

变量的测量尺度:定性变量(名义)、定序变量(有序)、定距变量(间隔)、定比变量(比率)。

变量值标签,是对变量的每一个可能取值的进一步描述

变量标签,是变量名的进一步描述。

SPSS的默认的数据文件格式——*.sav。

个案是行,变量是列。

第三章

均值:表示的是某变量所有取值的集中趋势或平均水平。

均值标准误差:就是描述这些样本均值与总体均值之间的平均差异程度的统计量。

中位数:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值数据的影响,具有较高的稳定性。

中位数计算公式

众数:一组数据中,出现次数最多的那个变量值。在描述数据集中趋势方面有一定意义。统计数据的次数分布。

全距:也称极差,是数据的最大值与最小值之间的绝对差。全距大则数据分散。

方差:是所有的变量值与平均数偏差平方的平均值,表示了一组数据分布的离散程度的平均值。

标准差:是方差的平方根,表示了一组数据关于平均数的平均离散程度。

四分位数:将一组个案由小到大排列后,用三个点将全部数据分为四等分,与三个点上对应的变量成为四分位数。

十分位数,百分位数

频数:就是一个变量在各个变量值上取值的个案数。用到频数分析。

峰度:是描述某变量所有值分布形态陡缓程度的统计量。峰度为0,与正态分布相同;峰度大于0,比正态分布陡,为尖顶峰;峰度小于0,比正态分布平坦,为平顶峰。

偏度:描述数据分布形态的,是描述某变量取值分布对称性的统计量。偏度为0,与正态分布相同;偏度大于0表示正偏数值较大,为正偏或右偏;偏度值小于0表示负偏数值较大,为负偏或左偏。偏度的绝对值越大表示分布形态的偏斜程度越大。

标准化Ζ分数:从平均数为μ,标准差为δ的总体中抽取一个变量值χ,Ζ分数表示的是此变量大于或小于平均数几个标准差。Ζ=(χ-μ)/δ

最典型的一种Ζ分数线性转换就是Τ分数。Τ=10Ζ+50

探索分析:他在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。

探索分析的内容:检查数据是否错误:过大或过小的数据均有可能是奇异值、影响点或错误数据;获得数据分布特征:很多分虚方法不能对数据分布有一定的要求;对数据规律的初步观察:通过初步观察获得数据的一些内部规律。

交叉列联表分析:掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系。

多选项分析:是对多选项问题的分析方法。所谓多选项问题,就是一个问题的答案都是顺序变量或名义变量,并且允许选择的答案可以有多种组合。对于多选项问题,分解的方法分为多选项二分法和多选项分类法。

报表分类:个案简明统计报表、行形式报表、列形式报表。

第四章

Means过程:就是按照用户指定条件,对样本进行分组计算均属和标准差。

单一样本T检验:是检验某个变量的总体均值和某指定值之间是否存在显著差异。前提是样本总体服从正态分布。零假设为总体均值和指定检验值之间不存在显著差异。

两独立样本T检验:两独立样本各系接受相同的测量,目的是了解两样本之间是否有显著差异的存在。前提是:两个样本相互独立;样本来自的两个总体应服从正态分布。零假设为两总体均值之间不存在显著差异。

两配对样本T检验:是根据样本数据对样本来自两配对总体均值是否存在显著差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。前者推断两种效果有无差距,后者推断某种处理有无效果。

第五章

造成结果差异的原因可分为两类:随机变量和可控变量。

根据控制变量的个数,可将方差分析分为单因素方差分析和多因素方差分析。

单因素方差分析:测试某一个控制变量的不同水平是否给观测变量走成了显著差异和变动。单因素方差实质上采用了统计推断的方法。

方差分析的前提,在不同水平下,各总体均值服从方差相同的正态分布。

SST(总的变异平方和)=SSA(控制变量引起的离差,组间离差平方和,反映了控制变量的影响)+SSE(随机变量引起的离差,组内离差平方和,反映了数据抽样大小的误差程度)

多因素方差分析:控制变量在两个或两个以上,研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。

多因素方差分析需要将观察变量总的离差平方和分解为三部分:多个控制变量单独作用引起的平方和、多个控制变量交互作用引起的离差平方和、其他随机变量引起的离差平方和。计算公式

协方差分析:将那些难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确的对控制因素进行评价。

计算公式

第六章

当|r|≥0.8,视为高度相关;

0.5≤|r|<0.8,视为中度相关;

0.3≤|r|<0.5,视为低度相关;

|r|<0.3,说明变量之间的相关程度极弱,可视为不相关。

一般情况下,总体相关系数ρ是未知的,我们往往用样本相关系数r作为总体相关系数ρ的估计值。

二元变量的相关分析:指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。

二元定距变量的相关分析:是指通过计算定距变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。Peaason简单相关系数用来衡量定距变量间的相关线性关系。可以比较大小。

二元定序变量的相关分析:可以表示观测对象的某种顺序关系。Spearman和kendall’s等级相关系数用以衡量定序变量间的线性相关关系,利用的是非参数检验的方法。

偏相关分析:是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,之分析另外两个变量之间相关程度的过程。

距离相关分析:是指通过对观测量之间或变量之间相似或不相似的程度的一种测量。

根据统计量不同,距离相关分析可分为:相似性测量和不相似性测量。

根据分析对象不同,可分为:样本间分析和变量间分析。

第七章

回归分析与相关分析的不同:

●回归分析中,变量Y称为因变量,处于被解释的特殊地位;在相关分析中,变量Y与

X处于平等地位,研究Y与X的密切程度和研究X与Y的密切程度是一样的。

●在回归分析中,因变量Y是随机变量,自变量X可以是随机变量,也可以是非随机的

确定的变量;在相关分析中,变量X和Y都是随机变量。

●回归分析侧重于考察变量之间的数量变化规律,并通过一定的数学表达式来描述变量之

间的关系,进而确定一个或几个变量的变化对另一个特定变量的影响程度;相关分析是测定变量之间的关系密切程度,所使用的工具是相关系数。

回归分析主要解决的问题有:

●通过分析大量的样本数据,确定变量间的数学关系式;

●对索取诶难过的数学关系式的可信程度进行各种统计检验,并区分出对某一特定变量影

响较为显著的变量和影响不显著的变量;

●利用所确定的数学关系式,根据一个或几个变量的值来预测或控制另一个特定变量的取

值,并给出这种预测或控制的精确度。

Y是因变量,X是自变量。

一元线性回归分析:是指在排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一个事物(因变量)的过程,所进行的分析是比较理想化的。P158,回归系数;P160,拟合度,判定系数,P170

多元线性回归分析:测定多因素之间的相关关系的问题。

非线性相关分析:在非线性相关的条件下,自变量对因变量的数量变化关系。

线性转化的一般步骤:

1.根据经验或者绘制散点图,选择适当的非线性回归方程;

2.通过变量置换,把非线性回归方程化为线性回归;

3.用线性回归分析中采用的方法来确定各回归系数的值;

4.对各系数进行显著性检验。

最小二乘法

曲线估计:在一元回归分析中,一般会先绘制自变量和因变量的散点图,然后通过数据在散点图中的分布特点选择所言进行回归分析的类型,是使用线性回归分析还是某种非线性的回归分析。

采用曲线估计的步骤:

首先,根据实际问题本身特点,同时选择几种模型;

然后SPSS自动完成模型的参数估计,并显示R、F检验值、相伴概率值等统计量;

最后,选择具有R统计量值最大的模型作为此问题的回归模型,并做出一些预测。

时间序列的曲线估计:是分析社会和经济现象中经常用到的一种曲线估计。通常把时间设为自变量X,代表具体的经济或社会现象的变量设为因变量Y,研究X与Y之间关系的方法就是时间序列曲线估计。

含虚拟变量的曲线估计:在实际的问题的研究中,经常会碰到一些非数据型的变量,将自变量是定性变量的先作数量化处理,处理方法是引进只取“0”和“1”两个值的0—1型虚拟自变量。

逻辑回归分析:是对定性变量的回归分析。

第八章

聚类分析的方法,主要有快速聚类分析法和层次聚类分析法。

层次聚类分析有两种,一种是对样本(个案)进行分类,称为Q型聚类;一种是对研究对象的观测变量进行分类,称为R型聚类。

Q型聚类:使具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析。是对样本间进行距离的计算。

R型聚类:使具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表性的变量做分析,从而减少分析变量的个数。是对变量间进行距离的计算。

层次聚类分析中,测量样本之间的亲疏程度是关键。

聚类的时候会涉及到两种类型亲疏程度的计算:一种是样本数据之间的亲属程度;一种是样本数据与小类、小类与小类之间的亲属程度。

判别分析:先根据已知类别的食物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知类别。

判别分析假定:

1.预测变量服从正态分布;

2.预测变量之间没有显著相关;

3.预测变量的平均值和方差不相关;

4.预测变量应是连续变量,因变量(类别或组别)是间断变量;

5.两个预测变量之间的线相关性在不同类中是一样的。

分析各阶段应把握的原则:

1.事前组(类)别的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则会影

响判别函数的准确性,从而影响判别分析的结果。

2.所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力的变

量,达到以最少变量而有高分辨能力的目标。

3.初始分析的数目不能太少。

第九章

因子分析:就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反应原资料的大部分信息的统计学。

因子分析特点:

1.因子分析数量远少于原有的指标变量的数量,对因子变量的分析能减少分析中的计算工

作量。

2.因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重新组构,它能反映原

有变量大部分的信息。

3.因子变量之间不存在线性相关关系,对变量的分析比较方便。

4.因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反应。

变量共同度:也成为公共方差,反应全部公共因子变量对原有变量Xi的总方差解释说明比例。即原有变量Xi的共同度为因子载荷矩阵A中的第i行元素的平方和。

因子分析的四个基本步骤:

1.确定待分析的原有若干变量是否适合于因子分析。

2.构造因子变量。

3.利用旋转式的银子变量更具有可解释性。

4.计算因自变量的得分。

构造因子变量的方法:

●根据特征值的大小确定,一般取大于1的特征值。

●根据因子的累积方差贡献率来确定。

因子变量的命名解释可以进一步说明影响原变量系统构成的主要因素和系统特征。

第十章

非参数检验:不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的统计分析方法。

非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验。

卡尔检验:总体分布的卡尔检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布是否存在显著差异。

零假设:样本来自的总体分布形态和期望分布或某一理论部分没有显著差异。

二项分布检验:从二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。

零假设:样本来自的总体与所指定的某个二项分布不存在显著差异。

适用:在样本小于或等于30时,按照计算二项分布概率的公式进行计算;样本大于30时,计算的是Z统计,认为在零假设下,Z统计量服从正态分布。

二项分布检验的数据是实际收集到的样本数据,而非频数数据。

单样本变量值随机性检验:也成为游程(Run过程)检验,是对某变量的取值出现是否随机进行检验。

零假设:总体某变量的变量值出现的变量值的次数。

单样本变量值的随机性检验通过游程数来实现。所谓游程,是样本序列中连续出现的变量值的次数。

在SPSS单样本变量值的随机性检验中,SPSS将利用游程构造Z统计量,并依据正态分布表给出对应的相伴概率值。

单样本K—S检验:是由Wald提出的,是一种拟合优度的非参数检验方法,是利用样本数据推断总体是否服从某一理论分布的方法。

适用于探索连续型随机变量的分布形态。

零假设:样本来自的总体于指定的理论无显著差异。

实现K—S检验的过程:

●根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理论累积概率分布函

数F(x)。

●利用样本数据计算个样本数据点的累计概率得到检验累计概率分布函数S(x)。

●计算F(x)和S(x)在相应的变量值点x上的差D(x),得到差值序列D。单样本K—S检验

主要对差值序列进行研究。

两独立样本非参数检验:是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。

一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。

4种方法:

两独立样本的Mann-Whitney U检验:主要用于判断两个独立样本所属的总体均值是否有相同。

两独立样本的K-S检验:推测两个独立样本是否来自具有相同分布的总体。

两独立样本的游程检验:考察两个独立样本是否来自具有相同分布的总体。

两独立样本的极端反应检验:检验两个独立样本之观察值的散步范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体。

多独立样本非参数检验:是推断样本来自的多个独立总体分布是否存在显著差异。

一般推断多个独立样本总体的均值或中位数是否存在显著差异。

3中方法:

多独立样本的中位数检验:检验多个样本是否来自具有相同中位数的总体。

多独立样本的K-W检验:检验多个样本在总体分布是否有差异。

多独立样本的Jonkheere-Te rpstra检验:通过计算一个样本中观测值小于另一个样本观测值的个数来判断。比K-S检验出现第二类错误ide概率更小。

两配对样本非参数检验:是对总体分布不很清楚的情况下,对样本来自的两相关配对总体分别进行检验。

一般用于同一研究对象分别给予两种不同处理的效果比较,以及同一研究对象处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。

前提是两个样本应是配对的。

3种方法:

两配对样本的McNemar变化显著性检验

两配对样本的符号检验

两配对样本的Wilcoxon符号平均秩检验

多配对样本非参数检验:是对多个匹配样本的总体分布是否存在显著性差异进行统计分析。3种方法:

多配对样本的Friendman检验

多配对样本的Kendall协同系数检验

多配对样本的Cochran Q检验

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

SPSS期末重点整理

t检验:一般是用于检验两组观测值的均值之间差异是否显著的统计分析方法。 单样本t检验:用于检验样本均值与总体均值或某个已知值之间的差异的显著性。如果总体均值已知,那么样本均值与总体均值之间的差异显著性检验就属于单样本的t检验。 独立样本t检验:独立样本指的是样本之间彼此独立,没有任何关联。两个独立样本的t检验用于检验两个不相关样本在相同变量上的观测值均值之间差异的显著性。要求①正态性,各个样本均来自于正态分布的总体;②方差齐性,各个样本所在的总体的方差相等;③独立性,两组数据之间是相互独立的,不能够相互影响。 配对样本t检验:配对样本(或相关样本)指两个样本的数据之间彼此有关联。配对样本t 检验用于检验两个相关样本的均值或一个样本,两次测量结果的均值之间差异的显著性。 方差分析:是一种通过分析样本数据的各项变异来源,以检验三个或三个以上样本平均 数是否具有显著性差异的一种统计方法。 单因素方差分析:用于检验一个因素变量的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化。 多重比较:进行了全方差分析之后,当自变量有3个或3个以上水平时,还有要对每两个组之间均值的差异进行比较,这称作事后组间均值的“多重比较”。 多因素方差分析:是检验两个或两个以上因素变量(自变量)的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化的分析方法。 主效应和“交互作用”效应:主效应考察的是在忽略其他因素的情况下一个自变量对观察变量的影响,即这一个因素变量的不同水平分组下的观测值的均值之间的差异是否显著。当一个自变量的单独效应随另一个自变量的水平的不同而不同时,则这两个自变量对因变量的影响存在交互作用。 协变量方差分析:是在进行方差分析时将那些除了要考察的自变量之外的、很难控制的、且对因变量产生显著影响的无关变量作为“协变量”,在分析自变量对因变量的影响时,消除协变量对因变量的影响,从而使分析的结果更准确。。 多元方差分析:有两个或两个以上的因变量的方差分析(可以是单因素的,也可以是多因素的)称为多元方差分析。 重复测量的方差分析:用于某个测量指标对每个被试在不同的时间内进行多次(3次或3次以上)重复测量的情况。 组间因素:是被试分组的因素,组间因素有几个水平就把被试划分成几个组。 组内因素:又称重复测量因素,就是测试的不同水平或不同次数,是在每个被试内的因素。组内因素的不同水平决定了重复测量的次数。 方差成分分析:是对混合效应模型的分析,如对单变量重复测量和随机区组设计的分析,用于分析混合效应模型中各随机效应对因变量变异贡献的大小。通过对方差的成分进行分析,可以确定如何减小方差。 相关分析:是分析两个变量观测值变化的一致性程度或密切程度的统计方法。 简单相关分析:用于只对两个变量的数据做相关分析,其中包括两个连续变量之间的相关和两个等级变量之间的秩相关。 偏相关分析:是控制第三变量(或其他多个变量)的影响后,两变量间相关程度的统计方法。皮尔逊相关:是对两列变量为连续等间隔(等距、等比)数据,而且数据呈正态分布的相关

SPSS简明教程(绝对受用)

第一章SPSS概览--数据分析实例详解 1.1 数据的输入和保存 1.1.1 SPSS的界面 1.1.2 定义变量 1.1.3 输入数据 1.1.4 保存数据 1.2 数据的预分析 1.2.1 数据的简单描述 1.2.2 绘制直方图 1.3 按题目要求进行统计分析 1.4 保存和导出分析结果 1.4.1 保存文件 1.4.2 导出分析结果 希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。 例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 解题流程如下:

1.将数据输入SPSS,并存盘以防断电。 2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采 用的检验方法。 3.按题目要求进行统计分析。 4.保存和导出分析结果。 下面就按这几步依次讲解。 §1.1 数据的输入和保存 1.1.1 SPSS的界面 当打开SPSS后,展现在我们面前的界面如下: 请将鼠标在上图中的各处停留,很快就会弹出相应部位的名称。 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、

SPSS习题1 答案

习题一(与第三章内容配套) 1.数据文件:《公司职工》 1)按照以下标准,给指定的变量观察值分组: (1)变量:educ(受教育年限) 中学:educ≤12;大学: 12<educ≤16;研究生:educ≥17 (2)变量:age(年龄) 青年:age<40;中年:40≤age<60;老年:age≥60 (3)变量:salary(当前薪金) 低收入:salary≤20000;中收入:20000<salary≤40000;高收入:salary>40000 2)统计老、中、青年各组的人数及占全体职工的比率。 3)统计不同性别的职工中,高、中、低收入的人数,及占全体职工人数的比率。 4)在不同的受教育组中,按性别(gender)统计的不同职务(jobcat)的人数及占全体职工人数的比率。 5)同3),但还要统计每一组的平均当前薪金(salary)、最大当前薪金和最小当前薪金。 2.数据文件:《学生考试成绩》 1)按以下要求,将成绩score分为五等:优:score≥90;良:80≤score<90;中:70≤score<80;及格:60≤score<70;不及格:score<60。 2)按照以上五个等级,统计每一个等级的人数及占总体的比率: (1)总体取全体参加考试的学生; (2)总体取每一个班级; (3)总体取男生及女生。 3)求全体参加考试学生的总平均成绩、每一班的平均成绩以及男、女生的平均成绩。 4)全体学生成绩的中位数是多少?男、女生成绩的中位数分别是多少?成绩在60分(含)以上的学生占全体学生的比率是多少?80%的学生成绩不低于多少分?每一班的最高分与最低分分别是多少? 5)在每一个班级中,分男、女生统计不同成绩等级的学生人数及每一等级的平均分、最高分与最低分。 答案: 1. 1)

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

spss实践题分析及答案

期末实践考查 一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。试按照客户要求进行分析,给出分析报告(数据见附表)。 Descriptive Statistics Mean Std. Deviation N 消费金额(元)3964.06 933.494 50 年收入(元)43480.00 14550.742 50 家庭人口(人) 3.42 1.739 50 Correlations 消费金额(元)年收入(元)家庭人口(人)Pearson Correlation 消费金额(元) 1.000 .631 .753 年收入(元).631 1.000 .173 家庭人口(人).753 .173 1.000 Sig. (1-tailed) 消费金额(元). .000 .000 年收入(元).000 . .115 家庭人口(人).000 .115 . N 消费金额(元)50 50 50 年收入(元)50 50 50 家庭人口(人)50 50 50 Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate 1 .909a.826 .818 398.091

ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 35250755.672 2 17625377.836 111.218 .000a Residual 7448393.148 47 158476.450 Total 42699148.820 49 Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 1304.905 197.655 6.602 .000 年收入(元) .033 .004 .516 8.350 .000 家庭人口(人) 356.296 33.201 .664 10.732 .000 结果分析:由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口 看作两个自变量,每年信用卡支付金额看作因变量。 由分析得: 121304.9050.033356.296y x x =++ y :信用卡支付金额 1x :年收入 2x :家庭人口 拟合优度检验2R 为0.818,回归方程能很好的代表样本数据。回归方程F 检验和回归系数T 检验的相伴概率都小于显著性水平,拒绝零假设即回归方程和回归系数都具显著型。 二、下表为运动员与大学生的身高(cm )与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析,并给出分析报告。

SPSS教程1数据文件

一.数据文件 SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。 1 在SPSS数据编辑窗口建立数据文件 当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。 图进入SPSS数据编辑器 (1) 数据编辑(SPSS Data Editor)界面介绍 窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。 窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。

SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs图形,Utilities公用项,Windows视窗。 图 SPSS窗口界面 常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。 数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。 编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。

Spss进行问卷分析的步骤.pdf

如何用spss软件处理问卷 (2007-07-02 19:30:04) 转载▼ 标签: 分类:电脑/科技 spss教程 spss软件 spss问卷处理 当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过 程:定义变量﹑数据录入﹑统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细 的介绍. Spss处理: 第一步:定义变量 大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View两个标签,只需单击左下方的Variable View 标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下 几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位) 、label(变量标签) 、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类). 我们知道在spss中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多 少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我们以问卷第 一个问题为例来说明变量的设置.为了便于说明,可假设此题为: 1.请问你的年龄属于下面哪一个年龄段( )? A:20—29 B:30—39 C:40—49 D:50--59

SPSS机试考题答案

第一部分 数据整理考试题 1建立以下数据的数据文件: 对所建立的数据文件进行以下处理: ⑴计算每个学生的总成绩、平均成绩,并按照总成绩的大小进行排序(转换-计算变量,数据-排序个案) ⑵设Z Y X 、、分别表示语文、数学、化学,对称其进行以下处理: ①X X =' ②5+='Y Y (x1=sqrt(x)) ③对化学成绩,若是男生,5+='Z Z (转换-计算变量) 若是女生:10+= 'Z Z ④把数学成绩分成优、良、中三个等级,规则为优(X ≥85),良(75≤X ≤ 84),中(X ≤74),并进行汇总统计。(转换-重新编码为不同变量,频数分析) 2 在一次智力测验中,共有10个选择题,每题有A,B,C,D 四个答案,8个被测对象的答卷如下表。已知第1、6、10题的正确答案为A ,第4、5、7、8题的正确答案为B, 第2、9题的正确答案为C, 第3题的正确答案为D,请建立合适的数据文件,统计每个被测对象的总成绩(满分100)。(转换-对个案内的值计数,选择题号,再定义值 A or B C D 然后添加,转换-计算变量,Q+W+E+R 再乘以10就是总成绩) 3某个汽车收费站在每10分钟内统计到达车辆的数量,共取得20次观察数据,分别是:27、30、3l 、33、16、20、34、24、19、27、21、28、32、22、15、33、26、26、38、24,现要求以5为组距,对上述资料进行分组整理。(再重新转换-重新编码为不同变量) 4 练习加权处理功能: ⑴练习课本案例3-8(p84).(加权销售量,再分析-描述统计-描述,只添加单价,均值即是当天平均价格)

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

最新spss统计练习题及答案

SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单?

SPSS教程(完整)

第二章 SPSS统计应用 第一节 SPSS基础 SPSS(Statistical Package for the Social Sciences)即社会科学统计软件包,是当今世界上公认的最流行、最强大的三大统计分析软件(SPSS、SAS和BMDP)之一。SPSS从10.0版本开始就基于Microsoft Windows 95操作系统上运行,具有Windows软件的共同特征。由于SPSS具有统计、绘图功能强、使用简单方便等优点。受到广大科研工作者的青睐。 在这里主要以12.0版为基础,介绍SPSS的基本使用方法。 一、SPSS安装和运行 1 SPSS v12.0 安装 打开计算机,启动Windows XP操作系统。 1) 将课程配备的光碟放入光盘驱动器中。 2) 启动Windows资源管理器,双击光盘驱动器图标,在目录窗口中找到“SPSS12 install”文件夹,双击进入该文件夹;找到“setup”应用程序,双击后就启动安装。显示欢迎安装SPSS 12.0版以及版权声明(图2-1),浏览后单击“Next”按钮进入下一个画面。 图2-1 SPSS12.0欢迎窗口 3)同意SPSS12.0软件协议 用户阅读“协议”,同意协议,单击“I accept the terms in license agreement”选项。 否则单击“Cancel”退出安装,如图2-2。

图2-2 软件协议窗口 4)阅读SPSS 12.0 自述文件后,单击“Next”按钮,进入下一个界面。5)填写用户信息。 例如:在用户名“Name:”栏填写: Student 在单位名称“Organization:”栏填写: SWU 如图2-3。单击“Next”按钮,进入下一个界面。 图2-3填写用户信息 5)指定SPSS12.0系统的安装目录(图2-4)

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

spss期末考试上机复习题(含答案)75709

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 83 78

2 3 4 5 6 69 87 93 78 59 65 88 91 72 59 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data

相关文档