文档库 最新最全的文档下载
当前位置:文档库 › SPSS实用统计分析习题

SPSS实用统计分析习题

SPSS实用统计分析习题
SPSS实用统计分析习题

第2章习题

2、1 指出下列哪些是不合法的变量名?为什么?

a、Educl2yr

b、&ab345

c、fund_$

d、my_

e、With-1

f、Student's

g、My age h、论文数量i、grade02

2、2 为下列变量指定其类型、测度水平,并为适合定义值标签的变量定义相应的值标签

a、公交公司年载客量h、每天上网的小时数

c、某市的行政区划

d、某地每日的平均气温

e、对待电视节目中武打片的态度

f、10~11时内到汽车站候车人数

g、血液中白细胞数量h、库存物资种类

l、某市日啤酒消耗量i、运动会比赛项目

2、3 搜集数据,建立一个数据文件记录你所在班级学生下列情况:学号、姓名、年龄、籍贯、民族、家庭电话号码、出生年月日、评定成绩等级(优、良、中、可、差)等,给出正确的变量名、变量类型、标签及值标签、测度水平。

2、4 试对一个数据文件的部分变量和全部变量作转置练习,指出:

(1)在转置后的文件中,系统产生的新变量有何特征?

(2)文件转置后原来文件中的变量的哪些信息将会丢失?

2、5 下面的表,分别为某企业1991年~1995年5年中各季度计划完成和实际完成的产量

划产量和实际完成的产量、平均产量。

2、6 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管

g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。

(1)调用Sort Cases命令分别对年产值、职工人数和年工资总额进行排序。许多SPSS文件中都定义一个表示观测量序号的id变量,按照自己的体会指出这个id变量的作用。

(2)调用Aggregate命令分别按部门和所有制类型作分类汇总。

(3)首先调用Sort Cases命令分别按部门:按所有制类型;按部门和所有制类型进行排序。再执行Analyze →Descriptives Statistics →Descriptives,对年产值、职工人数和年工资总额进行描述。

(4)首先调用Split File命令分别按部门和所有制类型将文件分组,再重复(3)的操作,比较二者的差异。

2、8 针对一个数据文件(如对习题2、6建立的数据文件)作选择观测量练习,并回答下列问题:

(1)选择随机抽样方法,抽取约30%的观测量作为样本,将此执行两次,所得到的样本是否相同?

(2)将随机选择的部分观测量能否作为样本加以保存?下一次打开这个文件要使用上次选择的随机样本作统计分析,应执行何种操作?

2、9 下表列出3个民族的血型分布数据,为了统计各个民族和各种血型的人数,选择合适的结构将此组输入到SPSS数据窗口建立数据文件。(提示:定义人数为权变量)

统计量,研究如何定义一个恰当的SPSS 数据文件,以便完成这个统计任务。 (提示:例如,可以选择如下一种方法,定义4个数值型变量:

grade :年级,取值为1,2,3,4分别代表4个年级;sex :性别,取值为1,2分别代 表男性和女性;age :年龄,取各组组中值18,21,24,26分别代表4个年龄段;numbers : 人数,并定义此变量为加权变量,但需注意输入数据时,凡年龄段人数为0者皆莫输入。)

第3章 习 题

3、1 修改下列命令语句的语法错误: total = partl + part2 + part3 .

Compute salaryl = base * 1.25 + award – tax . /salary2 = base + award - tax .

if (math >= 90) Compute grade = 1 .

3、2 在Compute 对话框中,假定定义目标变量是一个字符型变量,表达式框中输入字符串表达式,单击Paste 按钮,在Syntax 窗口中,观察对应的Compute 命令语句和IF 命令语句的格式。

3、3 设数据文件中定义了一个变量x ,变量值为0,1,…,90,试应用SPSS 的Compute 功能输出一个0°~ 90°角的正弦、余弦、正切和余切的函数值表。

3、4 试给出用SPSS 输出自变量x 值为0.1,0.2,…,10的指数函数e x 和log (x )值表的操作过程。 3、5 假定下列表达式中的自变量皆为SPSS 数据文件中已定义的变量,试将它们写成SPSS 表达式:

(1)|2cos sin |x y z + ;(2)3211x

x

y e -+

+ ;(32,(0,40a b ac ≠-≥)

3、6 设离散型随机变量X 服从参数 n =10,p = 0.85的二项分布,试利用SPSS 的二项累积分布函数CDE.BINOM (q ,n ,p )计算X 的概率分布。并计算随机变量X 的数学期望和方差。

3、7 设100件产品中有10件次品,从中随机地抽出15件,求其中的次品数X 的分布律。并计算随机变量X 的数学期望和方差。

(提示:使用SPSS 的超几何分布函数CDE.HYPER (X ,total ,sample ,hits ),其中total 为产品总数,sample 为抽取的样本数,hits 为全部产品中的次品数,X 的取值为0,1,2,…,10)。

3、8 利用SPSS 的Compute 功能或编写程序,对α = 0.1,0.05,0.025,0.01,0.005: (1)调用标准正态分布的逆分布函数PROBIT (prob ),输出一张的标准正态分布的上侧α分位点表,即{}P X z αα>=。

(2)调用T 分布的逆分布函数IDE.T (p ,df ),输出一张自由度从1 ~ 45的T 分布的上侧α分位点表,即{()()}P t n t n αα>=。

类似地调用2χ分布和F 分布的逆分布函数,输出卡方分布和F 分布的上侧α分位点表。 3、9 如下图(局部)所示的文件中记录了某公司职工workage (工龄)、wage (月基本工资)、dutyday (出勤天数)、w_e_fee (应扣水电费)等项数据的资料,公司财务规定,工资按照下列原则发放:

(1)出满勤22天或以上者,按照“日基本工资×出勤天数+工龄×1.8-应扣水电费”计算; (2)出勤15天或以上,20天以下者,按照“日基本工资×出勤天数+工龄×1.2-应扣水电费”计算;

(3)出勤15天以下者,按照“日基本工资×出勤天数+工龄-应扣水电费”计算。 其中“日基本工资=月基本工资/22.5”,试编写一个计算输出职工当月实发工资的SPSS 语法程序。

试计算该厂产品的产量指数、单位成本指数以及总成本指数。

3、11 设有某地区1978年—1990年粮食总产量(万吨)、蔬菜总产量(万吨)、年末总人口数(万人)、国民生产总值(亿元)等经济指标的历史资料,如下表所示。

定义变量year、food、veg、popul、GDP代表各项指标,建立数据文件,并使用SPSS 的Compute命令计算:

(1)人均粮食产量、人均蔬菜产量、人均国民生产总值;

(2)表列各项指标的环比发展速度、定基发展速度;

(3)表列各项指标的环比增长量、定基增长量。或者调用SPSS的Create Time Series(产生时间序列)命令,选用一阶变差计算环比增长量、定基增长量。

3、12 假设有一个记录某厂全体职工年龄(age)、工资(wage)的数据文件,现需要将年龄和工资分别按下列规定划分:

(1)试用SPSS的重新赋值功能为这两个变量分别赋予适当的变量值,使它们成为分类变量。

(2)假定这个数据文件为去年编辑的,今年职工的年龄均增加了一岁,工资也都按照规定有所变化,要更改年龄和工资应使用SPSS的哪个功能来实现?

第4章习题

4、1 编辑一个你班级学生信息的数据文件,定义下列变量:id(学号)、name(姓名)、sex(性别)、group(学习小组)、math(数学考试成绩)、english(英语成绩)等,输入数据,然后做如下工作:

(1)以变量math和english作为概述变量,以sex和group作为分组变量,并选择若干描述统计量,输出关于这两门功课考试情况的层分析报告。

(2)使用观测量概述功能,按照sex或者group作为分组变量,分别输出两门功课考试成

绩的观测量概述报告。

(3)使用行概述和列概述功能,分别输出两门功课考试成绩的观测量概述报告。

4、2 比较本章的4项概述报告过程的差异,回答下列问题:

(1)可以使用哪些概述报告功能输出各分组概述变量的极差?

(2)统计学中变量的标准差与均值之比称为标准差系数,应该使用哪种功能才能计算各分组概述变量的标准差系数?

4、3 对习题3、6的表列数据建立的数据文件,作出如下的统计分析报告:

(1)按部门和所有制形式选择系统默认选项输出层分析报告,观察各部门和各种所有制企业的年总产值、职工总人数、工资总额;平均产值、企业平均人数、平均工资等。

(2)按部门和所有制形式选择与(1)中相同的统计量,分别输出行概述报告和列概述报告。(3)根据输出报告中提供的数据,对该地区各部门或各种所有制企业的经济发展水平和职工收益作出简要的分析。

4、4 对于PU例4、4、2的问题,试分析使用SPSS有无更简洁的方法求出平均价格。

4、5 某市市场管理人员调查了该市6家百货商店一个月内29时彩电的销售量和销售额的

4、6 下列表中列出某地区1986年~1995年(七五一八五计划)粮食产量、人口、工业总产值、国民生产总值的环比发展速度,试选用OLAP Cubs或者Case Summaries过程,分两个5年计划分别输出该地区上述各项指标的平均发展速度,以及全期的平均发展速度。(提示:建立数据文件后,定义一个按5年计划分类的分类变量,在概述统计量对话框中选用Geomitric Mean。)

4、7 根据习题4、6的数据资料,执行丁Transform—Compute命令,分别计算七五—八五计划期间各项指标的平均发展速度,以及全期的平均发展速度。

4、8 下表所列的是某市2000年竣工的21幢商品楼所处地段(district)、标定价格(price)

和最终出售价格(sale)(单位:元/平方米)资料。

试建立相应的数据文件调用OLAP Cube过程、按行概述报告过程、按列概述报告过程分别输出统计报告,概述各地段楼房价格的平均(标定、实际)价格、价格标准差、最低价格、最高价格等。

4、9 SPSS自带的系统数据文件“world95.Save”记录了世界上109个国家和地区经济发展基本情况的数据,文件包含26个变量,针对这一数据文件,做如下工作:

(1)选择其中:country(国家)、populatn(以千人计人口总数)、lifeexpf(女性人口的平均寿命)、lifeexpm(男性人口的平均寿命)、gdp_cap(人均国民生产总值)和region(各国所属的区域或经济组织)等6个变量建立变量子集。

(2)使用这个子集,选择region为分组变量,选择populam、lifeexpf、lifeexpm和gdp_cap 为概述分析变量,执行OLAP Cubes过程,输出层分析报告表。报告中特别输出变量lifeexpf 与lifeexpm的差值百分数比。

(3)执行行概述报告和列概述报告,比较各种报告的差异。

(4)选择文件中其他变量作为概述变量或分组变量重复上述工作。

第5章习题

5、1 下列数据记录的是30名大学生每周上网的时间数(以小时计):0,0,1,1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,4,4,5,5,6,8,8,9,10。试填写如下的统计表。

5、2 某公司所属企业月销售额(万元)的条形图如下图所示,根据图填写统计量表中的缺项数值。

F r e q u e n c y

5、3 对同一个分析变量执行频数分析过程,分别输出条形图和直方图,比较二者的区别。 5、4 下列频数表是对一份关于被调查者对自己职业满意程度的社会调查数据资料,执行频数分析过程输出的频数表。其中定义opinion 为数值型变量,标签为“对工作的满意程度”,值为1,2,3,4。试填写表中空格处的数值。

5、5 调查100名健康女大学生的血清总蛋白含量(g %)如下表,试作频数表分析。 7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.27 6.88 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.03 7.95 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.50 7.72 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 7.04 6.73 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.43 7.04 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.65 6.73 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.72 7.65 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.35 6.73 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 7.27 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 7.27

8.43

5、6 考虑下列25个人的年龄:21,23,23,24,25,25,30,30,32,35,37,37,40,40,41,41,42,42,45,75,完成下列茎叶图。

AGE Stem-and-Leaf Plot

Frequency Stem & Leaf

2.

3.

4.

Stem width: 10.00

Each leaf: 1 case(s)

5、7 下图为从某厂全部职工中随机抽出的31名职工的年工资(元)分布的茎叶图:WAGE Stem-and-Leaf Plot

Frequency Stem & Leaf

4.00 41 . 5566

5.00 42 . 23344

6.00 43 . 556668

8.00 44 . 02455688

4.00 45 . 1458

.00 46 .

3.00 47 . 356

1.00 Extremes (>=8850)

Stem width: 100.00

Each leaf: 1 case(s)

(1)根据茎叶图列出这31个人的年工资额,定义变量建立数据文件,使用Compute对话框,计算年工资的Z得分;

(2)建立记录工资的数据文件,输出该公司职工工资的描述性统计表。指出全厂职工年工资的均值、标准差、95%置信区间等。

5、8 试根据某个班级会计、统计、管理3门功课考试成绩的箱图(下图)回答下列问题:

(1)估计该班各科考试成绩的中位数。 (2)估计管理成绩的内四分位数界。

(3)从会计成绩的奇异值的位置估计该学生的会计成绩。

(4)哪一门功课成绩的变异程度最大?哪一门成绩的变异程度最小? 5、9 下表是从住房和社区服务问题调查中抽出的容量为18的样本,调查住户的住房购还是租用(1=“自购”,2=“租用”)以及对社区服务的满意程度(1=“不满意”,2=“满意”,

填写如下交叉表,并调用SPSS 的交叉表过程,进一步分析人们对城市服务的满意程度。 APPROVE

5、10 针对习题4、8建立的数据文件,调用Ratio 统计过程,分析各地段的商品楼的标格与实际销售价格比率变化的分布情况,各地段价格比率是否均匀或一致?

第6章 习 题 6、1 试组织编辑一个你们班级期末各门功课考试成绩的数据文件,按性别和学习小组分析考试成绩之间的差异。

6、2 设 (1,2,,)i X i n = 为取自某个未知方差的正态总体的样本,总体均值μ的(1-α)100%置信区间为

/2/2((1),(1))X t n X t n αα--+- ,考虑怎样利用SPSS 计算出这个置信区间?SPSS 中也没有给出求总体方差的区间估计的过程,考虑能否自行设

计一个计算方差的区间估计的方法?

6、3 从某化工厂生产的两批瓶装无水酒精中,分别抽出12瓶和14瓶进行检查,据以往经验,假定两批产品中杂质含量均服从正态分布,且两批产品杂质含量相互独立,调用SPSS 的独立样本T 检验过程,检验两批产品杂质含量的差异,得到如下分析表,试填写表中的

空格,并对结果作出解释。

Independent Samples Test

Equal variances assumed

Equal variances not

assumed

Levene's Test for Equality of Variances

F 0.005 Sig 0.946 t -1.081 -1.090

df

23.897

t-test for Equality of Means Sig. (2-tailed)

Mean Difference

Std. Error

Difference 0.1954 0.1939

95% Confidence

Interval of the

Lower

-0.6146 -0.6116 6、4 使用对习题2、6建立的两种品种小麦千粒重的数据文件,执行Analyze —Compare Means —Means 命令,对小麦品种和不同村庄对小麦千粒重的影响进行分析。并与使用Aggregate 命令汇总的结果作比较。

6、5 设下列样本为取自某未知方差的正态总体的样本:

99.33 98.75 100.52 101.35 98.65 99.70 99.58 104.12 100.84

对给定α= 0.1,0.05,0.01,计算总体均值 μ的(1-α)100%置信区间。

(提示:首先定义变量x 输入样本值,定义变量p 输入数值0.95,0.975,0.995,并建立数据文件;执行Descriptives 命令输出变量x 的mean 和S.E.mean ;用Compute 对话框,调用逆分布函数IDF.T (p ,df )计算分位点数值:最后再用得到的mean 和S.E.mean 值利用Compute 对话框或者编程计算置信区间上下限。)

6、6 试将例6、2、1中所列的3批元件样本的测量数据合并,作为同一个变量“Ohm ”的观察值,定义变量“batch ”(批次)标记各元件所属的批次,建立数据文件,使用独立样本T 检验过程,两两比较各批次样本的测量电阻均值之间的差异。

6、7 对下列试验进行检验,指出哪个试验应该使用独立样本检验,哪个应该使用配对样本检验?

(1)让一组测试者一一自报自己的体重,然后测量他们的体重,得到两组数据。检验自报体重与实际体重之间的差异。

(2)对人造纤维在60°和80°的水中分别作试验,检验温度对人造纤维缩水率的影响。(3)从一批产品中抽取部分产品,交由两名检验人员分别测量产品的某项性能指标。检验两人的测量结果是否存在差异。

(4)某商场分别询问了素不相识的20位男性顾客和20位女性顾客,了解他们对想要购买的电冰箱容量的要求,检验男性和女性顾客对电冰箱容量要求的差异。

6、8 某日从两台机器加工的同一种零件中分别抽取10个和9个样品,测量其尺寸(单位:cm):

甲机器:6.25, 5.78, 6.45, 6.00, 5.88, 5.76, 6.00, 5.85, 5.94, 5.79 乙机器:6.08,6.25, 5.94, 5.94,5.79,6.03, 5.85, 6.10, 5.93

据以往的经验,甲乙机器生产的零件尺寸均服从正态分布。设显著性水平α= 0.05,问两台机器生产的零件尺寸的均值有无显著差异?使用两种方法定义变量,分别调用单个样本T检验和独立样本T检验过程进行检验,总结二种检验的适用条件、输出结果的差异。

6、9 让10个失眠患者分别服用甲乙两种安眠药,观察延长睡眠时间的情况,得到如下配对数据:

甲药延时量 1.90 0.80 1.10 0.10 -0.10 4.40 5.50 1.60 4.60 3.40

乙药延时量0.70 -1.60 -0.20 -1.2 -0.10 3.40 3.70 0.80 0.00 2.20

在显著检验性水平α= 0.05下,试用配对样本的T检验过程,检验两种药物的疗效有无显著差异?

6、10 一工厂的两个化验员每天同时从工厂的冷却水中取样,测量一次水中的含氯量(ppm),下面列出10天的记录:

化验员A: 1.15 1.86 0.75 1.82 1.14 1.65 1.90 0.89 1.12 1.09

化验员B: 1.00 1.90 0.90 1.80 1.20 1.70 1.95 1.87 1.69 1.92

设各化验员的化验结果服从正态分布,试选用适当的检验过程,检验两个化验员测盏的结果之间是否有显著差异? (α= 0.05、0.01)

6、11 SPSS配带的系统文件world95.sav中,保存1995年世界上109个国家和地区的部分指标的数据,其中变量“lifeexpf ”和“lifeexpm”分别为各国或地区女性和男性人口的平均寿命。

(1)假若将这两个指标数据作为样本,试用配对样本的T检验过程检验,女性人口的平均寿命是否确实比男性人口的平均寿命长。

(2)调用Data→Select Cases命令,从中抽取部分随机样本,重复(1)进一步证实检验结果

第7章习题

7、1 根据例7、2、1中列出的样本数据,建立数据文件,使用系统默认值进行单因素方差分析,检验不同的品种的小麦的平均产量有无显著差异?

7、2 针对习题2、6所建立的数据文件,使用系统默认值进行单因素方差分析,分别检验不同的小麦品种和不同的村庄对小麦的千粒重有无显著影响?

7、3 教学研究人员想要检验3种不同教学方法的效果,随机地抽取16名水平相当的学生,分成3组,每组用一种方法教学。一段时间后进行测验,根据测验结果作单因素差分析,得到如下方差分析表。试填写表中所缺数值,并判断3种教学方法的效果有无显著差异?

(α= 0.05)

SCORE 成绩

7、4 为了评比某种型号的电池质量,分别从A、B、C三个工厂生产的同种型号电池中各

假设电池寿命服从正态分布,试在显著性水平α= 0.05下,检验电池的平均寿命有无显著差异?

7、5 将4个不同的水稻品种A1、A2、A3、A4安排在面积相同的4种不同土质的地块B1、

假设水稻品种与地块之间无交互作用,建立适当的数据文件,试用SPSS的Univariate 命令,在显著性水平α= 0.05,检验:

(1)不同的品种对水稻的产量有无显著的影响? (2)不同的土质对水稻的产量有无显著的影响?

建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平α= 0.05下,检验各因子的主效应与交互作用对得率的影响。

7、7 在一个考察纤维弹性(spring)受收缩率(fac_a)和拉伸倍数(fac_b)的试验中,两因素各取4种水平,因素的各种搭配下分别作两次试验,根据试验结果的数据文件,执行SPSS的Univariate命令得到如下的方差分析表:

Tests of Between—Subjects Effects

Dependent Variable:SPRING 纤维弹性

Source Type Ⅲsum of Squares df Mean Square F Sig. Corrected Model 157.719 a15 10.518 7.874 0.000 Intercept 174492.781 1 174492.781 129855.093 0.000 FAC_A(收缩率)70.594 3 23.531 17.512 0.000 FAC_B(拉伸倍数)7.594 3 2.865 2.132 0.136 FAC_A*FAC_B 79.531 9 7.837 6.576 0.001 Error 21.500 16 1.344

Total 174673.000 32

Corrected Total 180.219 31

a R Squared=.881 (Adjusted R Squared =.769)

根据表中的输出结果指出:收缩率和拉伸倍数对纤维弹性有无显著影响,两因素的交互作用对纤维弹性有无显著影响,写出简单的检验报告。(检验的显著性水平α= 0.05)

假定各工人的日产量服从正态分布,建立适当的数据文件,使用SPSS的Univariate命令,在显著性水平α= 0.05下,检验:

(1)工人的操作水平之间有无显著差异?

(2)不同的机器之间有无显著差异?

(3)不同工人的操作水平与不同的机器之间的交互作用是否显著?

7、9 用3种栽培技术和4种施肥方案相互搭配组成12种育苗方案作杨树育苗试验,在每

设苗高服从等方差的正态分布,建立适当的数据文件,试用SPSS的Univariate命令在显著性水平α= 0.05下,检验:

(1)不同栽培技术对苗高有无显著影响?

(2)不同施肥方案对苗高有无显著影响?

(3)二者的交互作用对苗高的影响是否显著?

第8章习题

8、1 对下列各对变量,判断它们之间是否存在相关关系,相关系数为正、负、还是零?(1)每日卡路里的摄入量与体重。

(2)海拔与平均气温。

(3)国内生产总值与新生婴儿的死亡率。

(4)家庭的总收入与文化生活的服务支出。

(5)结婚年龄与受教育的时间。

(6)每日的吸烟数量与肺功能。

8、2 调用SPSS的系统数据文件world95.sav,针对文件中的变量:

(1)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及每天卡路里摄入量(colories):

(2)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及人均国民生产总值(gdp_cap):

(3)男性人口的平均寿命(1ifeexpm)、女性人口的平均寿命(1ifeexpf)以及识字(1iteracy);(4)成人识字率(1iteracy)、人均国民生产总值(gdp_cap)。

分别执行Bivariate(二元相关)命令,分析变量之间的相关关系。

8、3 下表中列出某地区九个市县社会商品零售总额(亿元)、城市居民年平均收入(元)、农民年平均收入(万元)的数据,分别记为变量retail、townsman、farmers。

执行Bivariate(二元相关)命令,分析变量之间的相关关系。

8、4 某医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用x表示大白鼠进食量和用y表示大鼠增加体重,试作x与y之间的相关分析。

执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。

8、7 两位评酒师对20种酒的等级(1~10)进行评定,评定结果如下表所示。

drink A B drink A B

1 6 8 11 6 9

2 4 5 12 8 5

3 7

4 13 4 2

4 8 7 14 3 3

5 2 3 15

6 8

6 7 4 16 9 10

7 9 9 17 9 8

8 7 8 18 4 6

9 2 5 19 4 3

10 4 3 20 5 5

建立数据文件,回答下列问题:

(1)执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。(2)执行Distances命令,分析评定结果之间的相似关系。

(3)执行Distances命令,计算观测量之间的欧几里得距离,分析观测量之间的亲疏关系。

8、8 在图8-7的距离分析不相似测度对话框中,Transform Values(值转换)栏提供了数值转换方法,针对各种方法给出相应的数学计算公式。在数据窗口任意定义一个变量,并赋予若干变量值,应用SPSS的Compute对话框,用建立的计算公式对该变量执行数值转换,观查转换的结果。

第9章习题

(1)建立数据文件,执行二元相关命令,判断变量x与y之间是否有线性相关关系;(2)若线性相关,执行Analyze→Regression→Linear命令分别求出y关于x和x关于y的回归方程;比较二者的不同。

9、2 试根据习题3、8中的数据资料,建立下列变量之间的回归方程,分析它们之间的关系。

(1)分别建立因变量GDP(国民生产总值)、food、veg、popul与year之间的一元线性回归方程。给出分析报告;

(2)建立因变量GDP与food、veg、popul之间的多元线性回归方程,给出分析报告。

9、3 某研究所每年的净收益(income)的主要影响因素为该所每年实际研究费用(fee)和研究人员数量(invest),收集近九年来的数据资料如下:

建立数据文件,求因变量income对自变量fee和invest的线性回归方程,给出分析结果报告。如设自变量fee和invest取下列各对数值时,求出income的预测值。

fee :135、140、160、188、200

invest :360、380、400、400、410

9、4 锡克试验阴性(%)随着年龄的增长而增高,某地区医院调查得到儿童年龄(岁)Y 与锡克试验阴性率Y的资料如下:

建立数据文件,试执行Regression →Curve Estimation (曲线估计过程)命令,选用二次、三次和对数曲线模型拟合此组数据。

其中:x1为土壤中含无机磷浓度;

x2为土壤中溶于K2C03溶液并受溴化物水解的无机磷浓度;

x3为土壤中溶于K2C03溶液但不受溴化物水解的无机磷浓度;

y为种植在20°C土壤内的玉米中的可给态磷。

建立数据文件,执行Analyze →Regression →Linear命令并选择逐步回归,求y关于x1、x2、x3、的线性回归方程,并给出分析报告。

9、6 维尼纶厂生产牵切纱的工艺流程由牵切、粗纺、细纺三道工序组成,根据经验粗纱的重量不匀率Z 与牵切条干不匀率x 及牵切重量不匀率y 有关,试验测定20个样品得到下表中的数据:

建立数据文件,求出Z 关于x 和y 的回归方程,根据方程的检验结果,再选用逐步回归法求解。

9、7 测得云杉平均树高h (米)和平均树径d (厘米)之间下列数据: d 15 20 25 30 35 40 45 50 22 60 65 h

13.9

17.1

20.0

22.1

24.0

25.6

27.0

28.3

29.4

30.2

31.4

建立数据文件并调用Curve Estimation (曲线估计过程)求平均树高h (米)和平均树径d (厘米)之间的下列曲线拟合模型: (1)二次函数2

h a b d c d =+?+?; (2)幂函数b

h a d =?; (3)指数函数d h a b =?; (4)对数函数ln()h a b d =+?;

并分析哪种曲线拟合较好?

9、8 对习题9、7的数据,调用Nonlinier (非线性回归过程)求平均树高h (米)和平均树径d (厘米)之间的4种曲线回归模型,与9、7题的曲线拟合结果进行比较。

9、9 利用本章例9、3、1的数据资料,选用表9、20中所列的Verhulst (维尔哈斯特)模型,进行非线性回归分析。

9、10 今搜集到20名糖尿病人的血糖(Y ,mmol /L )、胰岛素(X1,mU /L )及生长素(X2,μg /L )的测量数据列于下表:

试建立数据文件,试进行多元线性回归分析,求变量Y与X1、X2之间的回归方程。

第10章习题

10、1 在一个正20面体的各面上标有0,1,2,…,9十个数字,每个数字在两个面上标

10、2 某炼铁厂在正常生产情况下,记录的116炉铁水中含碳量的百分比数据列于下表:4.57 4.59 4.42 4.68 4.58 4.50 4.52 4.62 4.60 4.53 4.73 4.64 4.44 4.33 4.43 4.59 4.37 4.48 4.57 4.64 4.54 4.67 4.67 4.53 4.51 4.53 4.50 4.54 4.61 4.53 4.58 4.30 4.72 4.59 4.53 4.55 4.57 4.60 4.54 4.61 4.57 4.49 4.43 4.77 4.67 4.65 4.50 4.52 4.57 4.42 4.28 4.66 4.42 4.50 4.52 4.60 4.72 4.51 4.48 4.57 4.48 4.57 4.40 4.57 4.47 4.44 4.81 4.57 4.49 4.50 4.56 4.53 4.78 4.40 4.49 4.43 4.42 4.48 4.39 4.63 4.50 4.47 4.60 4.51 4.61 4.55 4.47 4.59 4.60 4.62 4.65 4.40 4.52 4.60 4.70 4.55 4.52 4.39 4.57 4.60 4.57 4.63 4.66 4.55 4.57 4.61 4.60 4.36 4.60 4.44 4.57 4.54 4.52 4.68 4.50 4.62

先执行Frequencies命令输出直方图,观察铁水中含碳量大致服从何种分布?再分别用卡方检验法和单个样本的K-S检验法检验原假设1l:铁水中含碳量服从正态分布。

10、3 某实验室对一个物理参数的值进行了25次独立测量,测量结果与该参数的理论值之间的偏差情况如下:(数据已经经过排序)

-2.46 -2.11 -1.23 -0.99 -0.42 -0.39 -0.21 -0.15 -0.10 -0.07 -0.02 0.27 0.40 0.42 0.44 0.70 0.81 0.88 1.07 1.39 1.40 1.47 1.62 1.64 1.76

试用单个样本的K-S检验法检验假设H0 :测量偏差服从正态分布。

10、4 在一大批相同型号的电子元件中随机地抽取10只作寿命试验,测得它们的使用寿命(单位:小时)为

420 500 920 1380 1510 1650 1760 2100 2320 2350

试用单个样本的K-S检验法检验假设H0 :测量偏差服从指数分布。

10、5 从随机数表中抽得20个观测数据如下:

0.55 0.80 0.15 0.12 0.21 0.40 0.46 0.17 0.62 0.63

0.71 0.99 0.88 0.30 0.64 0.51 0.68 0.50 0.60 0.77

使用单个样本的K-S检验它是否服从均匀分布?

10、6 为检验两台光测高温计所测定的温度读数之间有无系统误差,用这两台光测高温计同时对一热炽灯灯丝作了10次观察,得到如下数据(℃):

甲高温计1050 1028 918 1183 1200 980 1258 1308 1420 1500

乙高温计1070 1020 936 1185 1211 1002 1254 1330 1425 1545

分别用符号检验法和秩和检验法检验这两台光测高温计所测定的温度之间有无系统误差。

10、7 为了建立白炽灯泡的质量管理,从生产线上连续抽出32只灯泡依次贴上序号,然后作寿命试验,得到每只灯泡寿命的数据(千小时)如下:

经计算这32只灯泡的平均寿命为1.435千小时,执行Transform →Recode →Into Different Variables命令将比平均寿命大的用“+”标记,比平均寿命小的用“-”标记,使用游程检验法检验,“+”、“-”号序列是否可以认为是随机的。

%):

建立合适的数据文件,选用秩和检验法检验二人分析的结果有无显著差异?

10、9 某轴承厂考虑从生产同一种轴承钢的两家钢厂选一家,购买这家工厂的钢材,搜集了

据这些数据比较两厂钢材有无显著差异,确定应使用哪一种检验方法进行检验?并输出检验结果。

10、10 为了比较3种牌号的汽油,进行一项试验,选取载重量和功率都相同的21辆汽车,每7辆用一种汽油,同时在一条公路上用同样的速度行驶,得到每加仑汽油行驶的里程数据如下(英里):

spss统计分析软件习题

复习参考题 一、选择题 1.应用统计学原理进行试验设计,其最终目的是(C) A.选择该病暴露因素 B.使论文具有可续性 C.达到齐同对比、均衡化抽样 D.观察指标稳定可靠 E.使研究内容达到先进性、创新性 2.专业设计主要包括(E) A.选择观察对象 B.需组织多少观察病例 C.观察结果可重复性 D.减少或排除抽样误差 E.确立研究目的和建立假设 3.实验设计的主要目的(ABCDE) A.解决试验结果可重复性 B.提高试验效率 C.保证样本代表性 D.样本间可比性 E.观察结果精确性 4.临床研究设计中的主要困难是(ABDE) A.不能在人身上复制疾病模板 B.样本一致性较差 C.只能应用整体水平进行研究 D.观察条件不易控制 E.观察结果离散度大 5.专业设计中建立假设是(BDE) A.对某一问题的学说设定 B.一种科学预见 C.主观推测 D.对提出问题的释疑 E.推理指导下安排试验与调查 6.实验设计中的处理因素是指(D) A.随机化 B.盲法 C.观察对象代表性 D.分组因素及其水平 E.指标的客观性、稳定性 7.实验设计中必须贯彻的基本原则是(ADE) A.随机化与盲法 B.观察对象金标准 C.制定明确的纳入与排除标准 D.设立对照组

E.达到有统计意义的最低样本含量 8.随机误差(抽样误差)的数据特点是(ADE) A.个体反应差异 B.数据差异具有方向性 C.数据常不呈正态分布 D.数据趋向于接近均值水平 E.可通过统计学处理缩小或排除 9.产生偏倚的原因和控制是(CE) A.数据无规律,随机变化 B.个体反应差异所产生变化 C.不能用统计方法控制 D.数据服从正态分布 E.实验设计不周所产生的数据变化 10.选择性偏倚产生的主要原因是(BCDE) A.个体反应差异 B.测量上具有主观倾向性 C.选择病例未应用金标准 D.分组时有关特征构成的差异显著 E.抽样及分组时未采用随机盲法 11.样本代表性与下列哪些因素有关(ABCDE) A.诊断金标准 B.贯彻随机化原则 C.是否排除了偏倚产生 D.确定达到统计要求的最低样本含量 E.样本抽取与分组要有选择 12.数据资料能进行统计学处理的必须是哪一类资料(AE) A.抽样误差产生数据 B.诊断性偏倚产生数据 C.分组偏倚产生数据 D.入院率偏倚产生数据 E.具有组间可比性、随机盲法分组产生的数据 13.求样本大小设定的统计学范围是(BCE) A.设定总体标准差 B.设定检验水准 C.设定检验效能 D.设定样本均数与总体均数差值 E.设定把握度 14.那些实验设计应用正交设计(DE) A.单个处理因素、两个样本均数比较 B.单个处理因素、两个样含量不等的均数比较 C.两个处理因素、且每个因素又有两个水平的实验设计

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

最新spss统计练习题及答案

SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单?

SPSS统计分析分析案例

SPSS统计分析案例 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动内需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费

《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。分析一一描述统计一一频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表一一条形图一一 图表值(频率)一一继续,勾选显示频率表格,点击确定。

种果菜专业 户10 3.5 3.568.4 工商运专业户3412.112.180.5退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0 Total282100.0100.0 Freque ncy Perce nt Valid Perce nt Cumulative Perce nt 20岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50岁以上4114.514.5100.0 Total282100.0100.0 户口所在曲 C- 中3川毗吨 户口

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有 200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分 布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析一一描述统计一一描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续一一确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

试验三SPSS基本统计分析

实验三SPSS基本统计分析 一.实验目的和要求 1.掌握频数分析; 2.掌握计算基本描述统计量; 3.掌握交叉分组下的频数分析和各种相关性检验; 4.掌握多选项分析; 5.掌握比率分析。 二.实验的基本方法和内容 1. 频数分析 操作步骤:参阅教材第63、64、65页。 2. 基本描述统计量 操作步骤:参阅教材第68、69、70、71页。 3. 交叉分组下的频数分析 操作步骤:参阅教材第73、74、75、76、77、78、79、80、81、82、83、84、85页。 4. 多选项分析 操作步骤:参阅教材第85、86、87、88、89、90页。 5. 比率分析 操作步骤:参阅教材第91、92页。 6. 实验内容: (一)验证性实验 (1)教材第65页“商品房购买意向的调查数据分析” (2)教材第71“商品房购买意向的调查数据分析” (3)教材第79“商品房购买意向的调查数据分析” (4)教材第90“商品房购买意向的调查数据分析” (5)教材第92“保险业务的保费收入占全部业务保费收入的比例情况” (二)实践性实验 (1)对“文科成绩”的数据文件作如下统计整理: 1.利用频数分析功能,分别对“文科成绩7”中“及格次数”变量和“文科成绩9”中的“value

range ”变量,要求绘制频数分布表和频数分布图,其中频数分布表中的内容按变量值的升序输出,频数分布图前者采用饼状图,后者采用带有分布曲线的直方图,二者均输出百分比数据。最后将输出结果保存为“文科成绩7-1”和“文科成绩9-1”。 2. 对“文科成绩5.1”的spss 文件,利用描述统计功能,统计第一、第二及第三次考试成 绩的最大值,最小值,区间范围,平均值,标准差,方差,峰度,偏度等统计量的数值, 要求三个变量的输出内容按均值升值的顺序排列。最后将输出结果保存为“文科成绩5.1-1”。并配文字对数据做出以适当的分析。 3. 如何在同一个输出结果中同时输出不同学院的“第三次考试成绩”的各种基本 描述统计量,并对不同学院的学生考试成绩情况进行深入比较。 (2)调查100名健康大学生的血清总蛋白含量(g%)如下表: 1.利用描述统计功能从集中趋势、分散程度、偏斜程度、有无异常值等方面分析血清蛋白含量这个变量的分布状况。 2.原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成5组,试作分组后的频数分析,并给出带有正态曲线的直方图。 7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.27 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.03 7.43 7.35 7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.04 (3)对某城市家庭的社会经济调查中,美国某调查公司想确定家庭的家庭拥有量与汽车拥有量是否独立。该公司对10000户家庭组成的简单随机样本进行调查,获得如下资料。 现问: 1汽车用有量与量与电话拥有量是否独立?(01.0=α) 2请根据列联表特征,选择卡方统计量以外的检验方法分析行列变量之间的关联强度和关联方向。

社会统计学与spss应用练习题

应用练习题spss社会统计学与 2011—2012学年第二学期 《社会统计学与SPSS应用》练习题 一、单项选择题 1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量 2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B)A.

B. C.

D. 左50%3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D)。随机现象 D. A.非统计现象 B.统计现象 C.非随机现象左新生婴儿男女性别比一直在针对出生婴儿性别状况的多年调查发现,50%4.右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现)。新生婴儿性别状况具有(D必然性 D.随机性 A.确定性 B.因果

性 C..为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少5 年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。(B)差异D.整体C.互斥B.完备A. C)6.下列哪类变量能用折线图表示其分布状况?(虚拟变量定类变量 B.定序变量 C.定距变量 D.A. 。7.下列某变量取值状况的累积图,其中正确的表现形式是(B) .B A. .CD. 2相同,图1较之图2的密度曲线向左8.下两图是正态分布密度曲线,两图的σ移了一些,这说明(C)。

图图≥ D.μμ< C.μμ =μB.μμ>A.μ22112 112 2 1 )C(如下所示首先应该操作步骤的是对于多选项分析而言,软件中,SPSS 在.9. A. B.Freque

常用统计分析方法--SPSS应用_杜志渊)

§1.2 数据的编辑与整理 当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。 §1.2.1 数据窗口菜单栏功能操作 数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括: 图1.4 SPSS主菜单 1.File:文件操作。 2.Edit:文件编辑。 3.View:视图编辑。 4.Data:数据操作。 5.Transform:数据转换。 6.Analyze:统计分析方法。 7.Graphs:图形编辑。 8.Utilities:实用程序。 9.Windows:窗口控制。 10.Help:帮助。 在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操作。 §1.2.2 Date数据功能 数据编辑窗口的Data菜单为用户创建和定义数据提供了方便的功能,如图1.5

所示。这个菜单是SPSS 统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。 这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。 一、定义和编辑变量、观测量的命令 Define Variable Properties 用于定义变量属性; Copy Data Properties 由外部文件和工作文件拷贝数据变量和属性; Define Dates 定义或编辑日期变量格式; Insert Variable 在数据编辑窗口插入一个变量; Insert Case 在数据编辑窗口插入一个观测量; Goto Case 光标跳转到某一指定观测量。 二、变量数据变换的命令 Sort Cases 对观测量进行排序; Transpose 对观测量进行转置; Restructure 对现有的观测量进行重新构造,形成新格式的数据文件; Merge File 把外部文件数据合并到工作文件中; Aggregate 对数据进行分类或不分类汇总,产生新文件或代替工作文件。 Identify Duplicate Cases 标识重复观测量; Orthogonal Design 进行正交设计。 三、观察量数据整理的命令 图1.5 Data 菜单项示意图

SPSS实用统计分析习题

第2章习题 2、1 指出下列哪些是不合法的变量名?为什么? a、Educl2yr b、&ab345 c、fund_$ d、my_ e、With-1 f、Student's g、My age h、论文数量i、grade02 2、2 为下列变量指定其类型、测度水平,并为适合定义值标签的变量定义相应的值标签 a、公交公司年载客量h、每天上网的小时数 c、某市的行政区划 d、某地每日的平均气温 e、对待电视节目中武打片的态度 f、10~11时内到汽车站候车人数 g、血液中白细胞数量h、库存物资种类 l、某市日啤酒消耗量i、运动会比赛项目 2、3 搜集数据,建立一个数据文件记录你所在班级学生下列情况:学号、姓名、年龄、籍贯、民族、家庭电话号码、出生年月日、评定成绩等级(优、良、中、可、差)等,给出正确的变量名、变量类型、标签及值标签、测度水平。 2、4 试对一个数据文件的部分变量和全部变量作转置练习,指出: (1)在转置后的文件中,系统产生的新变量有何特征? (2)文件转置后原来文件中的变量的哪些信息将会丢失? 2、5 下面的表,分别为某企业1991年~1995年5年中各季度计划完成和实际完成的产量 划产量和实际完成的产量、平均产量。 2、6 某地区农科所为了研究该地区种植的两个小麦品种“中麦9号”、“豫展1号”产量的差异,从该地区的两个村庄各选5块田地,分别种植两个品种小麦,使用相同的田间管 g)进行分类汇总,试定义有关变量,并建立数据文件,完成分类汇总工作。

(1)调用Sort Cases命令分别对年产值、职工人数和年工资总额进行排序。许多SPSS文件中都定义一个表示观测量序号的id变量,按照自己的体会指出这个id变量的作用。 (2)调用Aggregate命令分别按部门和所有制类型作分类汇总。 (3)首先调用Sort Cases命令分别按部门:按所有制类型;按部门和所有制类型进行排序。再执行Analyze →Descriptives Statistics →Descriptives,对年产值、职工人数和年工资总额进行描述。 (4)首先调用Split File命令分别按部门和所有制类型将文件分组,再重复(3)的操作,比较二者的差异。 2、8 针对一个数据文件(如对习题2、6建立的数据文件)作选择观测量练习,并回答下列问题: (1)选择随机抽样方法,抽取约30%的观测量作为样本,将此执行两次,所得到的样本是否相同? (2)将随机选择的部分观测量能否作为样本加以保存?下一次打开这个文件要使用上次选择的随机样本作统计分析,应执行何种操作? 2、9 下表列出3个民族的血型分布数据,为了统计各个民族和各种血型的人数,选择合适的结构将此组输入到SPSS数据窗口建立数据文件。(提示:定义人数为权变量)

SPSS统计分析最全中英文对照表

SPSS 专业技术词汇、短语的中英文对照索引% of cases 各类别所占百分比 1-tailed单尾的 1Independent Samples 两个独立样本的检验 2 Related Samples 两个相关样本检验 2-tailed双尾的 3-D (=dimensional) 三维-->三维散点图 A Above 高于 Absolute 绝对的-->绝对值 Add 加,添加 Add Cases 合并个案 Add cases from...从……加个案 Add Variables 合并变量 Add variables from... 从……加变量 Adj.(=adjusted)standardized 调整后的标准化残差 Aggregate 汇总-->分类汇总 Aggregate Data 对数据进行分类汇总 Aggregate Function 汇总函数 Aggregate Variable需要分类汇总的变量 Agreement协议 Align 对齐-->对齐方式 Alignment 对齐-->对齐方式 All 全部,所有的 All cases所有个案 All categories equal 所有类别相等 All other values所有其他值 All requested variables entered 所要求变量全部引入 Alphabetic 按字母顺序的-->按字母顺序列表 Alternative 另外的,备选的 Analysis by groups is off 分组分析未开启 Analyze 分析-->统计分析 Analyze all cases, do not create groups 分析全部个案,不建立分组 Annotation 注释 ANOVA Table ANOVA表 ANOVA table and eta (对分组变量)进行单因素方差分析并计算其η值 Apply 应用 Apply Data Dictionary 应用数据字典 Apply Dictionary 应用数据字典 Approximately 大约 Approximately X% of all cases从所有个案中随机选择约X%的个案

SPSS复习题

SPSS复习题 一、简答题: 1.SPSS的运行方式有几种分别是什么各自的特点是什么 答:SPSS的运行方式有三种,分别是完全窗口菜单运行方式、程序运行方式、混合运行方式。完全窗口菜单运行方式的特点:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者。程序运行方式的特点:手工编写SPSS命令程序;一次性提交计算机运行;适用于大规模的分析工作和熟练的SPSS 程序员。混合运行方式的特点:在使用菜单的同时编辑SPSS程序,是完全窗口菜单方式和程序运行方式的综合。 中数据视图所对应的表格与一般的电子处理软件有什么区别 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性: (1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值; (4)数据文件是一张长方形的二维表。 3.SPSS有哪两个主要窗口它们的功能和特点各是什么 答:数据编辑窗口,功能:定义SPSS数据的结构、数据文件的录入、编辑、管理等基本操作的窗口;特点:SPSS运行过程中自动打开;SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据文件以.sav存于磁盘上;两个视图:数据视图和变量视图。 输出窗口,功能:SPSS统计分析报表及图形的输出的窗口;特点:在进行第一次分析时自动打开,也可手工打开;输出窗口可以关闭,窗口内容以.spv存于磁盘上;两个视图:目录视图和内容视图。 4.SPSS的数据加工和管理功能主要集中在哪些菜单中统计绘图和分析功能主要集中在哪些菜单中 答案:SPSS的数据加工和管理功能主要集中在编辑菜单、数据菜单、转换菜单。统计绘图和分析功能主要集中在统计绘图和分析功能主要集中在分析菜单和图形菜单。 5.利用SPSS进行数据分析的一般步骤是什么 答案:主要集中在以下4个阶段: (1)SPSS数据的准备阶段 在该阶段应按照SPSS的要求,建立SPSS数据文件。其中包括在数据编辑窗口中定义SPSS

第4章 SPSS基本统计分析(课后练习参考)

第三章 1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 第四章

SPSS统计分析模拟试题

内蒙古师范大学全日制硕士研究生 2008—2009 学年第2学期 SPSS 统计分析基础试题(B 卷) 考试时间:90分钟 考试说明: (1) 在E 盘中建立考生文件夹,要求以考生学号加姓名为文件夹命名。 (2) 登陆ftp:// 219.225.189.8,下载与试卷相关文件放入所建立文件夹 中(B 卷所需下载文件在B 卷文件夹中)。 (3) 启动SPSS ,请使用菜单项Edit →Options ,将Viewer 选项卡中的 Display command in the …复选框选中,保证每一步操作都有相应程序被输出到结果窗口中,我们将以此判断您是否按照要求进行了正确的操作。 (4) 考试结束后将考生文件夹上传ftp:// 219.225.189.8上的相应的文 件夹中,然后将试卷交给监考教师。 一、下面是城市居民生活情况调查问卷, 请根据问卷建立相应的名为WJ .sav 数据文件(将此文件保存到自己的文件夹中),数据的变量名用括号中给出的名称,多选 题中的多个变量名请在给出的变量名后加数字区分,如Q1、Q2、Q3等。完成后将数据文件保存在考生文件夹中,并对输出窗口中的信息进行保存,文件命名为WJ1.SPO ,最后关闭输出文件。

二、某高校对部分考生采取单独出题提前录取的招生 模式,现有20名来自国内不同的省市的考生报考该 校,具体数据见文件compute.sav。该校制定了如下录取规则:文化课成绩由数学、语文、英语和综合4门组成,文化课成绩制定最低录取分数线:350分;个人档案中若有“不良记录”,不予录取(即“不良记录”的编码为1的记录不予录取);对西部考生和少数民族考生,给予加分照顾,少数民族考生加30分,西部考生加20分;对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分(数据文件中“奖项”为考生取得的省以上竞赛并且是三等奖以上项目的次数)。首先算出每人的“文化课成绩”,然后根据以上规则算出有资格被录取的考生的“录取成绩”(“录取成绩”为文化课成绩和加分总和构成的成绩),按“录取成绩”进行降序排序,并将前5名考生的相应信息写在下列表格当中。

SPSS统计分析软件基础教程(英文有图示)

An Introduction to SPSS Or PASW The two laboratory sessions created for this course introduce students to the use of SPSS software. Section One To Should be completed by all students Section Three Section Four Further statistical analysis for you to try It is expected that students should complete the exercises up to and including Section Three within class time, if this is not achieved students should complete the exercises in their own time. Introduction to SPSS Section One

Introduction Section One introduces the various screens and displays as well as explaining how to input your survey and your data. SPSS is one of the most popular statistical analysis packages in use today and has been around for well over 20 years. The latest version with the w indow?s interface is particularly easy to use. The windows environment also facilitates the import and export of data, for example importing data from a spreadsheet and exporting results to a word document. The University holds a license that allows students to have a copy of SPSS on their own computers. The CD for installing the latest version of SPSS can be borrowed from the Library. Starting SPSS PASW Version 18 is the latest version. It can be found from Start(Bottom left hand corner), Programmes, SPSS Inc, PASW 18. The opening display asks you to select one of a number of options. At the moment click on the Red Cross to close the box. The Opening Display The window displayed is called the Data Editor; this is used for entering, editing and selecting data. The Data Editor has two views: the Variable View and the Data View you can flip from one view to the other by using the tab at the bottom of the page. SPSS has a number of other windows including Output, Help and Tutorial.

相关文档