文档库 最新最全的文档下载
当前位置:文档库 › SPSS统计分析练习及答案

SPSS统计分析练习及答案

SPSS统计分析练习及答案
SPSS统计分析练习及答案

SPSS 统计分析练习题目

-2012-10-26

学号:________________________ 姓名:___________________________

(注:将本文件以学号+姓名.doc 的形式另存为一个文件,例2008144154葛爽.doc ,然后以附件形式发送至 all689@https://www.wendangku.net/doc/5113271986.html, ,时间截止到2012年10月31日。没有指明数据文件名称的题目需自行在SPSS 中建立数据文件并录入相应数据,回答问题时应将SPSS 中的主要输出结果粘贴于答案中。)

1.一所国际新闻学校每年从各大高校中招募刚刚毕业的本科生参加培训,进而作为记者参加新闻工作。大多数刚刚毕业的学生以前没有任何做记者的经验,所以在正式成为一名记者之前,必须进行一段时间的学习,作为职业的预备课程。该国际新闻学校于是设计了两种培训方案:

方案A :学生参加为期15周的全天课程听课学习,随后参加预备课程考试;

方案B :学生直接先参加6个月的记者实习,再进行为期15周的全天课程听课学习,最后进行预备课程考试。

为了评估两种方案各自的有效性,学校随机选出了20名学生参加实验。事前还根据他们的文学等相关学科的成绩对这20人进行了分组,20人分成10组,每组中2人的成绩相近,然后随机地将2人分配去参加方案A 和方案B 的培训。

下表是这20人预备课程本学期的成绩单: 1 2 3 4 5 6 7 8 9 10 A 50 68 72 54 42 60 56 72 63 61 B

62

62

58

74

60

66

64

64

78

66

请问上面的数据是否证明了先参加实践对提高平均测试分数的效果显著?

Independent Samples Test

1.843.1911.54518.140.60006239921373013731.5455.331.143.6000623993098710987

Equal varia Equal varia

assumed

X

F Sig.vene's Test f ality of Varian

t df g. (2-taile Mean ifferenc td. Erro

ifferenc Lower Upper

5% Confiden nterval of the Difference t-test for Equality of Means

因p=0.140>0.05,故不能证明先参加实践对提高平均测试分数的效果显著。

2.早在1990年,美国巴维利亚的6个省报道了他们的婴儿死亡率(每1000名活着出生的婴儿的死亡数)以及母乳喂养率(母乳喂养婴儿的比例)的数据如下: 省号码 死亡率(每1000名婴儿中的死亡人数) 母乳喂养率(%) 1 250 60 2 320 30 3 170 90 4 300 60 5

270

40

6 190 80 平均

250

60

1) 计算适当的回归直线来预测另外两个省的婴儿死亡率,这两个省的母乳喂养率分别是37%和85%。

2) 这一数据是否提供了证据说明母乳喂养的好处?

Model Summary

.897a .804.76526.41387Model 1R R Square Adjusted R Square Std. Error of

the Estimate Predictors: (Constant), 喂养率

a.

ANOVA

b

14311.54

114311.53820.513.006a

3488.4625697.69217800.00

6

Regressio Residual Total Model 1Sum of

Squares df Mean Square F

Sig.Predictors: (Constant), 喂养率

a. Dependent Variable: 死亡率

b.

因此:死亡率=390.769-2.346*喂养率

另外两个省的死亡率为:303.97 和 191.36

因为实验中没有安排对照组,

所以没有证据说明母乳喂养的好处。

相应的回归直线如图所示。

3.为研究我国国民收入和消费水平之间的关系,收集到1993—2002年人均国民收入和居民人均消费的统计数据如下表,把全国人均消费额记为Y ,把人均国民收入记为X(数据来源于中国统计局网站2003年统计公报)。 年份 人均国民收入(元) X 居民人均消费 (元) Y 1993 2916.1 1331 1994

3894.0

1746

喂养率

100

90

80

70

60

50

40

30

20

死亡率

340320300280260240220200180160

喂养率

100

90

80

70

60

50

40

30

20

死亡率

340320300280260240220200180160

Coefficients

a

390.76932.64511.970

.000-2.346.518-.897-4.529.006

(Consta 喂养率Mode 1B Std. Error Unstandardized Coefficients Beta Standardized

Coefficients

t Sig.

Dependent Variable: 死亡率

a.

1995 4746.9 2236 1996 5462.1 2641 1997 5916.4 2834 1998 6169.2 2972 1999 6406.1 3138 2000

6963.2

3397

2001 7500.6 3609 2002 8061.6 3791

1) 建立人均国民收入和人均消费的回归方程; 2) 作图画出样本散点图和回归直线;

ANOVA

b

5715555

15554.767803.602.000a

5351.7383168.9675740907

9

Regressio Residual Total Model 1Sum of

Squares df Mean Square F

Sig.Predictors: (Constant), X 人均国民收入a. Dependent Variable: Y 人均消费

b.

Coefficients

a

20.47270.339-1.713

.125.498.012.99842.469.000

(Constant)X 人均国民Mode 1B Std. Error Unstandardized Coefficients Beta Standardized

Coefficients

t Sig.

Dependent Variable: Y 人均消费

a.

回归方程为:Y 人均消费=0.498*X 人均国民收入-120.472

X 人均国民收入

9000

8000

7000

6000

5000

4000

3000

2000

Y 人均消费

4000

3000

20001000

4.某餐饮业连锁店对店员服务效率进行随机抽查,以下是店员A 、B 、C 、D 完成配餐的三

Model Summary

.998a .996.99556.29358Model 1R R Square Adjusted R Square Std. Error of

the Estimate Predictors: (Constant), X 人均国民

a.

次时间记录(单位:秒)。根据下面的数据计算方差分析表,以及相应的概率值。 A B C D 35 42 41 40 39 40 41 34 34 35

44

31

ANOVA

x

90.000330.000 2.727

.114

88.000811.000

178.000

11

Between Groups Within Groups Total

Sum of Squares df

Mean Square

F

Sig.

5.对于12件电视广告作品,聘请了两位专家对其播出后的宣传功能进行评价。两位专家分别根据自己的评分标准,对这些作品给出了以

下的评分。若要问这两位专家的评分之间是否

有相类似的评分形态,即两专家的评价是否有相似的倾向,采用什么样的相关分析比较适当?并求出相应的结果 (注意:两专家所用的标准是不同的)。 作品号 1 2 3 4 5 6 7 8 9 10 11 12 专家甲 75 80 60 91 85 64 73 86 52 48 24 66 专家乙 83

91

78

92

96

79

81

94

77

76

74

75

连续变量的相关指标通常用积差相关系数,即Pearson 相关系数来表示。当数据不能满足Pearson 相关的条件时,可以采用非参数方法,如Spearman 等级相关系数来解决,这是一种等级秩相关系数。因此本题采用Spearman 相关系数来表示。

Kendall 的tau 相关系数适用于测量两个对称关系的定序变量X 与Y 的相关,共有三种形式Tau-a 、Tau-b 、Tau-c 。

本题采用秩相关系数比较合适,r=0.9021

6.大学和研究生毕业的一个随机样本给出了学生所获取学位类别与性别的分类数据,如下表所示:

学士

硕士

博士

Correlations

1.838**..001121

2.838**1.001.12

12

Pearson Correlation Sig. (2-tailed)N

Pearson Correlation Sig. (2-tailed)N

X1

X2

X1

X2

Correlation is significant at the 0.01 level

(2-tailed).

**. Correlations

1.000

.788**..0001212.788** 1.000

.000.12121.000

.902**..0001212.902** 1.000

.000.12

12

Correlation Coefficient Sig. (2-tailed)N

Correlation Coefficient Sig. (2-tailed)N

Correlation Coefficient Sig. (2-tailed)N

Correlation Coefficient Sig. (2-tailed)N

X1

X2

X1

X2

Kendall's tau_b

Spearman's rho X1X2Correlation is significant at the .01 level (2-tailed).

**.

男 501 162 27 女

409 143 8

1) 陈述原假设;

2) 计算2

值及原假设H 0的概率。

Chi-square 值为0.025,

存在显著差异

7.随机地抽取了两组相互独立的儿童样本,分别在某段时期内观看两种不同序列儿童智力开发教育电视节目甲和乙。最后,进行智力测验,试卷由某个专家进行评分(他并不知道哪些儿童观看的是哪种节目)。按照儿童智力的高低,他给出了如下的等级顺序:(秩越低成绩越好) 分数等 级 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 节目类 型

乙 甲

根据实验数据,检验节目乙是否比节目甲效果更好?

P>0.05,因此不能认为乙节目效果比甲节目好。

8.某公司在15个商业地区销售一种化妆品,有关销售量、目标人口以及人均可支配收入的数据如下表所示。为了用目标人口和人均可支配收入来预测商业地区的销售量,要拟合一个Y 对X 1和X 2的二元线性回归方程。试利用SPSS 求解这一方程。

商业地区编号 销售量(箱) Y 目标人口(千人) X 1 人均可支配收入(元) X 2 1

162

274

2450

Chi-Square Tests

7.359a 2.0257.8492.020

.9841

.321

1250

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association

N of Valid Cases

Value df

Asymp. Sig.(2-sided)

0 cells (.0%) have expected count less than 5. The minimum expected count is 15.68.

a. Test Statistics

b

14.00050.000-1.890.059.065

a

Mann-Whitney U Wil c oxon W Z

Asymp. Sig. (2-tai l ed)Exact Sig.

[2*(1-tailed Si g .)]S Not corrected for ties.a. Groupi n g Variable: D

b.

2 120 180

3254 3 223 375 3802 4 131 205 2838 5 67 86 2347 6 169 265 3782 7 81 98 3008 8 192 330 2450 9 116 195 2137 10 55 53 2560 11 252 430 4020 12 232 372 4427 13 144 236 2660 14 103 157 2088 15 212

370 2605

Coefficients

a 3.453 2.431 1.420

.181.496.006.93481.924.000199E-03.001.1089.502.000

(Constan D E Model 1B Std. Error Unstandardized Coefficients Beta Standardized Coefficients

t Sig.

Dependent Variable: S

a.

回归方程为:Y=3.453+0.496X1+0.0092X2

9.下表是中国12城市2001年度统计指标,请根据这四个指标将城市分为三类。

中国12城市统计指标 (2001年) 人均国内生产总值 (元) 年末总人口 (万人) 储蓄年末余额 (万元) 在岗职工平均工资 (元) 1 沈阳 21736 488 9848906 11615 2 抚顺 13273 139 199**** **** 3 南京 26698 372 6573958 17212 4 牡丹江 21017 163 2378937 11414 5 开封 8724 78 970556 7384 6 湘潭

19190

68

951923

10205

ANOVA

b

3844.72

26922.358679.466.000a

56.88412 4.7403901.60

14

Regressio Residual Total Model 1Sum of

Squares df Mean Square F

Sig.Predictors: (Constant), E, D a. Dependent Variable: S

b.

7 厦门 42040 124 2622327 16677 8 佛山 34525 49 2792462 16438 9 柳州 17598 93 1472157 12166 10 宜宾 11146 76 474191 10152 11 秦皇岛 26091 70 1532340 12009 12 绍兴 21464 60 1266739

16594

可能原始数据有些问题,结果不是很合适。 10.某研究者为了考察不同学科对学生知识能力的影响,随机抽取初三年级10名学生语文、数学、英语、政治、物理、化学6门学科的考试成绩如下表所示,以此对6门学科进行因素分析并计算因子得分,最后按照因子得分情况进行排序。 学生序号 语文 (X1) 数学 (X2) 英语 (X3) 政治 (X4) 物理 (X5) 化学 (X6) 1 80 88 81 65 77 86 2 72 76 70 60 70 75 3 88 75 75 73 75 79 4

68 78 65 60 70 72 5 75 61 70 70 61 65 6 72 78 65 62 66 75 7 70 80 68 75 75 80 8 65 60 63 62 61 73 9 78 72 69 61 69 77 10

75

65

70

61

61

70

每个聚类中的案例数 聚类

1 1.000

2 10.000 3

1.000 有效 1

2.000 缺失

.000

Communalities 1.000.8061.000.9261.000.7681.000.5241.000.9211.000

.877

s1s2s3s4s5s6

Initial Extraction

Extraction Method: Principal Component Analysis.

Total Variance Explained

3.61660.26360.263 3.61660.26360.263 2.82047.00547.0051.20520.08480.348 1.20520.08480.348

2.0013

3.34380.348

.75812.62792.974.192 3.20096.174.177 2.94499.118.053

.882100.000

Com ponent

123456Total % of Variance Cum ulative %

Total % of Variance Cum ulative %Total % of Variance Cum ulative %Initial E igenvalues Extraction Sums of Squared Loadings

Rotation Sums of Squared Loadings

Extraction Method: Principal Com ponent Analysis.

Component Matrix a

.677.589.819-.505.811.332.444.572.931-.233.875

-.333

s1s2s3s4s5s6

1

2Com ponent Extraction Method: Principal Component Analysis.

2 components extracted.

a.

Component Score Coefficient Matrix

-.128.508.426-.213.025.355-.172.459.322-.010.357-.087

s1s2s3s4s5s6

12Com ponent Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Norm alization. Com ponent Scores.

F1=0.426S2-0.128S1+0.025S3-0.172S4+0.322S5+0.357S6 F2=0.508S1-0.213S2+0.355S3+0.459S4-0.010S5-0.087S6 F1的系数为:60.263/80.348=0.75 F2的系数为:20.084/80.348=0.25

因此F=0.75f1+0.25F2,计算可得总分的情况。

11.6个学生对甲、乙、丙三部电影的评价结果如下,问三部电影被评结果是否有显著性差异? 1 2 3 4 5 6 甲 30 42 18 29 16 25 乙 19 22 17 26 23 18 丙

25

21

24

28

27

26

ANOVA

s1

110.111255.056 1.549

.245

533.0001535.533

643.111

17

Between Groups Within Groups Total

Sum of Squares df

Mean Square

F

Sig.Test Statistics a,b

3.179

2.204

Chi-Square df

Asym p. Sig.

s1Kruskal Wallis Test a. Grouping V ariable: s2

b.

KMO and Bartlett's Test

.66331.629

15.007

Kaiser-Mey er-Olkin Measure of Sampling Adequacy.Approx . Chi-Square df Sig.

Bartlett's Test of Sphericity

12.在做一个智力游戏时,人们认为它与年龄以及是否是盲人有关,现以年龄为区组,研究该游戏与眼睛看见与否是否有关。首先第1组安排天生眼盲的儿童参加游戏,第2组安排眼睛正常但做游戏时把眼睛蒙上的儿童参加游戏,第3组安排眼睛正常而且不蒙住眼睛的儿童参加游戏,观察他们的得分,如下表所示,试就此进行分析。

1 2 3 4 5 6 7 8 9 10 11 12 盲人 0 0 0 0 1 8 8 8 0 8 8 8 蒙眼

8

2

8

5

6

8

8

3

8

不蒙眼 8 1 8 8 0 8 8 8 8 8 8 8

本题的研究目的是:与眼睛看见与否是否有关系?这时年龄为区组,眼睛情况为处理,即进行横向比较是否有差异,因此应为K 个相关样本的非参数检验?

Test Statistics 12.1383.310

2.191

N

Kendall's W a Chi-Square df

Asymp. Sig.

Kendall's Coefficient of Concordance

a.

结果:Asymp. P=0.191,大概率事件,无关。

13.已知华中师范大学某班级的80名大学生的英语学期成绩如下,而全校所有选修英语课的学生的平均成绩是74.8分,问该班级的英语成绩是否比全校选修英语课的学生的平均成绩低。数据见“英语成绩.sav ”。

One-Sample Statistics 805.21250.3038615201

英语成N Mean d . Deviatio Std. Erro

Mean

One-Sample Test

.358

79.721.41251.88052.7055

英语成t

df g. (2-tailed Mean

Difference LowerUpper 95% Confidence Interval of the

Difference Test Value = 74.8

结果显示无差异

14.针对“大学生网络学习现状的调查与研究调查问卷”的第5题“学生平均每天上网的时长”,调查中学生上网时长是否分布均匀,即上网时长在1小时以下、1-3个小时、3-5个小时、5

Test Statistics

a

123.3102.191

N

Chi-Square df

Asymp. Sig.Friedman Test

a.

个小时的学生比例满足1:1:1:1。数据见“大学生网络学习现状的调查与研究调查问卷.sav ”

每天上网时间

2723.5 3.54723.523.51523.5-8.5523.5-18.594

1个小时以下1-3小时3-5个小时5个小时以上Total Observed NExpected N Residual

结果显示:上网时长分布不均匀

15.在对高等学校科研状况的评价研究中,我们搜集了与科研人员相关的诸如投入科研活动

的时间、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标,请选择一种合适的分析方法分析投入科研活动人年数与发表专著数之间的关系并计算它们之间的相关系数。数据见“高校科研研究.sav ”

相关系数 r=0.901

16.一项调查需要对北京18个区县中等职业教育发展水平的9个指标进行分析,然后进行综合评价。请选择一种合适的方法对其进行分析。九个指标分别是: 每万人中等职业教育在校生数;每万人中等职业教育招生数;每万人中等职业教育毕业生数;每万人中等职业教育专任教师数;本科以上学校教师占专任教师的比例;国家财政预算中等职业教育经费占国内生产总值的比例;生均教育经费;学校平均在校生人数;高级教师占专任教师的比例。数据见“中等职业教育.sav ”

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。

.847

Bartlett 的球形度检验 近似卡方 122.691

df

36

Test Statistics 41.660

3.000

Chi-Square a df Asymp. Sig.每天上网时间0 cells (.0%) have expected frequencies less than

5. The minimum expected cell frequency is 23.5.

a. Correlations

1.901**

..0003131

.901**1

.000.3131Pearson Correlation Sig. (2-tailed)N Pearson Correlation Sig. (2-tailed)N 投入人年数专著数投入人年数专著数

Correlation is significant at the 0.01 level (2-tailed).

**.

KMO 和Bartlett 的检验

取样足够度的Kaiser-Meyer-Olkin 度量。.847 Bartlett 的球形度检验近似卡方122.691

df 36

Sig. .000

公因子方差

初始提取

每万人中等职业教育在校生

1.000 .921

每万人中等职业教育招生数 1.000 .853

每万人中等职业教育毕业生

1.000 .803

每万人中等职业教育专任教

师数

1.000 .683

本科以上学校教师占专任教

师的比例

1.000 .298

国家财政预算中等职业教育

经费占国内生产总值的比例

1.000 .563

生均教育经费 1.000 .745

学校平均在校生人数 1.000 .421

高级教师占专任教师的比例 1.000 .680

提取方法:主成份分析。

解释的总方差

成份

初始特征值提取平方和载入

合计方差的% 累积% 合计方差的% 累积%

1 5.968 66.310 66.310 5.968 66.310 66.310

2 .931 10.346 76.656

3 .683 7.586 84.242

4 .540 6.003 90.244

5 .379 4.208 94.452

6 .256 2.848 97.300

7 .118 1.310 98.610

8 .072 .797 99.407

9 .053 .593 100.000 提取方法:主成份分析。

成份矩阵a

成份

1

.960 每万人中等职业教育在校生

每万人中等职业教育招生数.924

.896 每万人中等职业教育毕业生

.827 每万人中等职业教育专任教

师数

.546 本科以上学校教师占专任教

师的比例

.750 国家财政预算中等职业教育

经费占国内生产总值的比例

生均教育经费.863 学校平均在校生人数.649 高级教师占专任教师的比例.825 提取方法:主成份。

a. 已提取了1 个成份。

成份得分系数矩阵

成份

1

.161 每万人中等职业教育在校生

每万人中等职业教育招生数.155

.150

每万人中等职业教育毕业生

.139

每万人中等职业教育专任教

师数

.091

本科以上学校教师占专任教

师的比例

.126

国家财政预算中等职业教育

经费占国内生产总值的比例

生均教育经费.145

学校平均在校生人数.109

高级教师占专任教师的比例.138

提取方法:主成份。

旋转法:具有Kaiser 标准化的正交旋转法。

构成得分。

Y=0.161*x1+0.155*x2+0.150*x3+0.139*x4+0.091*x5+0.126*x6+0.145*x7+0.109*x8+0.138*x9

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地职业 , 年龄 N Valid282282282 Missing00~ 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市] 200 边远郊区82 Total282 职业 ( Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24 商业服务业54 文教卫生18】公交建筑业15 经营性公司】 18 学校15

一般农户 35 种粮棉专业 户 4(种果菜专业 户 10 工商运专业户 ~ 34 退役人员17 金融机构35 现役军人3: Total282 、 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4/ 20~35岁146 35~50岁: 91 50岁以上41 Total282

《 分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

spss统计分析软件习题

复习参考题 一、选择题 1.应用统计学原理进行试验设计,其最终目的是(C) A.选择该病暴露因素 B.使论文具有可续性 C.达到齐同对比、均衡化抽样 D.观察指标稳定可靠 E.使研究内容达到先进性、创新性 2.专业设计主要包括(E) A.选择观察对象 B.需组织多少观察病例 C.观察结果可重复性 D.减少或排除抽样误差 E.确立研究目的和建立假设 3.实验设计的主要目的(ABCDE) A.解决试验结果可重复性 B.提高试验效率 C.保证样本代表性 D.样本间可比性 E.观察结果精确性 4.临床研究设计中的主要困难是(ABDE) A.不能在人身上复制疾病模板 B.样本一致性较差 C.只能应用整体水平进行研究 D.观察条件不易控制 E.观察结果离散度大 5.专业设计中建立假设是(BDE) A.对某一问题的学说设定 B.一种科学预见 C.主观推测 D.对提出问题的释疑 E.推理指导下安排试验与调查 6.实验设计中的处理因素是指(D) A.随机化 B.盲法 C.观察对象代表性 D.分组因素及其水平 E.指标的客观性、稳定性 7.实验设计中必须贯彻的基本原则是(ADE) A.随机化与盲法 B.观察对象金标准 C.制定明确的纳入与排除标准 D.设立对照组

E.达到有统计意义的最低样本含量 8.随机误差(抽样误差)的数据特点是(ADE) A.个体反应差异 B.数据差异具有方向性 C.数据常不呈正态分布 D.数据趋向于接近均值水平 E.可通过统计学处理缩小或排除 9.产生偏倚的原因和控制是(CE) A.数据无规律,随机变化 B.个体反应差异所产生变化 C.不能用统计方法控制 D.数据服从正态分布 E.实验设计不周所产生的数据变化 10.选择性偏倚产生的主要原因是(BCDE) A.个体反应差异 B.测量上具有主观倾向性 C.选择病例未应用金标准 D.分组时有关特征构成的差异显著 E.抽样及分组时未采用随机盲法 11.样本代表性与下列哪些因素有关(ABCDE) A.诊断金标准 B.贯彻随机化原则 C.是否排除了偏倚产生 D.确定达到统计要求的最低样本含量 E.样本抽取与分组要有选择 12.数据资料能进行统计学处理的必须是哪一类资料(AE) A.抽样误差产生数据 B.诊断性偏倚产生数据 C.分组偏倚产生数据 D.入院率偏倚产生数据 E.具有组间可比性、随机盲法分组产生的数据 13.求样本大小设定的统计学范围是(BCE) A.设定总体标准差 B.设定检验水准 C.设定检验效能 D.设定样本均数与总体均数差值 E.设定把握度 14.那些实验设计应用正交设计(DE) A.单个处理因素、两个样本均数比较 B.单个处理因素、两个样含量不等的均数比较 C.两个处理因素、且每个因素又有两个水平的实验设计

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计分析与SPSS的应用第五版课后练习答案第9章

《统计分析与SPSS 的应用(第五版)》(薛薇) 课后练习答案 第9章SPSS 的线性回归分析 1利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量, 利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程 成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条 分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore 和phy 两门成绩体系散点图 步骤:图形 旧对话框 散点图 简单散点图 定义 将fore 导入Y 轴,将phy 导入X 轴,将 sex 导入设置标记 确定。 00..00- O O O O O O O O 60.00- □ 8 □ □ ooo° cP O O OOD o O O 40 W- O O ° 0 °o O 0 o o o ° ° 0 o O O O 20.00- 0 ° 0 40.00 50.00 60.00 70.00 00.00 90.00 1M.OO

接下来在SPSS俞出查看器中,双击上图,打开图表编辑 '■-j female male

閒|匿恚層器-' * ;| !凹jW Array 在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线 性应用。

40.00 50 00 6G.Q0 70.00 00 00 90.00 1Q0.00 分析:如上图所示,通过散点图,被解释变量 y (即:fore )与解释变量phy 有一定 的线性关系。但回归直线的拟合效果都不是很好。 2、请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提, 回归分析则是相关分析的深入和继续。 相关分析需要依 靠回归分析来表现变量之间数量相关的具体形式, 而回归分析则需要依靠相关分析来表现变 量之间数量变化的相关程度。 只有当变量之间存在高度相关时, 进行回归分析寻求其相关的 具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之 前,就进行回归分析,很容易造成“虚假回归” 。与此同时,相关分析只研究变量之间相关 的方向和程度,不能推断变量之间相互关系的具体形式, 也无法从一个变量的变化来推测另 一个变量的变化情况,因此,在具体应用过程中, 只有把相关分析和回归分析结合起来,才 能达到研究和分析的目的。 线性回归分析是相关性回归分析的一种, 研究的是一个变量的增加或减少会不会引起另一个 变量的增加或减少。 3、请说明为什么需要对线性回归方程进行统计检验? 一般需要对哪些方面进行检验? 检验其可信程度并找 出哪些变量的影响显著、哪些不显著。 主要包括回归方程的拟合优度检验、 显著性检验、回归系数的显著性检验、 残差分析等。 线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释 变量和解释变量之间确实存在显著的线性关系。 00.00^ sex O female O male ■- female ^male Ft 2 ^140-)-0182 female: R 2 . ' = 0.208 male: R 2 ^n-0.16S 20.00- 60.00- 40.00- O O Q O

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

最新spss统计练习题及答案

SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单?

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS统计分析分析案例

SPSS统计分析案例 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动内需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费

spss统计练习题及答案

SPSS 统计练习题及答案 一、选择题(选择类) (A )1、在数据中插入变量的操作要用到的菜单是: A In sert Variable; B In sert Case; C Go to Case; D Weight Cases (C )2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases ; B Select Cases ; C Compute ; D Categorize Variables (C )3、Transpose 菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A ) 4、用One-Way ANOVAS 行大、中、小城市 16岁男性青年平均身高的比较,结果给出 sig=,说明: A. 按照显著性水平,拒绝 H,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; D. 说明城市不是身高的一个影响因素 (B ) 5、下面的例子可以用 Paired-Sampies T Test 过程进行分析的是: A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D 性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files 菜单用于合并数据库有两种情况:如果两数据库变量相同,是 —变量—的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推 断时能进行卡方检验的菜单是 Crosstabs ____ 。 8 One-Sampies T Test 过程用于进行_样本所在总体均数 _______ 与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures :重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结 果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test :卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的 比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是 25%,或者是否符合我们所给出的一个比例(如分别为 10% 四、简答题(问答类) 11、 用SPSS 对数据进行分析的基本流程是什么 答:(1 )、将数据输入SPSS 并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等) (3 )、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、 对数据进行方差分析时, Uni variate 菜单和Multivariate 答:当因变量只有一个时,使用 Uni variate 菜单,当因变量不止一 个时,使用 13、 简述SPSS 打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单 File==>Open==>Data 或直接单击快捷工具栏上的打开按钮; (2) 、使用数据库查询打开:选择菜单 File==>Open Database==>New Query ,根据向导打开数据; (3) 、使用文本向导读入文本文件:选择菜单 F ile==>Read Text Data 14、 指定数据按某个变量进行排序需要用到哪个菜单 _观测对象—的合并;如果不同,则是 30% 40%和 20%)。 ,以确定应采用的检验方法; 菜单最大的区别是什么 Multivariate 菜

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理 《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在职业年龄 地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理 种果菜专业 10 3.5 3.568.4 户 工商运专业 3412.112.180.5户 退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0

社会统计学与spss应用练习题

应用练习题spss社会统计学与 2011—2012学年第二学期 《社会统计学与SPSS应用》练习题 一、单项选择题 1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量 2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B)A.

B. C.

D. 左50%3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D)。随机现象 D. A.非统计现象 B.统计现象 C.非随机现象左新生婴儿男女性别比一直在针对出生婴儿性别状况的多年调查发现,50%4.右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现)。新生婴儿性别状况具有(D必然性 D.随机性 A.确定性 B.因果

性 C..为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少5 年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。(B)差异D.整体C.互斥B.完备A. C)6.下列哪类变量能用折线图表示其分布状况?(虚拟变量定类变量 B.定序变量 C.定距变量 D.A. 。7.下列某变量取值状况的累积图,其中正确的表现形式是(B) .B A. .CD. 2相同,图1较之图2的密度曲线向左8.下两图是正态分布密度曲线,两图的σ移了一些,这说明(C)。

图图≥ D.μμ< C.μμ =μB.μμ>A.μ22112 112 2 1 )C(如下所示首先应该操作步骤的是对于多选项分析而言,软件中,SPSS 在.9. A. B.Freque

《统计分析与SPSS的应用(第五版)》课后练习答案.doc (1)

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

教育统计基础与spss复习题及答案1

《教育统计基础与spss》复习题及答案一、填空题 1 2 3 4. 5 6.“65、66、72、83、89 7.6位学生的身高分别为: 145、135、128、145、140、130厘米,他们的众数 8. 9. 10 11 12 13. 从数量关系的特点看,事物或者现象之间的关系可以分为两种类型:其一 14. 15. 16. 二、判断题 1、教育统计学属于应用统计学。(√) 2、正态分布、t分布与F分布都是对称分布。(×) 3、统计数据的真实性是统计工作的生命(√) 4、汉族是一个品质标志。(×) 5、描述一组数据波动情况的量数称为差异量数。(√) 6、集中量数反映的是一组数据的集中趋势。(√) 7、在一个总体中,算术平均数、众数、中位数可能相等。(√) 8、同一总体各组的结构相对指标数值之和不一定等于100%。(×) 9、不重复抽样误差一定大于重复抽样误差。(×) 10. 一致性是用样本统计量估计统计参数时最基本的要求。(×) 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( A )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是(B )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( C )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( D )。 1

A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是(D )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( D )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量7.下列统计指标中,属于数量指标的有(A) A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数 变为( B )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 9. 当标准差是下面哪一个数值时,该组数据平均数的代表性最好?( A) A.2.8 B.5.5 C.5.2 D.9.8 10.当一组数据中有某个奇异值时,应该用下面哪一种统计量反映该组数据的集中趋势?( D ) A.算术平均数 B. 几何平均数 C.加权平均数 D.中位数 11.某班期末语文、数学、外语考试的平均成绩分别为80,72,60,标准差分别为7,6.5,5。问哪科成绩相对整齐些?(C) A.语文 B.数学 C.外语 D.无法比较 12. 在正态分布中,如果平均数增大,正态分布曲线会(D ) A.上移 B.下移 C.左移 D.右移 13.在正态分布中如果标准差增大,正态分布曲线会(D) A.左移 B.右移 C.变陡峭 D.变平缓 14.某学生凭猜测回答两道选择题,答对第一题的概率为51,答对第二题 的概率为41,那么他至少答错一道题的概率为(B) A.0.35 B.0.95 C.0.75 D.0.8 15.在统计假设检验中,若某样本在总体中出现的概率在0.01——0.05之 间,则说明(A) A.样本与总体之间无显著差异 B.样本与总体之间有显著差异 C.样本与总体之间差异非常显 D.无法判断 16.非参数检验法与参数检验法相比较,最大的缺点是(D) A.计算量大 B.检验方法意义不明确 C.限制条件较宽 D.样本信 息利用不充分 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 答:(1)表明同类统计事项指标的对比关系; 2

常用统计分析方法--SPSS应用_杜志渊)

§1.2 数据的编辑与整理 当录入数据之后,就可以对原始数据进行整理和分析,关于数据的整理和分析都是在数据窗口完成的。下面将介绍SPSS统计分析软件在数据窗口的主要操作方式和菜单相应的功能。 §1.2.1 数据窗口菜单栏功能操作 数据编辑窗口的主菜单如图1.4所示,主菜单中的具体功能包括: 图1.4 SPSS主菜单 1.File:文件操作。 2.Edit:文件编辑。 3.View:视图编辑。 4.Data:数据操作。 5.Transform:数据转换。 6.Analyze:统计分析方法。 7.Graphs:图形编辑。 8.Utilities:实用程序。 9.Windows:窗口控制。 10.Help:帮助。 在统计分析过程中常用的功能主要集中在数据操作、数据转换、数据分析、统计图形的建立与编辑等操作。 §1.2.2 Date数据功能 数据编辑窗口的Data菜单为用户创建和定义数据提供了方便的功能,如图1.5

所示。这个菜单是SPSS 统计软件数据整理的特有功能菜单。它的功能包括:对变量、观测量的编辑处理;对变量数据的变换;对观察量数据整理。 这些功能为各种统计分析要求提供极其灵活了数据整理功能,用户可以根据不同统计分析对数据的要求对数据进行整理。 一、定义和编辑变量、观测量的命令 Define Variable Properties 用于定义变量属性; Copy Data Properties 由外部文件和工作文件拷贝数据变量和属性; Define Dates 定义或编辑日期变量格式; Insert Variable 在数据编辑窗口插入一个变量; Insert Case 在数据编辑窗口插入一个观测量; Goto Case 光标跳转到某一指定观测量。 二、变量数据变换的命令 Sort Cases 对观测量进行排序; Transpose 对观测量进行转置; Restructure 对现有的观测量进行重新构造,形成新格式的数据文件; Merge File 把外部文件数据合并到工作文件中; Aggregate 对数据进行分类或不分类汇总,产生新文件或代替工作文件。 Identify Duplicate Cases 标识重复观测量; Orthogonal Design 进行正交设计。 三、观察量数据整理的命令 图1.5 Data 菜单项示意图

相关文档
相关文档 最新文档