当前位置：文档库 › spss统计练习题及答案

spss统计练习题及答案

SPSS统计练习题及答案

一、选择题（选择类）

(A)1、在数据中插入变量的操作要用到的菜单是：

A Insert Variable;

B Insert Case;

C Go to Case;

D Weight Cases

A Sort Cases；

B Select Cases；

C Compute；

D Categorize Variables

A 对数据进行分类汇总；

B 对数据进行加权处理；

C 对数据进行行列转置；

D 按某变量分割数据

(A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较，结果给出sig.=0.043，说明：

A. 按照0.05显著性水平，拒绝H0，说明三种城市的平均身高有差别；

B. 三种城市身高没有差别的可能性是0.043；

C. 三种城市身高有差别的可能性是0.043；

D. 说明城市不是身高的一个影响因素

(B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是：A 家庭主妇和女大学生对同种商品喜好的差异；

B 服用某种药物前后病情的改变情况；

C 服用药物和没有服用药物的病人身体状况的差异；

D性别和年龄对雇员薪水的影响

二、填空题（填空类）

6、Merge Files菜单用于合并数据库有两种情况：如果两数据库变量相同，是_观测对象__的合并；如果不同，则是_变量__的合并。

7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断，在分析时可以产生二维或多维列联表，在统计推断时能进行卡方检验的菜单是_ Crosstabs __。

8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。

三、名词解释（问答类）

9、Repeated Measures：重复测量的方差分析，指的是一个因变量被重复测量好几次，从而同一个个体的几次观察结果间存在相关，这样就不满足普通分析的要求，需要用重复测量的方差分析模型来解决。

10、Chi-Square test：卡方检验，它是非参数检验的一种方法，来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本，可以用该方法来分析四种血型所占的比例是否相同（都是25%），或者是否符合我们所给出的一个比例（如分别为10%、30%、40%和20%）。

四、简答题（问答类）

11、用SPSS对数据进行分析的基本流程是什么？

答：（1）、将数据输入SPSS，并保存；

（2）、进行必要的预分析（分布图、均数标准差等的描述等），以确定应采用的检验方法；

（3）、按题目要求进行统计分析；

(4)、保存和导出分析结果。

12、对数据进行方差分析时，Univariate菜单和Multivariate菜单最大的区别是什么？

答：当因变量只有一个时，使用Univariate菜单，当因变量不止一个时，使用Multivariate菜单。

13、简述SPSS打开其它格式数据的几种方法？

答：(1)、直接打开：选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮；

(2)、使用数据库查询打开：选择菜单File==>Open Database==>New Query，根据向导打开数据；

(3)、使用文本向导读入文本文件：选择菜单File==>Read Text Data

14、指定数据按某个变量进行排序需要用到哪个菜单？

答：Date==>Sort Cases

15、两因素以上的方差分析在SPSS中用什么来完成？

答：这些方差分析一律可归入一般线性模型，所以在SPSS中都被归入了General Lineal Model子菜单。

16、简述Descriptive Statistics菜单的组成和功能。

答：描述性统计分析是统计分析的第一步，做好这第一步是下面进行正确统计推断的先决条件。SPSS中专门为该目的而设计的几个模块集中在Descriptive Statistics菜单中，最常用的是列在最前面的四个过程：

(1)、Frequencies过程的特色是产生频数表

(2)、Descriptives过程进行一般性的统计描述；

(3)、Explore过程用于对数据概况不清时的探索性分析；

(4)、Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验，我们常用的卡方检验也在其中完成。

17、简述在多元线性回归分析中，SPSS筛选自变量进入回归方程的四种方法。

答：这四种方法是：强迫法、逐步法、向前法、向后法。

（1）逐步回归法（stepwise），是运用甚为广泛的复回归分析方法之一，也是多元回归分析报告中出现几率最多的一种预测变量的方法。它结合“向前法”（forward selection）和“向后法”（backward elimination）二种方式的优点。

（2）向前法是自变量一个一个进入回归模式中，而向后法是先将所有的自变量纳入回归模式中，之后再逐一将对模式贡献最小的预测变量移除，直到所有的自变量均达到标准为止。

（3）强迫回归法（Enter）也是一种常见的方法，强迫所有变量有顺序进入回归方程。

18. 试说明多元线性回归分析中的“共线性”问题及判断标准。

答：多元回归分析中要留意“共线性”（collinarity）问题，它是指由于自变量间的相关太高，造成回归分析的情境困扰，使回归模式的参数不能完全被估计出来。自变量间的共线性问题可由容忍度（tolerance）、变异数膨胀因素（VIF）和条件指针（condition index;CI）。一般而言，容忍度越接近0、VIF越大或条件指针越大（大于15），则越有可能存在共线性问题。

19、下表是不同职业与工作满意感之间相关分析的结果，试判断不同职业与满意感之间是否有相关，如果有，相关系数是多少？

答：由于显著性水平P=0.662>0.05，说明二者之间不存在显著性相关。

五、分析题（问答类）

20、某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下：

患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11

健康: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87

（1）将数据录入SPSS，保存为li1_1.sav；

（2）分析该地克山病患者和健康人的血磷脂是否不同；

（3）保存结果。

21、在数据li1_1.sav中生成新变量temp，当血磷值小于1.5时取值为1，1.5～2时取值为2，大于2时取值为3，并保存结果。

答:操作步骤如下：

(1)、Output Variable框：选入x；

(2)、Output Variable Name框：键入temp，单击Change钮；

(3)、选中x->temp：单击Old and New Values钮；

(4)、Range: Lowest through*单选钮：键入1.5；New Value Value单选钮：键入1；单击Add钮；

(5)、Range: *through*单选钮：两侧分别键入1.5、2；New V alue Value单选钮：键入2；单击Add钮；

(6)、Range: All other values单选钮；New Value Value单选钮：键入3；单击Add钮；

(7)、单击Continue；

(8)、单击OK；

22、数据li3_1.sav记录的是某班50名学生语、数、外三门科目的考试成绩，分别作出三科得分频数表、计算均数、标准差、中位数、P2.5和P97.5，并画出直方图。

答：操作步骤如下：

(1).Analyze==>Descriptive Statistics==>Frequencies；

(2).Variables框：选入变量engl（外）、chin（语）、math（数）；

(3).单击Statistics钮；

(4).选中Mean、Std.deviation、Median复选框；

（5）.单击Percentiles：输入2.5：单击Add；输入97.5：单击Add；

（6）单击Continue钮；

（7）.单击Charts钮；

（8）.选中Bar charts；

（9）.单击Continue钮；

（10）.单击OK；

23、根据数据li3_1.sav分析该班男、女生在语、数、外三科得分上有无差异。

答：(1).Analyze==>Compare Means==>Independent-Samples T Test；

(2)Test Variables框：选入变量engl（外）、chin（语）、math（数）；

(3)Grouping Variable框：选入变量gender；

(3)单击Define Groups钮；

(4)选择Use specified Values，在group1中填1，在group2中填2；

(5)单击Continue钮；

(6)单击OK。

24、某驾校学校欲购进一批驾驶模拟训练器，为了知道它们的效果，进行了一次实验。从新学员中随机抽取12名进行训练，训练前和训练后分别对学员驾驶技能进行测试，结果如下：

训练前66.0 68.0 70.0 65.0 67.0 82.0 60.5 59.0 71.0 77.0 66.0 70.5

训练后62.5 85.0 70.0 73.0 65.0 63.5 60.5 76.0 75.5 65.0 62.5 72.0

试问模拟器训练的效果如何？

答：用Paired-Sample T Test分析

(1)、录入数据：设变量x1，x2 分别代表训练前和训练后值，在SPSS 中输入数据。

(2)、统计分析：依次选择Analyze－Compare means－Paired samples T test（配对t检验），弹出对话框，将变量x1、x2同时选入Paired Variables框（同时选中x1、x2）。在Options子对话框中可定义可信区间和缺失值的处理。单击OK键提交执行即可得结果。

25、美国国家计算机产品公司在亚特兰大、达拉斯以及西雅图都设有工厂，生产传真机与打印机。为了确定这三个工厂的工人的产品质量管理意识水平，特意从每个工厂随机选取10个工人，对他们进行质量意识考试，员工考试的结果如下。请问这三个工厂员工的质量管理意识水平有无显著差异？若有显著差异，根据统计结果直接观察，哪个工厂最低？

亚特兰大85 75 82 76 71 85 79 83 74 78

达拉斯71 75 73 74 69 82 74 78 76 68

西雅图59 64 62 69 75 67 66 62 69 70

答：数据已经输好，分组变量为group，三组取值分别为1、2、3，结果变量为X。此处先进行单因素方差分析，然后进行两两比较，这里选择S-N-K法进行两两比较。操作如下：

(1).选择Analyze－Compare means－One-Way ANOV A(2).Dependent List框：选入X

(3）.Factor框：选入group

(4).Post Hoc钮：选中S-N-K复选框，单击Continue钮

(5).单击OK钮

26、某项研究欲探讨不同年龄的人完成所有不同难度任务的手眼协调性情况。研究数据见task.sav。年龄下1代表儿童组，2代表青年组，3代表老年组。后面分数为手眼协调性分数，越高表示手眼协调性越好。试问年龄、任务难度两个因素是如何影响人的手眼协调性的？

本题的组间变量为年龄，组内变量为不同难度任务。

答：操作步骤如下：(1)、Analyze==>General Lineal model==>Repeated measures

(2)、Within-subject factor name框：选入组内变量，即不同难度的任务，我们给其命名为task；

(3)、number of levels框：表示组内变量有几个水平，键入3 ；

(4)、单击Add；单击Define

(5)、Within-subject variables (task)框：选入a1~a3

(6）、Between subjects factor框：选入组间变量，即年龄Age

(7）、Post Hoc纽：对选入因素各水平进行两两比较，选入Age；在S-N-K框打勾。单击Continue

（8）.单击OK，结果显示年龄和任务的主效应显著，并且二者交互作用显著，即二者共同影响人的眼手协调性。27、设某个计算公司所使用的现行系统，通过每个程序的平均时间为45秒。今采用一个新系统进行试验，发现通过9个程序所需的计算时间如下（单位：秒）：

30 37 42 35 36 40 47 48 45

假定通过每个程序的时间服从正态分布，那么根据这些数据能否断言：新的系统能减少通过程序的平均时间（α

=0.05）？

28、某份调查数据li7_1.sav记录了雇员的性别、工作类型、教育背景（年）、工作经验（月）和薪水情况，对此数据进行以下分析：

（1）不同性别雇员的薪水是否有显著差异？

（2）不同工作类型雇员的薪水是否有显著差异？

（3）雇员的教育背景与薪水之间是否相关，相关程度如何？

（4）雇员的工作经验与薪水之间是否相关，相关程度如何？

答：（1）有；

（2）有，多重比较（Post Hoc）结果表明：经理与主管和职员的薪水差异都显著，但主管和职员的薪水差异不显著；（3）雇员的教育背景与薪水之间有显著相关，相关系数为0.661；

（4）雇员的工作经验与薪水之间有显著相关，相关系数为0.780。

29、根据数据li7_1.sav，分析雇员的性别、工作类型、教育背景（年）和工作经验（月）是否对其薪水高低有影响，进行多元回归分析，并求出直线方程。并试着判断是否存在自变量共线性问题。

答：这是多元回归问题，因不知道四个变量有无影响，选择对四个变量分析的进入方法为stepwise（让软件自动选择判断），操作如下：

1.Analyze==>Regression==>Liner

2.Dependent框：选入salary

3.Independent框：选入gender、educ、job和prevexp

4.Method钮：选择stepwise

5.单击OK钮

结果显示四个变量都进入回归方程，且变量间不存在共线性问题。

30一位老师前后间隔两个月对10名学生的作文进行评分（满分30），利用非参数检验的方法判断这位老师的评分前后是否一致？(数据见teacher.sav)

答：用Nonparametric test==>Two-Related-Samples Tests菜单进行分析，结果显示评分前后是一致的，无显著差异。31、根据数据li7_1.sav，完成以下任务：

（1）分别对变量工作经验（prevexp）和教育背景（educ）作饼图；

（2）以雇员的不同教育背景（年）对其薪水作条形图，反映不同教育背景下的薪水情况。

操作步骤如下：

（1）选择Graph==>Pie，分别选入prevexp和educ。

（2）选择Graph==>Bar，选择Simple，点击Define。在Variable框中选入变量salary，在Category Axis框中选入变量educ。点击OK。

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答第一章绪论【1.1】指出下列变量的类型：（1）汽车销售量；（2）产品等级；（3）到某地出差乘坐的交通工具（汽车、轮船、飞机）；（4）年龄；（5）性别；（6）对某种社会现象的看法（赞成、中立、反对）。【解】（1）数值型变量（2）顺序变量（3）分类变量（4）数值型变量（5）分类变量（6）顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。要求：（1）描述总体和样本。（2）指出参数和统计量。（3）这里涉及到的统计指标是什么？【解】（1）总体：某大学所有的大学生样本：从某大学抽取的200名大学生（2）参数：某大学大学生的月平均消费水平统计量：从某大学抽取的200名大学生的月平均消费水平（3）200名大学生的总消费，平均消费水平【1.3】下面是社会经济生活中常用的统计指标： ①轿车生产总量，②旅游收入，③经济发展速度，④人口出生率，⑤安置再就业人数，⑥全国第三产业发展速度，⑦城镇居民人均可支配收入，⑧恩格尔系数。在这些指标中，哪些是数量指标，哪些是质量指标？如何区分质量指标与数量指标？【解】数量指标有：①、②、⑤ 质量指标有：③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标，表现为绝对数的形式，并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标，通常是两个有联系的统计指标对比的结果。【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查，其中60%的居民对自己的居住环境表示满意，70%的居民回答他们的月收入在6000元以下，生活压力大。回答以下问题：（1）这一研究的总体是什么？（2）月收入是分类变量、顺序变量还是数值型变量？（3）对居住环境的满意程度是什么变量？【解】（1）这一研究的总体是某小区的所有居民。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

统计学课后习题答案(Chap1.2)

第1章绪论 1．什么是统计学怎样理解统计学与统计数据的关系 2．试举出日常生活或工作中统计数据及其规律性的例子。 3．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)描述推断。答：(1)总体：最近的一个集装箱内的全部油漆； (2)研究变量：装满的油漆罐的质量； (3)样本：最近的一个集装箱内的50罐油漆； (4)推断：50罐油漆的质量应为×50＝226.8 kg。 4．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)一描述推断。答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型； (2)用Excel制作一张频数分布表；

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析，分析被调查者的常住地、职业和年龄分布特征，并绘制条形图。分析——描述统计——频率，选择“常住地”，“职业”和“年龄”到变量中，然后，图表——条形图——图表值（频率）——继续，勾选显示频率表格，点击确定。 Statistics 户口所在地职业年龄 N Valid282282282 Missing000 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市200 边远郊区82 Total282 职业 Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业户 4

种果菜专业户 10 工商运专业户 34 退役人员17 金融机构35 现役军人3 Total282 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282

分析：本次调查的有效样本为282份。常住地的分布状况是：在中心城市的人最多，有200人，而在边远郊区只有82人；职业的分布状况是：在商业服务业的人最多，其次是一般农户和金融机构；年龄方面：在35-50岁的人最多。由于变量中无缺失数据，因此频数分布表中的百分比相同。 2、利用第2章第7题数据，从数据的集中趋势、离散程度以及分布形状等角度，分析被调查者本次存款金额的基本特征，并与标准正态分布曲线进行对比。进一步，对不同常住地储户存款金额的基本特征进行对比分析。分析——描述统计——描述，选择存款金额到变量中。点击选项，勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表，点击继续——确定。分析：由表中可以看出，有效样本为282份，存（取）款金额的均值是，标准差为，峰度系数为，偏度系数为。与标准正态分布曲线进行对比，由峰度系数可以看出，此表的存款金额的数据分布比标准正态分布更陡峭；由偏度系数可以看出，此表的存款金额的数据为右偏分布，表明此表的存款金额均值对平均水平的测度偏大。

spss作业15-17

CHAPTER 15 西北研究院蔡嘉驰131246 15.4 (i) What we choose is part of u t. Then gMIN t and u t are correlated, which causes OLS to be biased and inconsistent. (ii) I think it is uncorrelate because gGDP t controls for the overall performance of the U.S. economy. (iii) The change of U.S. minimum may someway change the state minimum and vice versa. If the state minimum is always the U.S. minimum, then gMIN t is exogenous in this equation and we would just use OLS. 15.7 (i) Because students that would do better anyway are also more likely to attend a choice school. (ii) Since u1 does not contain income, random assignment of grants within income class means that grant designation is not correlated with unobservables such as student ability, motivation, and family support. (iii) The reduced form is choice= π0 + π1faminc + π2grant + v2, and we need π2≠ 0. (iv) The reduced form for score is just a linear function of the exogenous variables: score= α0 + α1faminc + α2grant + v1. This equation allows us to directly estimate the effect of increasing the grant amount on the test score, holding family income fixed.So it is useful. C15.1 (i) The regression of log(wage) on sibs gives

社会统计学习题和答案--相关与回归分析报告

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb 与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析（二次曲线指数曲线）一、填空 1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。 2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。 3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。 4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。 5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。 6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。二、单项选择 1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案第一章思考题 1.1什么是统计学统计学是关于数据的一门学科，它收集，处理，分析，解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计描述统计；它研究的是数据收集，处理，汇总，图表描述，概括与分析等统计方法。推断统计；它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据；按所采用的计量尺度不同分；（定性数据）分类数据：只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，用文字来表述；（定性数据）顺序数据：只能归于某一有序类别的非数字型数据。它也是有类别的，但这些类别是有序的。（定量数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。统计数据；按统计数据都收集方法分；观测数据：是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据：在实验中控制实验对象而收集到的数据。统计数据；按被描述的现象与实践的关系分；截面数据：在相同或相似的时间点收集到的数据，也叫静态数据。时间序列数据：按时间顺序收集到的，用于描述现象随时间变化的情况，也叫动态数据。 1.4解释分类数据，顺序数据和数值型数据答案同1.3 1.5举例说明总体，样本，参数，统计量，变量这几个概念对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。 1.6变量的分类

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下：单位：万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求：（1）根据上面的数据进行适当分组，编制频数分布表，绘制直方图。（2）制作茎叶图，并与直方图进行比较。解：（1）频数分布表

或：（2）茎叶图

第三章 1. 已知下表资料：试根据频数和频率资料，分别计算工人平均日产量。解：计算表

根据频数计算工人平均日产量：6870 34.35200 xf x f = = =∑∑（件）根据频率计算工人平均日产量：34.35f x x f = = ∑∑ g （件）结论：对同一资料，采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表：试计算这9个企业的平均单位成本。解：

这9个企业的平均单位成本=f x x f = ∑∑ =13.74（元） 3.某专业统计学考试成绩资料如下：试计算众数、中位数。解：众数的计算：根据资料知众数在80～90这一组，故L=80，d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1) 作为华夏儿女都曾为有着五千年的文化历史而骄傲过，作为时代青年都曾为中国所饱受的欺压而愤慨过，因为我们多是炎黄子孙。然而，当代大学生对华夏文明究竟知道多少呢某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查，各个学院发放问卷数参照各个学院的人数比例，总共发放问卷250余份，回收有效问卷228份。调查问卷设置了调查大学生对传统文化了解程度的题目，如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。调查问卷给出了每位调查者对传统文化了解程度的总得分，同时也列出了被调查者的性别、专业、年级等数据信息。请利用这些资料，分析以下问题。问题一：分析大学生对中国传统文化的了解程度得分，并按了解程度对得分进行合理的分类。问题二：研究获得文化来源对大学生了解传统文化的程度是否存在影响。要求：直接导出查看器文件为.doc后打印（导出后不得修改）对分析结果进行说明，另附(手写、打印均可)。于作业布置后，1周内上交本次作业计入期末成绩

答案问题一操作过程 1.打开数据文件作业。同时单击数据浏览窗口的【变量视图】按钮，检查各个变量的数据结构定义是否合理，是否需要修改调整。 2.选择菜单栏中的【分析】→【描述统计】→【频率】命令，弹出【频率】对话框。在此对话框左侧的候选变量列表框中选择“X9”变量，将其添加至【变量】列表框中，表示它是进行频数分析的变量。 3.单击【统计量】按钮，在弹出的对话框的【割点相等组】文本框中键入数字 “5”，输出第20％、40％、60％和80％百分位数，即将数据按照题目要求分为等间隔的五类。接着，勾选【标准差】、【均值】等选项，表示输出了解程度得分的描述性统计量。再单击【继续】按钮，返回【频率】对话框。

社会统计学复习题有答案

社会统计学复习题有答案集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零；各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度= 平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多；曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6％，实际降低了7％，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度；若某厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度。

9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数r=0，则表明两个变量之间不存在线性相关关系。二、判断题 1、在季节变动分析中，若季节比率大于100%，说明现象处在淡季；若季节比率小于100%，说明现象处在旺季。（×；答案提示：在季节变动分析中，若季节比率大于100%，说明现象处在旺季；若季节比率小于100%，说明现象处在淡季。） 2、工业产值属于离散变量；设备数量属于连续变量。（×；答案提示：工业产值属于连续变量；设备数量属于离散变量） 3、中位数与众数不容易受到原始数据中极值的影响。（√；） 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√）

spss期末作业

吉林财经大学《SPSS统计软件分析》作业（2010——2011学年第一学期）学院信息学院专业班级电子商务0806班学生姓名王瑞霞学号1403080616

1、对未分组资料频数分析从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况，以该数据为例为例，进行频数分析。首先输入数据：选择Analyze中Descriptive Statistics——Frequencies，打开Frequencies对话框；将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标，选中所需要计算的指标：单击Charts …按钮,选择需绘制的统计图：单击OK按钮开始运行，运行结果为：

从上图中可以看出数据中缺失值为0，花生油的平均价格104.84是最高的，而巴氏牛奶的平均价格1.81最低，全部食品平均价格的平均数为16.5327，标准差为22.4668，各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标，其实质是一样的，从图中可以看出平均价格在0—22元之间的食品是最多的，20—40元之间的食品数次之，接下来是40—60元之间的食品，不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析： Transform —Recode—Into same V ariables ，将要分组的变量放入Numeric 栏中，单击Old and new V alues分组：

分组结果如下图所示：回到数据编辑窗，定义变量的V alue labels ：再对食品平均价格进行频数分析，分析结果如下截图所示

社会统计学习题和答案--相关与回归分析

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数第四节定距变量的相关分析相关表与相关图·积差系数的导出与计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5～0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章统计描述【】某企业生产铝合金钢，计划年产量40万吨，实际年产量45万吨；计划降低成本5%，实际降低成本8%；计划劳动生产率提高8%，实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量即产量超额完成%。成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比即成本超额完成%。劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比即劳动生产率超额完成%。【】某煤矿可采储量为200亿吨，计划在1991~1995年五年中开采全部储量的%，试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。【解】本题采用累计法：（1）该煤矿原煤开采量五年计划完成=100% ?数计划期间计划规定累计数计划期间实际完成累计 = 75%.1261021025357 4 =?? 即：该煤矿原煤开采量的五年计划超额完成%。（2）将1991年的实际开采量一直加到1995年上半年的实际开采量，结果为2000万吨，此时恰好等于五年的计划开采量，所以可知，提前半年完成计划。【】我国1991年和1994年工业总产值资料如下表：

要求：（1）计算我国1991年和1994年轻工业总产值占工业总产值的比重，填入表中；（2）1991年、1994年轻工业与重工业之间是什么比例（用系数表示）？（3）假如工业总产值1994年计划比1991年增长45%，实际比计划多增长百分之几？ 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈； 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ （3） %37.25 1%) 451(2824851353 ≈-+ 即，94年实际比计划增长%。【】某乡三个村2000年小麦播种面积与亩产量资料如下表：要求：（1）填上表中所缺数字；（2）用播种面积作权数，计算三个村小麦平均亩产量；（3）用比重作权数，计算三个村小麦平均亩产量。

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级姓名学号 - 广东财经大学答题纸（格式二）课程数据处理技术与SPSS 20 15 －20 16 学年第 1 学期成绩评阅人评语：＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝（题目）关于本部学生对收费代课现象支持度的调查报告（正文）一、调查背景如今，大学生逃课现象屡见不鲜，随之衍生了“收费代课”的现象。据了解，在全国近百所高校中，存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业，成为有领导、有组织、有规模、有纪律的机构，不仅仅应当引起社会的关注，更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象，有其存在的社会土壤，其原因有多方面，值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时，我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为，同学们褒贬不一，每个人都有自己的看法。然而，这种行为经常在我们的身边发生着，无疑应该引起我们的关注，并引发我们的深思，形成一定的判别能力与认知能力。

二、调查目的我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因，以及对本专业学习、实习实践的认知程度，是否支持放弃学习去实习或者做自己的事情，是否支持收费代课。同时，我们也希望通过这份调查报告揭露出的一些情况，一方面，帮助学生更好地权衡学习与实习的利弊，更加理性地对待收费代课的行为，做出对自己正确合适的选择；另一方面，引起学校对这种收费代课现象的重视，给学校提一些建议，希望学校采取一些措施改善这种不良校风。三、调查方法从可行性角度出发，本次调查采用非概率随机抽样的街头拦截法，集中对象为本部大三大四的同学，以自愿形式对本部同学分发调查问卷，总共发出80份问卷，回收80份，有效问卷80份。收集问卷之后，利用spss软件进行数据整理与分析，最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有：频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。四、描述统计 1、对样本性别作频数分析从上表可以看出，这次填写问卷的女生较多，占了样本的66.3%，这与我们学校男女比例不均衡有很大的关系，样本的男女比例不相等，也可以较好地接近学校的实际情况，有利于我们得到更为准确的结论。 2、对样本年级作频数分析从上表可知，参加问卷调查的大三大四学生比例明显比较高，这与一开始我们预期相符，样本中大三大四学生所占比例较多，有利于我们得到更为有针对性的结论。

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源，欢迎共阅社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。2最小值。345、正J 6于重点7；总 8计划超额完成程度为；若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。

海量资源，欢迎共阅 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位 13 1 100%，） 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√） 5、统计调查按调查范围划分可以分为全面调查和非全面调查。（√） 6、用移动平均法修匀时间数列时，如果移动项数为偶数项，只要进行一次移动平均；如果移动项数为奇数项，则要进行二次移动平均。（×；答案提示：用移动平均法修匀时间数列时，如果移动项数为奇数项，只要进行一次移动平均；如果移动项数为偶数项，则要进行二

《卫生统计学》课后思考题答案

《卫生统计学》思考题参考答案第一章绪论 1、统计资料可以分为那几种类型？举例说明不同类型资料之间是如何转换的？答：（1）1定量资料（离散型变量、连续型变量）、2无序分类资料（二项分类资料、无序多项分类资料）、3有序分类资料（即等级资料）；（2）例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级，应归为等级资料，若将该五个等级赋值为5、4、3、2、1，就可按定量资料处理。 2、统计工作可分为那几个步骤？答：设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。答：某人打靶100次，中靶次数少于等于5，那么该人一次打中靶的概率≤0.05，即可称该人一次打中靶的事件为小概率事件，可以视为很可能不发生。第二章调查研究设计 1、调查研究有何特点？答：（1）不能人为施加干预措施（2）不能随机分组（3）很难控制干扰因素（4）一般不能下因果结论 2、四种常用的抽样方法各有什么特点？答：（1）单纯随机抽样：优点是操作简单，统计量的计算较简便；缺点是当总体观察单位数量庞大时，逐一编号繁复，有时难以做到。

（2）系统抽样：优点是易于理解、操作简便，被抽到的观察单位在总体中分布均匀，抽样误差较单纯随机抽样小；缺点是在某些情况下会出现偏性或周期性变化。（3）分层抽样：优点是抽样误差小，各层可以独立进行统计分析，适合大规模统计；缺点是事先要进行分层，操作麻烦。（4）整群抽样：优点是易于组织和操作大规模抽样调查；缺点是抽样误差大。 3、调查设计包括那些基本内容？答：（1）明确调查目的和指标（2）确定调查对象和观察单位（3）选择调查方法和技术（4）估计样本大小（5）编制调查表（6）评价问卷的信度和效度（7）制定资料的收集计划（8）指定资料的整理与分析计划（9）制定调查的组织措施 4、调查表中包含那几种项目？答：（1）分析项目直接整理计算的必须的内容；（2）备查项目保证分析项目填写得完整和准确的内容；（3）其他项目大型调查表的前言和表底附注。第三章实验设计 1、简述实验设计的特点。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析，分析被调查者的常住地、职业和年龄分布特征，并绘制条形图。分析——描述统计——频率，选择“常住地”，“职业”和“年龄”到变量中，然后，图表——条形图——图表值（频率）——继续，勾选显示频率表格，点击确定。 Statistics 户口所在职业年龄地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理种果菜专业 10 3.5 3.568.4 户工商运专业 3412.112.180.5户退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0

SPSS期末大作业-完整版

第1题：基本统计分析1 分析：本题要求随机选取80%的样本，因而需要选用随机抽样的方法，在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下：数据→选择个案→随机个案样本→大约（A）80 所有个案的%。 1、基本思路：（1）由于存款金额为定距型变量，直接采用频数分析不利于对其分布形态的把握，因而采用数据分组，先对数据进行分组再编制频数分布表。此处分为少于500元，500~2000元，2000~3500元，3500~5000元，5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。（2）进行数据拆分，并分别计算不同年龄段储户的一次存取款金额的四分位数，并通过四分位数比较其分布上的差异。操作步骤：（1）数据分组：【转换→重新编码为不同变量】，然后选择存取款金额到【数字变量→输出变量（V）】框中。在【名称（N）】中输入“存取款金额1”，单击【更改（H）】按钮；单击【旧值和新值】按钮进行分组区间定义。存取款金额1 频率百分比有效百分比累积百分比有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 （2）【分析→描述统计→频率】；选择“存款金额分组”变量到【变量（V）】框中；单击【图标（C）】按钮，选择【直方图】和【在直方图上显示正态曲线】；选中【显示频率表格】，确定。

（3）【数据→拆分文件】，选择“年龄”变量到【分组方式】框中，选中【比较组】和【按分组变量排序文件】，确定；【分析→描述统计→频率】，选择“存款金额”到【变量】框中，单击【统计量】按钮，选择【四分位数】→继续→确定。统计量存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述：频数分布表表明，有一半以上的人的一次存取款金额少于2000元，且有34.6%的人的存取款金额少于500元，19.8%的人的存取款金额多于5000元，下图为相应的带正态曲线的直方图。