文档库 最新最全的文档下载
当前位置:文档库 › 统计学基础-第八章-相关与回归分析

统计学基础-第八章-相关与回归分析

统计学基础-第八章-相关与回归分析
统计学基础-第八章-相关与回归分析

统计学基础第八章相关与回归分析

【教学目的】

1.掌握相关系数的测定和性质

2.明确相关分析与回归分析的特点

3.建立回归直线方程,掌握估计标准误差的计算

【教学重点】

1.相关关系、相关分析和回归分析的概念

2.相关系数计算

3.回归方程的建立和依此进行估计和预测

【教学难点】

1.相关分析和回归分析的区别

2.相关系数的计算

3.回归系数的计算

4.估计标准误的计算

【教学时数】

教学学时为8课时

【教学内容参考】

第一节相关关系

一、相关关系的含义

宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。

相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种

完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。

在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。

二、相关关系的特点

1.现象之间确实存在数量上的依存关系

如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。

2.现象之间数量上的关系是不确定的

相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。

三、相关关系的种类

现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类:

(一)正相关与负相关

按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如

家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。

(二)单相关与复相关

按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因变量,如同时研究成本、市场供求状况、消费倾向对利润的影响时,这几个因素之间的关系是复相关。

(三)线性相关与非线性相关

按相关关系的表现形态分,可分为线性相关与非线性相关。线性相关是指在两个变量之间,当自变量x值发生变动时,因变量y值发生大致均等的变动,在相关图的分布上,近似地表现为直线形式。比如,商品销售额与销售量即为线性相关。非线性相关是指在两个变量之间,当自变量x值发生变动时,因变量y值发生不均等的变动,在相关图的分布上,表现为抛物线、双曲线、指数曲线等非直线形式。比如,从人的生命全过程来看,年龄与医疗费支出呈非线性相关。

(四)完全相关、不完全相关与不相关

按相关程度分,可分为完全相关、不完全相关和不相关。完全相关是指两个变量之间具有完全确定的关系,即因变量y值完全随自变量x值的变动而变动,它在相关图上表现为所有的观察点都落在同一条直线上,这时,相关关系就转化为函数关系。不相关是指两个变量之间不存在相关关系,即两个变量变动彼此互不影响。自变量x值变动时,因变量y值不随之作相应变动。比如,家庭收入多少与孩子多少之间不存在相关关系。不完全相关是指介于完全相关和不相关之间的一种相关关系。比如,农作物产量与播种面积之间的关系。不完全相关关系是统计研究的主要

对象。

第二节相关分析

一、相关分析的主要内容

相关分析是指对客观现象的相互依存关系进行分析、研究,这种分析方法叫相关分析法。相关分析的目的在于研究相互关系的密切程度及其变化规律,以便作出判断,进行必要的预测和控制。相关分析的主要内容包括:

(一)确定现象之间有无相关关系

这是相关与回归分析的起点,只有存在相互依存关系,才有必要进行进一步的分析。

(二)确定相关关系的密切程度和方向

确定相关关系密切程度主要是通过绘制相关图表和计算相关系数。只有对达到一定密切程度的相关关系,才可配合具有一定意义的回归方程。

(三)确定相关关系的数学表达式

为确定现象之间变化上的一般关系,我们必须使用函数关系的数学公式作为相关关系的数学表达式。如果现象之间表现为直线相关,我们可采用配合直线方程的方法;如果现象之间表现为曲线相关,我们可采用配合曲线方程的方法。

(四)确定因变量估计值误差程度

使用配合直线或曲线的方法可以找到现象之间一般的变化关系,也就是自变量x变化时,因变量y将会发生多大的变化。根据得出的直线方程或曲线方程我们可以给出自变量的若干数值,球的因变量的若干个估计值。估计值与实际值是有出入的,确定因变量估计值误差大小的指标是估计标准误差。估计标准误差大,表明估计不太精确;估计标准误差小,表明估计较精确。

二、相关关系的测定

相关分析的主要方法有相关表、相关图和相关系数三种。现将这三种方法分述如下:

(一)相关表

在统计中,制作相关表或相关图,可以直观地判断现象之间大致存在的相关关系的方向、形式和密切程度。

在对现象总体中两种相关变量作相关分析,以研究其相互依存关系时,如果将实际调查取得的一系列成对变量值的资料顺序地排列在一张表格上,这张表格就是相关表。相关表仍然是统计表的一种。根据资料是否分组,相关表可以分为简单相关表和分组相关表。

1.简单相关表

简单相关表是资料未经分组的相关表,它是把自变量按从小到大的顺序并配合因变量一一对应平行排列起来的统计表。

【案例】

为研究分析产量(x)与单位产品成本(y)之间的关系,从30个同类型企业调查得到的原始资料并将产量按从小到大的顺序排列,可编制简单相关表,结果见表8-2所示。

从表8-2中可以看出,随着产量的提高,单位产品成本却有相应降低的趋势,尽管在同样产量的情况下,单位产品成本存在差异,但是两者之间仍然存在一定的依存关系。

2.分组相关表

在大量观察的情况下,原始资料很多,运用简单相关表表示就很难使用。这时就要将原始资料进行分组,然后编制相关表,这种相关表称为分组相关表。分组相关表包括单变量分组相关表和双变量分组相关表两种。

(1)单变量分组表。在原始资料很多时,对自变量数值进行分组,而对应的因变量不分组,只

计算其平均值,根据资料具体情况,自变量可以是单项式,也可以是组距式。

【案例】

以上例原始资料为例,将同类型30个企业的产量(x)与单位产品成本(y)原始资料,按产量分组编制单变量分组表,结果见表8-3。

表8-3 产量和单位产品成本简单相关表

从表8-3中可以较明显地看出二者之间存在正相关关系。

(2)双变量分组表。对两种有关变量都进行分组,交叉排列,并列出两种变量各组间的共同次数,这种统计表称为双变量分组相关表。这种表格形似棋盘,故又称棋盘式相关表。

【案例】

仍以原始资料为例,将同类型30个企业的产量(x)与单位产品成本(y)原始资料,编制双变量分组相关表,结果见表8-4。

从表8-4看出,产量集中在左上角到右下角的对角斜线上,表明产量与单位产品成本是负相关关系。

制作双变量分组相关表,须注意自变量为纵栏标题,按变量值从小到大自左向右排列,因变量为横行标题,按变量值从大到小自上而下排列。这样做的目的是将相关表与相关图结合起来,

便于一致性判断相关关系的性质。

(二)相关图

相关图又称散点图。它是以直角坐标系的横轴代表自变量x,纵轴代表因变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。

相关图可以按未经分组的原始资料来编制,也可以按分组的资料,包括按单变量分组相关表和双变量分组相关表来编制。通过相关图将会发现,当y对x是函数关系时,所有的相关点都会分布在某一条线上;在相关关系的情况下,由于其他因素的影响,这些点并非处在一条线上,但所有相关点的分布也会显示出某种趋势。所以相关图会很直观地显示现象之间相关的方向和密切程度。

【案例】

以上例原始资料中编制的产量与单位产品成本单变量分组相关表为例,绘制相关图,结果见图8-1。

从图8-1中可以看出,单位产品成本随着产量增加而降低,并且散布点的分布近似地表现为一条直线。由此可以判断产量与单位产品成本两个变量之间存在着直线负相关关系。

(三)相关系数

相关表和相关图大体说明变量之间有无关系,但它们的相关关系的紧密程度却无法表达,因

此,需运用数学解析方法,构建一个恰当的数学模型来显示相关关系及其密切程度。对现象之间的相关关系的紧密程度做出确切的数量说明,就需要计算相关系数。 1.相关系数的计算

相关系数是在直线相关条件下,说明两个现象之间关系密切程度的统计分析指标,记为γ。相关系数的计算公式为

()()

()()

∑∑∑∑----=

=2

22

111

y y n

x x n y y x x n

y

x xy

σσσγ

式中 n ——资料项数;

x ——x 变量的算术平均数;

y ——y 变量的算术平均数

x σ——x 变量的标准差; y σ——y 变量的标准差; xy σ——xy 变量的协方差。

在实际问题中,如果根据原始资料计算相关系数,可运用相关系数的简捷法计算,其计算公式为

()

()

2

22

2∑∑∑∑∑∑∑---=

y y n x x n y x xy n γ

【案例】

根据教材中表8-5中的资料,已知居民家庭月收入与消费支出之间为直线相关,计算居民家庭月收入与消费支出的相关系数(见表8-6)。

99.0349

15571104652975110349

46521429102

2

=-??-??-?=

γ

2.相关系数的分析

明晰相关系数的性质是进行相关系数分析的前提。现将相关系数的性质总结如下: (1)相关系数的数值范围,是在-1和+1之间,即:-1≤γ≤1。

(2)计算结果,当γ>0时,表示x 与y 为正相关;当γ<0时,x 与y 为负相关。

(3)相关系数γ的绝对值越接近于1,表示相关关系越强;越接近于0,表示相关关系越弱。如果|γ|=1,则表示两个现象完全直线相关。如果|γ|=0,则表示两个现象完全不相关(不是直线相关)。

(4)相关系数γ的绝对值在0.3以下是无直线相关,0.3以上是有直线相关,0.3~0.5是低度直线相关,0.5~0.8是显著相关,0.8以上是高度相关。 【案例】

上例中计算的相关系数为0.99,说明消费支出与居民家庭月收入呈高度正相关,也就是家庭收入越高,消费支出也越高。

第三节 回归分析

一、回归分析的含义

就一般意义而言,相关分析包括回归和相关两方面内容,因为回归与相关都是研究两变量相互关系的分析方法。但就具体方法而言,回归分析和相关分析是有明显差别的。相关图表、相关

系数能判定两变量之间相关的方向和密切程度,但不能指出两变量相互关系的具体表现形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析就是对具有相关关系的两个或两个以上变量的数量变化规律进行测定,确立一个相应的数学表达式,并进行估算和预测的一种统计方法。

回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明数量关系的具体表现形式,而回归分析则应该建立在相关分析的基础上。只有依靠相关分析,对现象的数量变化规律判明具有密切相关关系后,再进行回归分析,求其相关的具体表现形式,这样才具有实际意义。

回归分析建立的数学表达式称为回归方程(或回归模型)。回归方程为线性方程的,称为线性回归;回归方程为非线性方程的称为非线性回归。两个变量之间的回归称为一元回归(简单回归);三个或三个以上变量之间的回归称为多元回归。本章只介绍一元线性回归,即简单线性回归分析方法。

二、回归分析的主要内容

(一)建立相关关系的回归方程

利用回归分析方法,配合一个表明变量之间数量上相关的方程式,而且根据自变量x的变动,来预测因变量y的变动。

(二)测定因变量的估计值与实际值的误差程度

通过计算估计标准误差指标,可以反映因变量估计值的准确程度,从而将误差控制在一定范围内。

三、回归分析的特点

回归分析与相关分析比较具有以下特点:

1.在相关分析中,各变量都是随机变量;而回归分析中,因变量是随机变量,自变量不是随

统计学第五章课后题及答案解析

第五章 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学第五版(贾俊平)第八章课后习题答案

《统计学》第八章课后练习题 8.4 解:由题意知,μ=100,α=0.05,n=9<30,故选用t统计量。经计算得:x =99.9778,s=1.2122, 进行检验的过程为: H0:μ=100 H1:μ≠100 t= s n = 1.21229 =?0.0549 当α= 0.05,自由度n-1= 8,查表得tα2(8)=2.3060,因为t< tα2,样本统计量落在接收域,所以接受原假设H0,即打包机正常工作。 用P值检测,这是双侧检验,故: P=2×1?0.5215=0.957,P值远远大于α,所以不能原假设H0。 8.7 解:由题意知,μ=225,α=0.05,n=16<30,故选用t统计量。 经计算得:x =241.5,s=98.7259, 进行检验的过程为: H0:μ≤225 H1:μ>225 t= s n = 98.725916 =0.6685 当α= 0.05,自由度n-1= 15,查表得tα(15)=2.1314,这是一个右单侧检验,因为t

即元件平均寿命没有显著大于225小时。 用P值检测,这是右单侧检验,故: P=1?0.743=0.257,P值远远大于α,所以不能拒绝原假设H0。 8.9, 解:由题意得 σA2=632,σB2=572,x A=1070,x B=1020,n A=81,n B=64,故选用z统计量。 进行检验的过程为: H0:μA?μB=0 H1: μA?μB≠0 Z=A B A B σA A +σB B = 632+572 =5 当α=0.05时,zα2=1.96,因为Z>zα2,所以拒绝原假设H0,,即A、B两厂生产的材料平均抗压强度不相同。 用P值检测,这是双侧检验,故: P=2×1?0.9999997=0.0000006,P值远远小于α,所以拒绝原假设H0, 8.13 解:建立假设为: H0: π1=π2 H1: π1≠π2 由题意得:

i第八章单因素方差分析 (1)

幻灯片1 【例】调查了5个不同小麦品系的株高,结果如下。试判断这5个品系的株高是否存在显著性差异。 5个小麦品系株高(cm)调查结果 株号品系 ⅠⅡⅢⅣⅤ 1 2 3 4 5 和平均数64.6 65.3 64.8 66.0 65.8 326.5 65.3 64.5 65.3 64.6 63.7 63.9 322.0 64.4 67.8 66.3 67.1 66.8 68.5 336.5 67.3 71.8 72.1 70.0 69.1 71.0 354.0 70.8 69.2 68.2 69.8 68.3 67.5 343.0 68.6 幻灯片2 第八章单因素方差分析 One-factor analysis of variance 幻灯片3 本章内容 第一节方差分析简述 第二节固定效应模型 第三节随机效应模型 第四节多重比较 第五节方差分析应具备的条件 幻灯片4 第一节方差分析简述 一、方差分析的一般概念 1、概念 方差分析( analysis of variance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t 检验的延伸。 幻灯片5 单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。 单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。 水平(level):每个因素不同的处理(treatment)。 幻灯片6 方差分析 Analysis of Variance (ANOVA ) ANOV A 由英国统计学家,用于推断多个总体均数有无差异。

统计学第八章方差分析

第八章方差分析 Ⅰ.学习目的 本章介绍方差分析的理论、方法与运用。通过学习,要求:1.了解方差分析的基本概念和思想;2.理解方差分解原理;3.掌握单因素、双因素(有、无交互作用)方差分析的原理和流程;4学会针对资料提出原假设,并能利用Excel进行方差分析。 Ⅱ.课程内容要点 第一节方差分析方法引导 一、方差分析问题的提出 方差分析,简称ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,将不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度以及相对大小。当已经确认某几种因素对试验结果有显著影响时,可使用方差分析检验确定哪种因素对试验结果的影响最为显著及估计影响程度。 二、方差分析的有关术语和概念 1.试验结果:在一项试验中用来衡量试验效果的特征量,也称试验指100

101 标或指标,类似函数的因变量或者目标函数。 2.试验因素:试验中,凡是对试验指标可能产生影响的原因都称为因素,或称为因子,类似函数的自变量。试验中需要考察的因素称为试验因素,简称为因素。一般用大写字母A 、B 、C 、……表示。方差分析的目的就是分析实验因素对实验或抽样的结果有无显著影响。如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;如果在实验中变化的因素不止一个,这时的方差分析就称为多因素方差分析。 3.因素水平:因素在试验中所处的各种状态或者所取的不同值,称为该因素的水平,简称水平。一般用下标区分。同样因素水平有时可以取得具体的数量值,有时只能取到定性值(如好,中,差等)。 4.交互作用:当方差分析过程中的影响因素不唯一时,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。 三、方差分析的基本原理 (一)方差分解原理 一般地,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随机影响的加总。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。 (二)检验统计量 检验因素影响是否显著的统计量是F 统计量: 组内方差的自由度 组内方差组间方差的自由度 组间方差// F

统计学基础_第五章_动态数列分析

统计学基础第五章动态数列分析 【教学目的】 1.区分不同种类的动态数列 2.熟练掌握计算平均发展水平的各种方法 3.掌握发展速度、增长速度的种类,运用它们之间的数量关系进行动态指标的相互推算 4.理解趋势的意义,运用长期趋势测定方法对长期趋势进行测定 5.计算季节比率,并且深刻理解季节比率的经济含义 【教学重点】 1.总量指标动态数列的种类和特点 2.动态比较指标和动态平均指标的计算 3.动态数列的分析方法 【教学难点】 1.绝对数时间数列中的时点数列平均指标的计算 2.相对数、平均数时间数列动态平均指标的计算 3.动态数列分析方法中的季节变动分析方法 【教学时数】 教学学时为12课时 【教学容参考】 第一节动态数列的意义和种类 一、动态数列的概念 将某一个统计指标在不同时间上的各个数值,按时间先后顺序排列,就形成了一个动态数列,也叫做时间数列。动态数列一般由两个基本要素构成:一是被研究现象所属的时间;二是反映该现象的统计指标数值。 通过编制和分析动态数列,首先可以从现象的量变过程中反映其发展变化的方向、程度和趋势,研究其质量变化的规律性。 其次,通过对动态数列资料的研究,可以对某些社会经济现象进行预测。 第三,利用动态数列,可以在不同地区或国家之间进行对比分析。 编制和分析动态数列具有非常重要的作用,这种方法已成为对社会经济现象进行统计分析的一种重要方法。 【案例】 下面图表列举了我国2004~2007年若干经济指标的动态数列。 表5-1 我国2004-2007年若干经济指标 二、动态数列的种类 按照构成动态数列的基本要素———统计指标的表现形式不同,动态数列可分为绝对数动态数列、相对数动态数列和平均数动态数列三种类型。其中绝对数动态数列是基本的数列,相对数和平均数动态数列是派生数列。

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

统计学第五章 练习

第五章 一、填空题: 1、时间序列的构成要素包括 和 。 2、绝对数时间序列可以分为 和 两种,序列中不同时间数值相加有实际的意义的是 。 3、设i=1,2,…n , i a 为第i 期发展水平,则1a 称为 ,n a 称为 ,/i a 1 i a 是 , /i a 1a 是 。 4、计算间断时点序列平均发展水平,一般有两个假设条件:假设上期末水平 本期初水平,其二是假设现象在间断期内数量 变化。 5、时间序列的波动可以分解为 、 、循环变动和不规则变动。 6、报告期粮食总产量增加12%,粮食播种面积增加9%,则粮食每亩产量提高 。 二、单项选择题 1、时间序列与变量数列( )。 A 、都是根据时间顺序排列的 B 、都是根据变量值大小排列的 C 、前者根据时间顺序排列的,后者根据变量值大小排列的 D 、前者根据变量值大小排列的,后者根据时间顺序排列的 2、时间序列中,数值大小与时间长短有直接关系的是( )。 A 、时点序列 B 、时期序列 C 、平均数时间序列 D 、相对数序列 3.对时间数列进行动态比较分析和动态平均分析的基础指标是( )。 A 、发展水平 B 、发展速度 C 、平均发展水平 D 、平均发展速度 4、发展速度属于( )。 A 、比例相对数 B 、动态相对数 C 、比较相对数 D 、强度相对数 5、一个动态数列的多个环比增长速度分别为4%、6%、9%,该数列的定基增长速度为( )。 A 、4%×6%×9% B 、 104%×106%×109% C 、(4%×6%×9%)-1 D 、(104%×106%×109%)-1 6、 若各年环比增长速度保持不变,则各年的增长量( )。 A 、逐年增加 B 、逐年减少 C 、保持不变 D 、无法判断

统计学第八章题目

一.单项选择题 1、用于测定两个变量之间密切程度的方法是(D )。 A、定性判断 B、相关表 C、相关图 D、相关系数 2、产品产量与单位成本的相关系数是—,单位成本与利润率的相关系数是,产量与利润的相关系数是,因此(C)。 A、产量与利润的相关程度最高 B、单位成本与利润率的相关程度最高 C、产量与单位成本的相关程度最高 D、无法判断哪对变量的相关程度最高 3、相关系数的取值范围是(D )。 A、0≤r≤1 B、-1≤r≤0 C、r>0 D、-1≤r≤1 4、变量x与y之间的负相关是指(C )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少 C、x值增大时y值随之减少,或x值减少时y值随之增大 D、y的取值几乎不受x取值的影响 5、两个变量之间的相关关系称为( B )。 A、复相关 B、单相关 C、曲线相关 D、直线相关 6、、正方形的边长与周长的相关系数为(A )。 A、1 B、-1 C、0 D、无法计算 7、在一元线性回归方程中,回归系数b的含义是( B )。 A、当x=0时,y的平均值

B 、当x 变动一个单位时,y 的平均变动数额 C 、当x 变动一个单位时,y 增加的总数额 D 、当y 变动一个单位时,x 的平均变动数额 8、常用的求解一元线性回归方程的方法是( B )。 A 、相关系数法 B 、最小平方法 C 、误差绝对值最小法 D 、误差和最小法 9、下列回归方程与相关系数的对应式中,错误的是( C ) A 、89.0,5.2170?-=-=r x y B 、94.0,8.35?-=--=r x y C 、78.0,5.036?-=+=r x y D 、98.0,9.25?=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则二者的相关系数的值为( B )。 A 、 B 、 C 、 D 、 11、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b 的值为( B )。 A 、 B 、 C 、 D 、 12、若相关系数为正值,则回归系数的值( B )。 A 、为负 B 、为正 C 、视a 的符号而定 D 、不能确定 13、回归估计标准误差是说明( C )的指标。 A 、平均数代表性 B 、现象之间相关程度 C 、回归直线代表性 D 、抽样误差平均程度

第五章 统计学习题集 假设检验 第六章 方差分析

第五章 假设检验 第六章 方差分析 1、某厂生产一种产品,原月产量服从)14,75(N 。设备更新后,为了考察产量是否提高,抽查了6个月的产量,其平均产量为78。问在显著水平5%条件下,设备是否值得更新? 2、某工厂对所生产的产品进行质量检验,规定:次品率不得超过0.01,方可出厂。现从一批产品中随机抽查80件,发现次品2件。试问在0.05的显著水平下,这批产品是否可以出厂? 3、已知某种电子元件的使用寿命服从标准差为100小时的正态分布,要求平均寿命不得低于1000小时。现在从一批这种电子元件中随机抽取25件,测得平均寿命为950小时。试在0.02 的显著性水平下,检验这批元件是否合格. 4、在正常生产情况下,某厂生产的无缝钢管的内径服从均值为54mm 、 标准差为0.9mm 的正态分布。某日从当天生产的产品中随机抽取10根,测得内径分别为:53.8,54.0,55.1,54.2,52.1,54.2,55.0,55.8,55.4,55.5(单位:mm )。试检验该日产品生产是否正常(α=5%)。 5、某专家认为A 地男孩入学率明显高于女孩,小学男女学生比例至少是6:4。从A 地小学中随机抽取400个学生的调查结果是:男生258人,女生142人.问当α=5%时,调查结果是否支持该专家的观点? 6、某饮料厂生产一种新型饮料,其颜色有四种分别为:橘黃色、粉色、绿色、和无色透明。随机从5家商场收集了前一期其销售量,数据如下表: 数据计算结果如下: 组间平方和为76.8445,组内平方和为39.084。问饮料的颜色是否对产品的销售量产生显著的影响? {66.8)3,16(05.0=F ,24.3)16,3(05.0=F ,29.5)16,3(01.0=F ,69.26)3,16(01.0=F }

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学答案第八章

统计学答案第八章. 三、选择题纤维的纤某厂生产的化纤纤度服从正态分布,1 根纤维的纤25.40。某天测得度的标准均值为1

度的均值=1.39,检验与原来设计的标准均值x比是否有所变化,要求的显著性水平为 α=0.05,则下列正确的假设形式是()。A.H:μ=1.40,H:μ≠1.40 B. H:μ001≤1.40,H:μ>1.40 1C. H:μ<1.40,H:μ≥1.40 D. H:010μ≥1.40,H:μ<1.40 1 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。

A. H:π≤0.2,H:π>0.2 B. H:π001=0.2,H:π≠0.2 1C. H:π≥0.3,H:π<0.3 D. H:π001≥0.3,H:π<0.3 1 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机位参加该项计划的样本,结果显示:样40抽 取.

32标准差为磅,则本的体重平均减少7磅,。其原假设和备择假设是()A. H:μ≤8,

H:μ>8 B. H:μ≥001 8,H:μ<8 1C. H:μ≤7,H:μ>7 D. H:μ≥0107,H:μ<7 1 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的

5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学教案习题05方差分析

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设和F 值的意义。 (3) 方差分析的使用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方和误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组 间 )表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间= 21 )(x x n k i i i -∑= ,组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ? ???-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。 (3)总变异:所有观察值之间的变异(不分组),这种变异叫做总变异(total variation)。其大小可用全体数据的方差表示, 也称总均方(MS 总 )。按方差的计算方法,MS 总= 总总ν/SS ,其中SS 总=211 )(∑∑==-k i n j ij i x x , k 为处理组数,i n 为第i 组例数,总ν=N -1为总的自由度, N 表示总例数。 (二)方差分析的使用条件 (1) 各样本是相互独立的随机样本,且来自正态分布总体。 (2) 各样本的总体方差相等,即方差齐性(homoscedasticity)。 (三)不同设计资料的方差分析 1.完全随机设计的单因素方差分析 (1)资料类型:完全随机设计(completely random design)是将受试对象完全随机地分配到各个处理组。设计因素

2015年《统计学》第五章 平均指标习题及满分答案

2015年《统计学》第五章平均指标习题及满分答案 (一)填空题 1.平均数可以反映总体各单位标志值分布的(集中趋势)。 2.社会经济统计中,常用的平均指标有(算术平均指标 )、(调和平均指标)、(几何平均指标)、(中位数 )和(众数)。 3.算术平均数不仅受(标志值)大小的影响,而且也受(权数 )多少的影响。 4.各变量值与其算术平均数离差之和等于(零 ),各变量值与其算术平均数离差平方和为(最小)。 5.调和平均数是平均数的一种,它是(标志值倒数 )的算术平均数的(倒数),又称(倒数)平均数。 6.几何平均数是计算平均比率和平均速度最适用的一种方法,凡是变量值的连乘积等于(总比率)或(总速度 )的现象,都可以使用几何平均数计算平均比率或平均速度。 7.众数决定于(分配次数)最多的变量值,因此不受(极端值 )的影响,中位数只受极端值的(位置)影响,不受其(大小 )的影响。

(二)单项选择题 1.平均数反映了(A)。 A、总体分布的集中趋势 B、总体中总体单位的集中趋势 C、总体分布的离中趋势 D、总体变动的趋势 2.加权算术平均数的大小(D)。 A、受各组标志值的影响最大 B、受各组次数的影响最大 C、受各组权数系数的影响最大 D、受各组标志值和各组次数的共同影响 3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数(B)。 A、接近于变量值大的一方 B、接近于变量值小的一方 C、不受权数的影响 D、无法判断 4.权数对于算术平均数的影响,决定于(D)。 A、权数的经济意义 B、权数本身数值的大小 C、标志值的大小 D、权数对应的各组单位数占总体单位数的比重 5.各总体单位的标志值都不相同时(A)。 A、众数不存在 B、众数就是最小的变量值 C、众数是最大的变量值 D、众数是处于中间位置的变量值 6.凡是变量值的连乘积等于总比率或总速度的现象,要计算其平均比率或平均速度都可以采用( C )。 A、算术平均法 B、调和平均法 C、几何平均法 D、中位数法

统计学答案第八章

统计学答案第八章 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

三、选择题 1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的纤度的均值x=1.39,检验与原来设计的标准均值相比是否有所变化,要求的显着性水平为α=0.05,则下列正确的假设形式是()。 A.H 0:μ=1.40,H 1 :μ≠1.40 B. H :μ≤1.40,H 1 :μ>1.40 C. H 0:μ<1.40,H 1 :μ≥1.40 D. H :μ≥1.40,H 1 :μ<1.40 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。 A. H 0:π≤0.2,H 1 :π>0.2 B. H :π=0.2,H 1 :π≠0.2 C. H 0:π≥0.3,H 1 :π<0.3 D. H :π≥0.3,H 1 :π<0.3 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为32磅,则其原假设和备择假设是()。 A. H 0:μ≤8,H 1 :μ>8 B. H :μ≥8,H 1 :μ<8 C. H 0:μ≤7,H 1 :μ>7 D. H :μ≥7,H 1 :μ<7 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。

第八章方差分析与回归分析

第八章 方差分析与回归分析 一、教材说明 本章内容包括:方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归.主要讲述方差分析和一元线性回归两节内容. 1、教学目的与教学要求 (1)了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会解决简单的实际问题. (2)了解效应差的置信区间的求法,了解多重比较问题,掌握重复数相等与不相等场合的方法,会解决简单的实际问题. (3)熟练掌握Hartley 检验,Bartlett 检验以及修正的Bartlett 检验三种检验方法,会解决简单的实际问题. (4)理解变量间的两类关系,认识一元线性和非线性回归模型,熟悉回归系数的估计方法,熟练掌握回归方程的显著性检验.能用R 软件来进行回归分析,会解决简单的实际问题. 2、本章的重点与难点 本章的重点是平方和的分解,检验方法和参数估计、重复数相等与不相等场合的方法、检验方法的掌握,回归系数的估计方法,回归方程的显著性检验,难点是检验方法和参数估计,重复数相等与不相等场合的方法. 实际问题的检验,回归方程的显著性检验. 二、教学内容 本章共分方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归等5节来讲述本章的基本内容. §8.1 方差分析 教学目的:了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会 解决简单的实际问题. 教学重点:平方和的分解,检验方法和参数估计 教学难点:检验方法和参数估计 教学内容: 本节包括方差分析问题的提出,单因子方差分析的统计模型,平方和分解,检验方法,参数估计,重复数不等情形. 8.1.1 问题的提出 在实际工作中经常会遇到多个总体均值的比较问题,处理这类问题通常采用方差分析方法. 例8.1.1 8.1.2 单因子方差分析的统计模型 在例8.1.1中,我们只考察一个因子,称为单因子试验.记因子为A ,设其有r 个水平,记为1r A , ,A ,在每一水平下考察的指标可看做一个总体,故有r 个总体,假定 (1)每一总体均为正态总体,记为2 i i N(,)μσ,i 1,2,,r =; (2)各总体方差相同,即22 2212r σσσσ== ==

《统计学》-第五章-时间数列(补充例题)

第五章 动态数列 例1、“九五”时期我国国内生产总值资料如下: 单位:亿元 试计算“九五”时期我国国内生产总值和其中各产业的平均发展水平。 解:【分析】这是时期数列资料,可按简单算术平均数(n a ∑)计算平均发展水平。 计算结果如下: 国内生产总值平均发展水平78432.7亿元 其中:第一产业平均发展水平14258.3亿元;第二产业平均发展水平39100.1亿元;第三产业平均发展水平25074.2亿元。 例2、我国人口自然增长情况见下表: 单位:万人 试计算我国在“七五”时期年平均增加人口数量。 解:【分析】新增长人口是时期指标,故平均增加人口数量仍用n a a ∑= 计算。 年平均增加4.16965 1629 1678172617931656=++++== ∑n a a (万人) 例3、某商店2010年商品库存资料如下: 单位:万元 试计算第一季度、第二季度、上半年、下半年和全年的平均库存额。 解:这是一个等间隔时点数列,用“首末折半法”计算:

1 212 1121-++++=-n a a a a a n n (万元)第一季度平均库存额8.563 2485560263=+ ++= (万元)第二季度平均库存额443 2504043248=+ ++=(万元)第三季度平均库存额8.463 2454548250=+ ++=(万元)第四季度平均库存额8.573 2686057245=+ ++= (万元)上半年平均库存额4 .502 44 8.56=+= (万元)下半年平均库存额3 .522 8 .578.46=+= (万元) 全年平均库存额35.514 8 .578.46448.56=+++= 试计算2002年该企业平均工人数。 解:【分析】这是不等间隔时点数列,用间隔月数进行加权的公式计算平均工人数: 1 211 1232121)(21 )(21)(2 1---+++++++++=n n n n f f f f a a f a a f a a a 1 3322112412 4123241241432414408224083352233533012330326+++++?++?++?++?++?++?+= =385(人) 例5、某企业2002年各季度计划利润和利润计划完成程度的资料如下:

统计学答案第八章教学提纲

统计学答案第八章

三、选择题 1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的纤度的均值x=1.39,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为α=0.05,则下列正确的假设形式是()。 A.H0:μ=1.40,H1:μ≠1.40 B. H0:μ≤1.40,H1:μ>1.40 C. H0:μ<1.40,H1:μ≥1.40 D. H0:μ≥1.40,H1:μ<1.40 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。 A. H0:π≤0.2,H1:π>0.2 B. H0:π=0.2,H1:π≠0.2 C. H0:π≥0.3,H1:π<0.3 D. H0:π≥0.3,H1:π<0.3 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为32磅,则其原假设和备择假设是()。 A. H0:μ≤8,H1:μ>8 B. H0:μ≥8,H1:μ<8 C. H0:μ≤7,H1:μ>7 D. H0:μ≥7,H1:μ<7 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立

C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设 7 在假设检验中,第二类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时未拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 8 指出下列假设检验哪一个属于右侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0 :μ>μ0, H1:μ≤μ0 9 指出下列假设检验哪一个属于左侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0 , H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0:μ>μ0, H1:μ≤μ0 10 指出下列假设检验哪一个属于双侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0:μ>μ0, H1:μ≤μ0 11 指出下列假设检验形式的写法哪一个是错误的()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0 , H1:μ<μ0

统计学课后习题答案第五章指数

第五章指数 一﹑单项选择题 1.广义的指数是指反映 A.价格变动的相对数 B.物量变动的相对数 C.总体数量变动的相对数 D.各种动态相对数 2.狭义的指数是反映哪一总体数量综合变动的相对数 A.有限总体 B.无限总体 C.简单总体 D.复杂总体 3.指数按其反映对象范围不同,可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 4.指数按其所表明的经济指标性质不同可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 5.按指数对比基期不同,指数可分为 A.个体指数和总指数 B.定基指数和环比指数 C.简单指数和加权指数 D.动态指数和静态指数 6.下列指数中属于数量指标指数的是 A.商品价格指数 B.单位成本指数 C.劳动生产率指数 D.职工人数指数 7.下列指数中属于质量指标指数的是 A.产量指数 B.销售额指数 C.职工人数指数 D.劳动生产率指数 8.由两个总量指标对比所形成的指数是 A.个体指数 B.综合指数 C.总指数 D.平均指数 9.综合指数包括 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 10.总指数编制的两种基本形式是 A.个体指数和综合指数 B.综合指数和平均指数 C.数量指标指数和质量指标指数 D.固定构成指数和结构影响指数 11.数量指标指数和质量指标指数的划分依据是 A.指数化指标性质不同 B.所反映的对象范围不同 C.所比较的现象特征不同 D.指数编制的方法不同 12.编制综合指数最关键的问题是确定 A.指数化指标的性质 B.同度量因素及其时期 C.指数体系 D.个体指数和权数 13.编制数量指标指数的一般原则是采用下列哪一指标作为 同度量因素 A.基期的质量指标 B.报告期的质量指标 C.报告期的数量指标 D.基期的数量指标 14.编制质量指标指数的一般原则是采用下列哪一指标作为

相关文档
相关文档 最新文档