文档库 最新最全的文档下载
当前位置:文档库 › 统计学基础 第八章 相关与回归分析

统计学基础 第八章 相关与回归分析

统计学基础 第八章 相关与回归分析
统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析

【教学目的】

1.掌握相关系数的测定和性质

2.明确相关分析与回归分析的特点

3.建立回归直线方程,掌握估计标准误差的计算

【教学重点】

1.相关关系、相关分析和回归分析的概念

2.相关系数计算

3.回归方程的建立和依此进行估计和预测

【教学难点】

1.相关分析和回归分析的区别

2.相关系数的计算

3.回归系数的计算

4.估计标准误的计算

【教学时数】

教学学时为8课时

【教学内容参考】

第一节相关关系

一、相关关系的含义

宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。

相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。

在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。

二、相关关系的特点

1.现象之间确实存在数量上的依存关系

如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。

2.现象之间数量上的关系是不确定的

相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。

三、相关关系的种类

现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类:

(一)正相关与负相关

按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。

(二)单相关与复相关

按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

变量,如同时研究成本、市场供求状况、消费倾向对利润的影响时,这几个因素之间的关系是复相关。

(三)线性相关与非线性相关

按相关关系的表现形态分,可分为线性相关与非线性相关。线性相关是指在两个变量之间,当自变量x值发生变动时,因变量y值发生大致均等的变动,在相关图的分布上,近似地表现为直线形式。比如,商品销售额与销售量即为线性相关。非线性相关是指在两个变量之间,当自变量x值发生变动时,因变量y值发生不均等的变动,在相关图的分布上,表现为抛物线、双曲线、指数曲线等非直线形式。比如,从人的生命全过程来看,年龄与医疗费支出呈非线性相关。

(四)完全相关、不完全相关与不相关

按相关程度分,可分为完全相关、不完全相关和不相关。完全相关是指两个变量之间具有完全确定的关系,即因变量y值完全随自变量x值的变动而变动,它在相关图上表现为所有的观察点都落在同一条直线上,这时,相关关系就转化为函数关系。不相关是指两个变量之间不存在相关关系,即两个变量变动彼此互不影响。自变量x值变动时,因变量y值不随之作相应变动。比如,家庭收入多少与孩子多少之间不存在相关关系。不完全相关是指介于完全相关和不相关之间的一种相关关系。比如,农作物产量与播种面积之间的关系。不完全相关关系是统计研究的主要对象。

第二节相关分析

一、相关分析的主要内容

相关分析是指对客观现象的相互依存关系进行分析、研究,这种分析方法叫相关分析法。相关分析的目的在于研究相互关系的密切程度及其变化规律,以便作出判断,进行必要的预测和控制。相关分析的主要内容包括:

(一)确定现象之间有无相关关系

这是相关与回归分析的起点,只有存在相互依存关系,才有必要进行进一步的分析。

(二)确定相关关系的密切程度和方向

确定相关关系密切程度主要是通过绘制相关图表和计算相关系数。只有对达到一定密切程度的相关关系,才可配合具有一定意义的回归方程。

(三)确定相关关系的数学表达式

为确定现象之间变化上的一般关系,我们必须使用函数关系的数学公式作为相关关系的数学表达式。如果现象之间表现为直线相关,我们可采用配合直线方程的方法;如果现象之间表现为曲线相关,我们可采用配合曲线方程的方法。

(四)确定因变量估计值误差程度

使用配合直线或曲线的方法可以找到现象之间一般的变化关系,也就是自变量x变化时,因变量y将会发生多大的变化。根据得出的直线方程或曲线方程我们可以给出自变量的若干数值,球的因变量的若干个估计值。估计值与实际值是有出入的,确定因变量估计值误差大小的指标是估计标准误差。估计标准误差大,表明估计不太精确;估计标准误差小,表明估计较精确。

二、相关关系的测定

相关分析的主要方法有相关表、相关图和相关系数三种。现将这三种方法分述如下:

(一)相关表

在统计中,制作相关表或相关图,可以直观地判断现象之间大致存在的相关关系的方向、形式和密切程度。

在对现象总体中两种相关变量作相关分析,以研究其相互依存关系时,如果将实际调查取得的一系列成对变量值的资料顺序地排列在一张表格上,这张表格就是相关表。相关表仍然是统计表的一种。根据资料是否分组,相关表可以分为简单相关表和分组相关表。

1.简单相关表

简单相关表是资料未经分组的相关表,它是把自变量按从小到大的顺序并配合因变量一一对应平行排列起来的统计表。

【案例】

为研究分析产量(x)与单位产品成本(y)之间的关系,从30个同类型企业调查得到的原始资料并将产量按从小到大的顺序排列,可编制简单相关表,结果见表8-2所示。

表8-2 产量和单位产品成本原始资料

从表8-2中可以看出,随着产量的提高,单位产品成本却有相应降低的趋势,尽管在同样产量的情况下,单位产品成本存在差异,但是两者之间仍然存在一定的依存关系。

2.分组相关表

在大量观察的情况下,原始资料很多,运用简单相关表表示就很难使用。这时就要将原始资料进行分组,然后编制相关表,这种相关表称为分组相关表。分组相关表包括单变量分组相关表和双变量分组相关表两种。

(1)单变量分组表。在原始资料很多时,对自变量数值进行分组,而对应的因变量不分组,只计算其平均值,根据资料具体情况,自变量可以是单项式,也可以是组距式。 【案例】

以上例原始资料为例,将同类型30个企业的产量(x )与单位产品成本(

y )原始资料,按产量分组编制单变量分组表,结果见表8-3。

表8-3 产量和单位产品成本简单相关表 从表8-3中可以较明显地看出二者之间存在正相关关系。

(2)双变量分组表。对两种有关变量都进行分组,交叉排列,并列出两种变量各组间的共同次数,这种统计表称为双变量分组相关表。这种表格形似棋盘,故又称棋盘式相关表。 【案例】

仍以原始资料为例,将同类型30个企业的产量(x )与单位产品成本(y )原始资料,编制双变量分组相关表,结果见表8-4。

表8-4 产量和单位产品成本双变量分组相关表

从表8-4看出,产量集中在左上角到右下角的对角斜线上,表明产量与单位产品成本是负相关关系。

制作双变量分组相关表,须注意自变量为纵栏标题,按变量值从小到大自左向右排列,因变量为横行标题,按变量值从大到小自上而下排列。这样做的目的是将相关表与相关图结合起来,便于一致性判断相关关系的性质。

(二)相关图

相关图又称散点图。它是以直角坐标系的横轴代表自变量x,纵轴代表因变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。

相关图可以按未经分组的原始资料来编制,也可以按分组的资料,包括按单变量分组相关表和双变量分组相关表来编制。通过相关图将会发现,当y对x是函数关系时,所有的相关点都会分布在某一条线上;在相关关系的情况下,由于其他因素的影响,这些点并非处在一条线上,但所有相关点的分布也会显示出某种趋势。所以相关图会很直观地显示现象之间相关的方向和密切程度。

【案例】

以上例原始资料中编制的产量与单位产品成本单变量分组相关表为例,绘制相关图,结果见图8-1。

从图8-1中可以看出,单位产品成本随着产量增加而降低,并且散布点的分布近似地表现为一条直线。由此可以判断产量与单位产品成本两个变量之间存在着直线负相关关系。

(三)相关系数

相关表和相关图大体说明变量之间有无关系,但它们的相关关系的紧密程度却无法表达,因此,需运用数学解析方法,构建一个恰当的数学模型来显示相关关系及其密切程度。对现象之间的相关关系的紧密程度做出确切的数量说明,就需要计算相关系数。 1.相关系数的计算

相关系数是在直线相关条件下,说明两个现象之间关系密切程度的统计分析指标,记为γ。相关系数的计算公式为

()()

()()

∑∑∑∑----=

=2

22

111

y y n

x x n y y x x n

y

x xy

σσσγ

式中 n ——资料项数;

x ——x 变量的算术平均数;

y ——y 变量的算术平均数

x σ——x 变量的标准差; y σ——y 变量的标准差; xy σ——xy 变量的协方差。

在实际问题中,如果根据原始资料计算相关系数,可运用相关系数的简捷法计算,其计算公

式为

()

()

2

2

2

2

∑∑∑∑∑∑∑---=

y y n x x n y x xy n γ

【案例】

根据教材中表8-5中的资料,已知居民家庭月收入与消费支出之间为直线相关,计算居民家庭月收入与消费支出的相关系数(见表8-6)。 表8-3

99.0349

15571104652975110349

46521429102

2

=-??-??-?=

γ

2.相关系数的分析

明晰相关系数的性质是进行相关系数分析的前提。现将相关系数的性质总结如下: (1)相关系数的数值范围,是在-1和+1之间,即:-1≤γ≤1。

(2)计算结果,当γ>0时,表示x 与y 为正相关;当γ<0时,x 与y 为负相关。

(3)相关系数γ的绝对值越接近于1,表示相关关系越强;越接近于0,表示相关关系越弱。

如果|γ|=1,则表示两个现象完全直线相关。如果|γ|=0,则表示两个现象完全不相关(不是直线相关)。

(4)相关系数γ的绝对值在以下是无直线相关,以上是有直线相关,~是低度直线相关,~是显著相关,以上是高度相关。

【案例】

上例中计算的相关系数为,说明消费支出与居民家庭月收入呈高度正相关,也就是家庭收入越高,消费支出也越高。

第三节回归分析

一、回归分析的含义

就一般意义而言,相关分析包括回归和相关两方面内容,因为回归与相关都是研究两变量相互关系的分析方法。但就具体方法而言,回归分析和相关分析是有明显差别的。相关图表、相关系数能判定两变量之间相关的方向和密切程度,但不能指出两变量相互关系的具体表现形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析就是对具有相关关系的两个或两个以上变量的数量变化规律进行测定,确立一个相应的数学表达式,并进行估算和预测的一种统计方法。

回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明数量关系的具体表现形式,而回归分析则应该建立在相关分析的基础上。只有依靠相关分析,对现象的数量变化规律判明具有密切相关关系后,再进行回归分析,求其相关的具体表现形式,这样才具有实际意义。

回归分析建立的数学表达式称为回归方程(或回归模型)。回归方程为线性方程的,称为线性回归;回归方程为非线性方程的称为非线性回归。两个变量之间的回归称为一元回归(简单回归);三个或三个以上变量之间的回归称为多元回归。本章只介绍一元线性回归,即简单线性回归分析方法。

二、回归分析的主要内容

(一)建立相关关系的回归方程

利用回归分析方法,配合一个表明变量之间数量上相关的方程式,而且根据自变量x的变动,来预测因变量y的变动。

(二)测定因变量的估计值与实际值的误差程度

通过计算估计标准误差指标,可以反映因变量估计值的准确程度,从而将误差控制在一定范围内。

三、回归分析的特点

回归分析与相关分析比较具有以下特点:

1.在相关分析中,各变量都是随机变量;而回归分析中,因变量是随机变量,自变量不是随机的,而是给定的数值。

2.在相关分析中,各变量之间是对等关系,调换变量的位置,不影响计算的结果;而在回归分析中,自变量与因变量之间不是对等的关系,调换其位置,将得到不同的回归方程。因此,在进行回归分析时,必须根据研究目的,先确定哪一个是自变量,哪一个是因变量。

3.相关分析计算的相关系数是一个绝对值在0与1之间的抽象系数,其数值的大小反映变量之间相关关系的程度;而回归分析建立的回归方程反映的是变量之间的具体变动关系,不是抽象的系数。根据回归方程,利用自变量的给定值可以估计或推算出因变量的数值。

四、一元线性回归方程的拟合

回归分析中,最简单、最基本的形式就是一元线性回归,也就是通常所说的配合直线方程式的问题。若通过观察或实验,得到n 对数据()()()n n y x y x y x ,,,,221,1Λ的相关图上的散布点接近分布在一条直线上,就可以认为变量x 与y 之间存在着线性关系,可设经验公式为

bx a y

+=? 式中,a 与b 为待定参数,也就是需要根据实际资料求解的数值,a 为直线的截距,b 为直线的斜率,也称回归系数,表示自变量x 每变动一个单位时,因变量y 的平均变动量。b a 、值确定了直线的位置,b a 、一旦确定,这条直线就被惟一确定了。但用于描述这n 组数据的直线有许多条,究竟用哪条直线来代表两个变量之间的关系,需要一个明确的原则。我们希望选择距离各散布点最近的一条直线来代表x 与y 之间的关系,以便更好地反映变量之间的关系。根据这一思想确定未知参数b a 、的方法,称为最小二乘法,也就是通过使得()()2

2?∑

∑--=-=

bx a y y y Q 为最小值来确定b a 、的方法。可见,用最小二乘法得到的直线与所有数据()i i y x ,的离差平方和为最小。

要使Q 为最小值,就要用数学中对二元函数求极值的原理,求Q 关于a 和b 的偏导数,并令其等于0,整理得出直线回归方程中求解参数b a 、的标准方程组为

???+=+=∑

∑∑∑∑2

x b x a xy x

b na y 解方程组得

()()()

()∑∑∑∑∑∑∑--=

---=2

2

2

x x n y x xy n x x y y x x b 【案例】

根据表8-2中的数据,拟合某社区居民家庭月收入水平(x )与消费支出(y )的回归直线方程。

根据表8-3中的计算结果,得

6398.04652975110349

46521429102

=-??-?=

b 1493.510

4656398.010349=?-=a

将a 和b 代入回归方程式得

x y

6398.01493.5?+= y ?式中代表消费支出,x 代表家庭月收入。回归系数b=,表示家庭月收入每提高1个单位(百元),消费支出平均增加个单位(百元)。a=代表即使月收入为0的情况下,消费支出也需要(百元)。利用直线方程可以进行预测。如某家庭月收入为150(百元),在其他条件相对稳定时,可以预测其消费支出为

)(93.10111)(1193.1011506398.01493.5?元百元==?+=y

五、估计标准误差 (一)估计标准误差的意义

回归方程的一个重要作用在于根据自变量的已知值推算因变量的可能值y

?,这个可能值或称估计值、理论值、平均值,它和真正的实际值y 可能一致,也可能不一致,因而就产生了估计值

的代表性问题。当y

?值与y 值一致时,表明推断准确;当y ?值与y 值不一致时,表明推断不够准确。显而易见,将一系列y

?值与y 值加以比较,可以发现其中存在着一系列离差,有的是正差,

有的是负差,还有的为零。而回归方程的代表性如何,一般是通过计算估计标准误差指标来加以检验的。估计标准误差指标是用来说明回归方程代表性大小的统计分析指标,也简称为估计标准差或估计标准误差,其计算原理与标准差基本相同。估计标准误差说明理论值(回归直线)的代表性。若估计标准误差小,说明回归方程准确性高,代表性大;反之,估计不够准确,代表性小。 (二)估计标准误差的计算

估计标准误差,是指因变量实际值与理论值离差的平均数。其计算公式为

()2

?2

--=

n y y S yx

式中 yx S ——估计标准差,其下标yx 代表y 依x 而回归的方程;

y

?——根据回归方程推算出来的因变量的估计值; y ——因变量的实际值; n ——数据的项数。

估计标准误差的简化计算公式为

2

2

---=

∑∑∑n xy b y a y

S yx

【案例】

依据表8-6的资料,计算估计标准误差。

)(82.22

1021429

6398.03491493.5155712

2

元=-?-?-=

---=

∑∑∑n xy b y a y

S yx

(三)估计标准误差与相关系数的关系 二者在数量上具有如下的关系:

2

2

1y

yx

S σγ-

=

21γσ-=y yx S

式中 γ——相关系数;

y σ——因变量数列的标准差;

yx S ——估计标准误差。

从上面的计算公式中可以看出γ和yx S 的变化方向是相反的。当γ越大时,yx S 越小,这时相关密切程度较高,回归直线的代表性较大;当γ越小时,yx S 越大,这时相关密切程度较低,回归直线的代表性较小。

附录 应用Excel 进行相关与回归分析 单元实训 相关与回归分析在经济中的运用

【实训目的】

相关和回归分析是研究现象之间相关关系的一种定量分析方法。通过本实训的学习,目的是使学生熟悉相关与回归分析的基本原理及其应用,掌握相关与回归分析在实际运用中的技巧与方法。

【实训资料】

企业产品销售预测与分析

具体详尽资料参见本章单元实训 【实训要求】

1.上述两种产品销售量预测中分别采用了哪两种统计分析方法它们有何不同

2.在什么情况下可以使用上述两种统计分析方法进行市场预测 【实训形式】

综合实训资料,按照实训要求进行分组讨论。 【实训时间】

教学学时为1学时,在完成第八章的理论教学后进行。 【实训地点】 实训地点为机房。

项目实战

统计分析五 运用相关于回归分析法分析项目课题

【实战目的】

通过本项目实战训练,使学生掌握应用统计软件(EXCEL )操作手段将统计整理后的项目资料

运用相关与回归分析法对项目课题进行统计分析的技能。

【实战要求】

结合第8章相关与回归分析教学内容的学习,以项目小组为单位,将统计整理编制的统计表、或绘制的统计图,结合项目调查课题的任务与目的,运用相关与回归分析法对项目课题进行统计分析。

【实战资料】

通过“整理项目资料”实战训练,各项目小组已经得到本组项目课题的电子信息资料。现需要应用统计软件(Excel)操作功能,结合项目调查课题的任务与目的,运用相关于回归分析法对项目课题进行统计分析。

【实战学时】

需用2学时来完成“运用相关与回归分析法分析项目课题”的项目实战训练。

【实战地点】

在电子实训室完成“运用相关与回归分析法分析项目课题”的项目实战训练。

【实战操作步骤】

1.取得统计整理编制的统计表或绘制的统计图。

2.根据项目课题所要研究的目的与任务,选择可能具有相关关系的变量。

3.运用相关关系判定方法,判定变量之间相关关系的密切程度。

4.将具有高度相关关系的变量进行回归分析,拟合数学模型(本教材主要讲授了一元线性回归方程拟合模型),并进行统计分析预测。

【实战案例】

大学生生活费收支状况调查

相关与回归分析过程

编写调查报告

详细资料见教材。

统计学第五章课后题及答案解析

第五章 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学第一章练习题19785

第一题:单项选择题 1.同质性、大量性、差异性() A只有有限总体具有 B只有无限总体具有 C有限总体和无限总体都具有 D有限总体和无限总体都不具有 2.”统计”的基本含义是() A统计调查、统计整理、统计分析 B统计分析、统计推断、统计描述 C统计工作、统计资料、统计学 D统计分组、统计指标、统计分析 3.研究生招生目录中,201为英语、202为俄语、203为日语。这里语种属于() A定类数据 B定序数据 C定距数据 D定比数据 4.电视观众对收费频道是否应该插入广告的态度为不应该、应该、无所谓。这里“不应该、应该、无所谓”是() A定类数据 B定序数据 C定距数据 D定比数据 5.学生的智商等级是() A定类数据 B定序数据 C定距数据 D定比数据 6.下列表述正确的是() A定序数据包含定类数据和定距数据的全部数据 B定类数据包含定序数据的全部信息 C定序数据与定类数据是平行的 D定比数据包含了定类数据、定序数据和定距数据的全部信息 7.用部分数据去估计总体数据的理论和方法,属于() A理论统计学 B应用统计学 C描述统计学 D推断统计学 8.了解学生的学习情况,要调查足够多的学生,这个方法称为() A大量观察法 B统计分组法 C综合指标法 D相关分析法 9.了解居民的消费支出情况,则() A所有居民的消费支出额是总体单位 B所有居民是总体 C某个居民的消费支出额是总体

D所有居民是总体单位 10.统计学的数量性特点表现在它是() A一种纯数量的研究 B利用大量的数字资料建立数学模型 C在质与量的联系中来研究现象总体的数量特征 D以数学公式为基础的定量研究 11.统计学的总体性特点是指() A研究现象各个个体的数量特征 B研究由大量个别事物构成的现象整体的数量特征 C从认识总体入手开始研究现象的数量特征 D从现象量的研究开始来认识现象的性质和规律 12.统计研究中的大量观察法是指() A一种具体的调查研究方法 B对总体中的所有个体进行观察和研究的方法 C收集大量总体资料的方法 D要认识总体的数量特征就必须对全部或足够多个体进行观察和研究13.对全市工业企业职工的生活状况进行调查,调查对象是() A该市全部工业企业 B该市全部工业企业的职工 C该市每一个工业企业 D该市工业企业的每一个职业 14.某年全国汽车总产量是() A随机变量 B连续变量 C离散变量 D任意变量 15.要反映我国工业企业的整体业绩水平,总体单位是() A我国每一家工业企业 B我国所有工业企业 C我国工业企业总数 D我国工业企业的利润总额16.统计总体的特点是() A同质性、大量性、可比性 B同质性、大量性、差异性 C数量性、总体性、差异性 D数量性、综合性、同质性 第二题:多项选择题

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样 总体则是不确定的。(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。 (X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。(X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。(X ) 6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准 确程度的范围;两者既有区别,又有联系。( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。(V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。( V ) 10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。 (X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为 原来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误 差等于30。(X) 18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概 率保证程度。(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学第五版(贾俊平)第八章课后习题答案

《统计学》第八章课后练习题 8.4 解:由题意知,μ=100,α=0.05,n=9<30,故选用t统计量。经计算得:x =99.9778,s=1.2122, 进行检验的过程为: H0:μ=100 H1:μ≠100 t= s n = 1.21229 =?0.0549 当α= 0.05,自由度n-1= 8,查表得tα2(8)=2.3060,因为t< tα2,样本统计量落在接收域,所以接受原假设H0,即打包机正常工作。 用P值检测,这是双侧检验,故: P=2×1?0.5215=0.957,P值远远大于α,所以不能原假设H0。 8.7 解:由题意知,μ=225,α=0.05,n=16<30,故选用t统计量。 经计算得:x =241.5,s=98.7259, 进行检验的过程为: H0:μ≤225 H1:μ>225 t= s n = 98.725916 =0.6685 当α= 0.05,自由度n-1= 15,查表得tα(15)=2.1314,这是一个右单侧检验,因为t

即元件平均寿命没有显著大于225小时。 用P值检测,这是右单侧检验,故: P=1?0.743=0.257,P值远远大于α,所以不能拒绝原假设H0。 8.9, 解:由题意得 σA2=632,σB2=572,x A=1070,x B=1020,n A=81,n B=64,故选用z统计量。 进行检验的过程为: H0:μA?μB=0 H1: μA?μB≠0 Z=A B A B σA A +σB B = 632+572 =5 当α=0.05时,zα2=1.96,因为Z>zα2,所以拒绝原假设H0,,即A、B两厂生产的材料平均抗压强度不相同。 用P值检测,这是双侧检验,故: P=2×1?0.9999997=0.0000006,P值远远小于α,所以拒绝原假设H0, 8.13 解:建立假设为: H0: π1=π2 H1: π1≠π2 由题意得:

统计学基础_第五章_动态数列分析

统计学基础第五章动态数列分析 【教学目的】 1.区分不同种类的动态数列 2.熟练掌握计算平均发展水平的各种方法 3.掌握发展速度、增长速度的种类,运用它们之间的数量关系进行动态指标的相互推算 4.理解趋势的意义,运用长期趋势测定方法对长期趋势进行测定 5.计算季节比率,并且深刻理解季节比率的经济含义 【教学重点】 1.总量指标动态数列的种类和特点 2.动态比较指标和动态平均指标的计算 3.动态数列的分析方法 【教学难点】 1.绝对数时间数列中的时点数列平均指标的计算 2.相对数、平均数时间数列动态平均指标的计算 3.动态数列分析方法中的季节变动分析方法 【教学时数】 教学学时为12课时 【教学容参考】 第一节动态数列的意义和种类 一、动态数列的概念 将某一个统计指标在不同时间上的各个数值,按时间先后顺序排列,就形成了一个动态数列,也叫做时间数列。动态数列一般由两个基本要素构成:一是被研究现象所属的时间;二是反映该现象的统计指标数值。 通过编制和分析动态数列,首先可以从现象的量变过程中反映其发展变化的方向、程度和趋势,研究其质量变化的规律性。 其次,通过对动态数列资料的研究,可以对某些社会经济现象进行预测。 第三,利用动态数列,可以在不同地区或国家之间进行对比分析。 编制和分析动态数列具有非常重要的作用,这种方法已成为对社会经济现象进行统计分析的一种重要方法。 【案例】 下面图表列举了我国2004~2007年若干经济指标的动态数列。 表5-1 我国2004-2007年若干经济指标 二、动态数列的种类 按照构成动态数列的基本要素———统计指标的表现形式不同,动态数列可分为绝对数动态数列、相对数动态数列和平均数动态数列三种类型。其中绝对数动态数列是基本的数列,相对数和平均数动态数列是派生数列。

统计学第六章课后题及答案解析

第六章 一、单项选择题 1.下面的函数关系是( ) A现代化水平与劳动生产率 B圆周的长度决定于它的半径 C家庭的收入和消费的关系 D亩产量与施肥量 2.相关系数r的取值范围( ) A -∞< r <+∞ B -1≤r≤+1 C -1< r < +1 D 0≤r≤+1 3.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( ) A增加70元 B减少70元 C增加80元 D减少80元 4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( ) A +1 B -1 C 0.5 D 1 5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( ) A线性相关还是非线性相关 B正相关还是负相关 C完全相关还是不完全相关 D单相关还是复相关 6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程?=a+bx。经计算,方程为?=200—0.8x,该方程参数的计算( ) A a值是明显不对的 B b值是明显不对的 C a值和b值都是不对的 D a值和b值都是正确的 7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( ) A 8 B 0.32 C 2 D 12.5 8.进行相关分析,要求相关的两个变量( ) A都是随机的 B都不是随机的 C一个是随机的,一个不是随机的 D随机或不随机都可以 9.下列关系中,属于正相关关系的有( ) A合理限度内,施肥量和平均单产量之间的关系 B产品产量与单位产品成本之间的关系 C商品的流通费用与销售利润之间的关系

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

应用统计学试题和答案分析.

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学基础 第一章 统计概述

第一章统计概述 【教学目的】 1.明确统计的含义、方法及职能 2.能够灵活运用统计资料反映社会经济现象的数量方面 3.重点理解统计的基本概念及各概念之间的区别与联系 【教学重点】 1.能够运用统计资料反映社会经济现象的数量方面 2.重点理解统计的基本概念及各概念之间的区别与联系 【教学难点】 难点为理解统计的基本概念及各概念之间的区别与联系 【教学时数】 教学学时为4课时 【教学内容参考】 第一节统计的研究对象 一、统计的含义 【引言】 当我们跨入新世纪的时候,人们已经对这个时代的特征作了概括性的描述,这就是信息时代。面对来自方方面面的各种信息,我们只有利用统计这一工具,才能理解世界的精彩,了解世界宏微观的经济运行状况。为了管理好国家,搞好企业的生产经营,政府和企业都设立了专门的统计机构,或专门成立企业营销组织、营销策划等机构,由专门的统计人员或营销策划人员负责国民经济各行各业的信息搜集、整理、分析工作,为国家和企业进行各项决策提供可靠、及时的统计信息。 【案例】 据统计,2008年国内生产总值300670亿元,比上年增长9.0%。分产业看,第一产业增加值34000亿元,增长5.5%;第二产业增加值146183亿元,增长9.3%;第三产业增加值120487亿元,增长9.5%。第一产业增加值占国内生产总值的比重为11.3%,比上年上升0.2个百分点;第二产业增加值比重为48.6%,上升0.1个百分点;第三产业增加值比重为40.1%,下降0.3个百分点。年末全国就业人员77480万人,比上年末增加490万人。其中城镇就业人员30210万人,净增加860万人,新增加1113万人。年末城镇登记失业率为4.2%,比上年末上升0.2个百分点。这些都是统计信息的基本表现形式。 因此,我们将统计的含义概括为统计资料、统计工作和统计学。 反映社会经济现象情况和特征的数字及文字材料,称为统计资料; 对统计资料的搜集、整理、分析的工作总称,称为统计工作(或统计活动)。 统计过程包括统计设计、统计调查、统计整理与统计分析; 系统论述统计工作的学科,称为统计学。 三者之间的关系比较密切。统计资料是统计工作的成果,统计学与统计工作是理论与实践的辩证关系。了解和掌握统计学的基本理论和方法,是做好统计工作、取得有效统计资料的基础。 二、统计的研究对象 社会经济统计的研究对象是社会经济现象的总体数量方面,即以统计资料为依据具体说明社会经济现象总体的数量特征、数量关系及数量界限。下面举例说明如何根据统计资料说明社会经济现象的数量特征、数量关系及数量界限。 【案例】

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

统计学相关 典型相关分析

典型相关分析 在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对他进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的安装路径之中,调用方式如下: 文件——新建——语法 INCLUDE 'C:\Program Files\SPSSInc\PASWStatistics18\Samples\English\Canonical correlation.sps'. CANCORR SET1=体重腰围脉搏 /SET2=单杠仰卧起坐跳高. 复制后,点击“运行”——“全部”即可 1.Correlations for Set-1 Correlations for Set-2 首先给出的是两组变量内部各自的相关矩阵,可见生理指标之间具有相关性、训练指标之间也有相关性。 2.Correlations Between Set-1 and Set-2 接着给出的是两组变量间各变量的两两相关矩阵,可见生理指标与训练指标之间确实存在相关性。 3.Canonical Correlations 提取典型相关系数的大小,可见第一典型相关系数为0.796

4.Test that remaining correlations are zero 检验各典型相关系数有无统计学意义,可见第一典型相关系数有统计学意义,第二第三典型相关系数没有统计学意义(<0.1)。 5.Standardized Canonical Coefficients for Set-1 Raw Canonical Coefficients for Set-1 各典型变量与变量组1中各变量间标化与未标化的系数列表,由此我们可以写出典型变量的转换公式(标化的):U1=0.775x1-1.579x2+0.059x3 6.各典型变量与变量组2中各变量间标化与未标化的系数列表,同理可以写出 典型变量的转换公式:V1=0.349y1+1.054y2-0.716y3

统计学第五章 练习

第五章 一、填空题: 1、时间序列的构成要素包括 和 。 2、绝对数时间序列可以分为 和 两种,序列中不同时间数值相加有实际的意义的是 。 3、设i=1,2,…n , i a 为第i 期发展水平,则1a 称为 ,n a 称为 ,/i a 1 i a 是 , /i a 1a 是 。 4、计算间断时点序列平均发展水平,一般有两个假设条件:假设上期末水平 本期初水平,其二是假设现象在间断期内数量 变化。 5、时间序列的波动可以分解为 、 、循环变动和不规则变动。 6、报告期粮食总产量增加12%,粮食播种面积增加9%,则粮食每亩产量提高 。 二、单项选择题 1、时间序列与变量数列( )。 A 、都是根据时间顺序排列的 B 、都是根据变量值大小排列的 C 、前者根据时间顺序排列的,后者根据变量值大小排列的 D 、前者根据变量值大小排列的,后者根据时间顺序排列的 2、时间序列中,数值大小与时间长短有直接关系的是( )。 A 、时点序列 B 、时期序列 C 、平均数时间序列 D 、相对数序列 3.对时间数列进行动态比较分析和动态平均分析的基础指标是( )。 A 、发展水平 B 、发展速度 C 、平均发展水平 D 、平均发展速度 4、发展速度属于( )。 A 、比例相对数 B 、动态相对数 C 、比较相对数 D 、强度相对数 5、一个动态数列的多个环比增长速度分别为4%、6%、9%,该数列的定基增长速度为( )。 A 、4%×6%×9% B 、 104%×106%×109% C 、(4%×6%×9%)-1 D 、(104%×106%×109%)-1 6、 若各年环比增长速度保持不变,则各年的增长量( )。 A 、逐年增加 B 、逐年减少 C 、保持不变 D 、无法判断

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

《统计学基础》专阶段练习三第六章

《统计学基础》(专)阶段练习三(第五、六章) 一、填空题 1.动态数列按其指标表现形式的不同分为_______、_______和_______三种。 2.平均发展水平又称_______,它是从_______上说明现象总体在某一时期内发展的一般水平。 3.已知某产品产量2002年与2001年相比增长了5%,2003年于2001年相比增长了14%,则2003年与2002年相比增长了_______。 4.增长量是报告期水平与基期水平之差。由于所采用的基期不同,增长量可分为_______增长量和_______增长量,二者的关系可用公式_______表示。 5.发展速度根据所采用的基期不同,可分为_______发展速度和_______发展速度,这两种发展速度之间的关系为_______。 6.我国经济发展的战略目标是21世纪末国民生产总值比1980年翻两番,这就是说国民生产总值20年内增加_______倍。 7.使现象在一段较长的时间内沿着一个方向,逐渐向上或向下变动的趋势称为_______趋势;使现象发展周期比较长的涨落起伏的变动称为_______变动。 8.综合指数的编制方法是先_______后_______。 9.指数从其计算的总体范围来划分,可以分为_______和_______两种;指数按其所表明的现象性质的不同,分为_______指数和_______指数。 10.总指数的计算形式有_______指数和_______指数。 11.统计中,在经济上有联系、在数量上存在对等关系的三个或三个以上的指数称为_______。 12.编制数量指标指数时,一般以_______指标为同度量因素;编制质量指标指数时,一般以_______指标为同度量因素。 13.平均指数有两种计算形式:即_______指数和_______指数。 14.因素分析就是利用_______来分析社会经济现象变动中各种因素变动发生作用的影响程度。 15.某企业2003年的产量比前一年增长了10.5%,产品总成本增长了8%,则该企业2003年单位成本增减的百分比为_______。 二、单项选择题 1.某单位的营业收入如下:200万元,220万元,250万元,300万元,320万元,则平均增长量为( )。 A. 5120 B. 4120 C. 5200320 D. 4200320 2.报告期水平与某一固定时期水平之比的指标是( )。

统计学第八章题目

一.单项选择题 1、用于测定两个变量之间密切程度的方法是(D )。 A、定性判断 B、相关表 C、相关图 D、相关系数 2、产品产量与单位成本的相关系数是—,单位成本与利润率的相关系数是,产量与利润的相关系数是,因此(C)。 A、产量与利润的相关程度最高 B、单位成本与利润率的相关程度最高 C、产量与单位成本的相关程度最高 D、无法判断哪对变量的相关程度最高 3、相关系数的取值范围是(D )。 A、0≤r≤1 B、-1≤r≤0 C、r>0 D、-1≤r≤1 4、变量x与y之间的负相关是指(C )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少 C、x值增大时y值随之减少,或x值减少时y值随之增大 D、y的取值几乎不受x取值的影响 5、两个变量之间的相关关系称为( B )。 A、复相关 B、单相关 C、曲线相关 D、直线相关 6、、正方形的边长与周长的相关系数为(A )。 A、1 B、-1 C、0 D、无法计算 7、在一元线性回归方程中,回归系数b的含义是( B )。 A、当x=0时,y的平均值

B 、当x 变动一个单位时,y 的平均变动数额 C 、当x 变动一个单位时,y 增加的总数额 D 、当y 变动一个单位时,x 的平均变动数额 8、常用的求解一元线性回归方程的方法是( B )。 A 、相关系数法 B 、最小平方法 C 、误差绝对值最小法 D 、误差和最小法 9、下列回归方程与相关系数的对应式中,错误的是( C ) A 、89.0,5.2170?-=-=r x y B 、94.0,8.35?-=--=r x y C 、78.0,5.036?-=+=r x y D 、98.0,9.25?=+-=r x y 10、已知变量x 与y 线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则二者的相关系数的值为( B )。 A 、 B 、 C 、 D 、 11、已知变量x 与y 高度线性相关,x 与y 的协方差为-60,x 的方差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系数b 的值为( B )。 A 、 B 、 C 、 D 、 12、若相关系数为正值,则回归系数的值( B )。 A 、为负 B 、为正 C 、视a 的符号而定 D 、不能确定 13、回归估计标准误差是说明( C )的指标。 A 、平均数代表性 B 、现象之间相关程度 C 、回归直线代表性 D 、抽样误差平均程度

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样总 体则就是不确定的。( V ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。 ( X ) 3.在抽样推断中,作为推断的总体与作为观察对象的样本都就是确定的、唯一 的。(X ) 4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。( X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。( X ) 6.抽样平均误差就是表明抽样估计的准确度,抽样极限误差则就是表明抽样估 计准确程度的范围;两者既有区别,又有联系。 ( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。( V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。 ( V ) 10.抽样推断就是利用样本资料对总体的数量特征进行估计的一种统计分析方 法,因此不可避免的会产生误差,这种误差的大小就是不能进行控制的。 (X ) 11.重复抽样时,其她条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。(X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号就是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为原 来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度与总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0、9545,则抽样平均误差等 于30。(X) 18.抽样估计置信度就就是表明抽样指标与总体指标的误差不超过一定范围的 概率保证程度。(V ) 19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学答案第八章

统计学答案第八章. 三、选择题纤维的纤某厂生产的化纤纤度服从正态分布,1 根纤维的纤25.40。某天测得度的标准均值为1

度的均值=1.39,检验与原来设计的标准均值x比是否有所变化,要求的显著性水平为 α=0.05,则下列正确的假设形式是()。A.H:μ=1.40,H:μ≠1.40 B. H:μ001≤1.40,H:μ>1.40 1C. H:μ<1.40,H:μ≥1.40 D. H:010μ≥1.40,H:μ<1.40 1 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。

A. H:π≤0.2,H:π>0.2 B. H:π001=0.2,H:π≠0.2 1C. H:π≥0.3,H:π<0.3 D. H:π001≥0.3,H:π<0.3 1 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机位参加该项计划的样本,结果显示:样40抽 取.

32标准差为磅,则本的体重平均减少7磅,。其原假设和备择假设是()A. H:μ≤8,

H:μ>8 B. H:μ≥001 8,H:μ<8 1C. H:μ≤7,H:μ>7 D. H:μ≥0107,H:μ<7 1 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的

5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设

062统计学第六章

统计学原理第六章课后习题 09工管二班 1.变异指标的概念和意义概念:综合反映总体各单位标志值变异程度的指标。简称变异指标。它显示总体中变量数值分布的离散趋势,是说明总体特征的另一个重要指标,与平均数的作用相辅相成 意义:标志变动度可用来反映平均数代表现象一般水平的代表性程度,标志变动度愈小,则平均 数的代表性愈大。它可以说明现象的稳定性和均衡性。它和平均指标结合应用还可以比较不同总体标志值的相对差异程度。常用标志变动度指标有全距、四分位差、平均差、标准差等。 2,常用的变异度指标是什么? 全距:指总体各单位标志值中最大值与最小值之差。 四分位差:四分位数中间两个分位数之差。 平均差:指各 总体各单位标志值对其算术平均数的离差绝对值的算术平均数。 标准差:指总体各单位标志值对其算术平均数离差平方和的算术平均数的平方根。 方差:即标准差的平方。 变异系数:是各种变异度指标与其算术平均数对比得到的相对数。(又称标志变动度 或者离散系数) 3什么是标准差?如何计算标准差?答:标准差是指总体各单位标注值对其算术平均数离差平方 的算术平均数的平方根,通常以σ表示。根据标准差的概念,计算标准差的时候,首先计算各标志值对其算术平均数的离差,然后求其离差平方,再求离差平方的算术平均数,得出方差,在求其平方根就是标准差。 标准差 4.什么是总方差.组间方差和组内方差?三者之间又什么联系? 总体标志差是总体各单位标志值和其算术平均数之间的平均离散程度的方差.称为总方差. 组距数列中,反应各组平均数(组中值)与总体平均数之间的平均离散程度的方差.称为组间方差. 组间数列中.反映各组内部的标准值间的差异程度的方差称为组内方差 他们的关系为 总方差=组内方差平均数+组间方差 5 . 答:标准差系数是标准差与算术平均数对比的比值; 因为标准差反映平均指标代表性高低,而标准差系数是反映总体各单位标志值编译的相对程度,一个是绝对量一个是相对量。所以还需要标准差系数; () n x x ∑-= 2 σ

生物统计学 第九章 多元统计分析

第九章多元统计分析简介 多元统计分析主要研究多个变量之间的关系以及具有这些变量的个体之间的关系。无论是自然科学还是社会科学,无论是理论研究还是应用决策,多元统计分析都有较广泛的应用。近年来,随着计算机的普及和广泛应用,多元统计分析的应用越来越广泛,越来越深入。生物学研究中,有许多问题要考虑样本与样本之间的关系、性状与性状之间的关系,也要考虑样本与性状之间的关系,为了能够正确处理这些错综复杂的关系,就需要借助于多元统计分析方法来解决这些问题。 从应用的观点看,多元统计分析就是要研究多个变量之间的关系,但哪些问题才是多元统计的内容,并无严格的界限。一般认为,典型的多元统计分析主要可以归结为两类问题:第一类是决定某一样本的归属问题:根据某样品的多个性状(特征)判定其所属的总体。如判别分析、聚类分析即属于此类内容。第二类问题是设法降低变量维数,同时将变量变为独立变量,以便更好地说明多变量之间的关系。主成分分析、因子分析和典型相关分析均属于此类问题。此外,多因素方差分析、多元回归与多元相关分析和时间序列分析,均是研究一个变量和多个变量之间的关系的,也是多元统计分析的内容。 第一节聚类分析(Cluster Analysis) 聚类分析是研究分类问题的一种多元统计方法,聚类分析方法比较粗糙,但由于这种方法能解决许多实际问题,应用比较方便,因此越来越受到人们的重视。近年来聚类分析发展较快,内容也越来越多。常见的有系统聚类、模糊聚类、灰色聚类、信息聚类、图论聚类、动态聚类、最优分割、概率聚类等方法,本节重点介绍系统聚类法。 系统聚类法是目前应用较多的聚类分析方法,这种聚类方法从一批样本的多个观测指标(变量)中,找出能度量样本之间相似程度的统计数,构成一个相似矩阵,在此基础上计算出样本(或变量)之间或样本组合之间的相似程度或距离,按相似程度或距离大小将样本(或变量)逐一归类,关系密切的归类聚集到一个小分类单位,关系疏远的聚集到一个大的分类单位,直到把所有样本(或变量)都聚集完毕,形成一个亲疏关系谱系图,直观地显示分类对象的差异和联系。 第二节判别分析(Discriminant Analysis) 判别分析是多元统计分析中较为成熟的一类分类方法,它是根据两个或多个总体的观测结果,按照一定的判别准则和相应的判别函数,来判断某一样本属于哪一类总体。判别分析的内容很多,常见的有距离判别、贝叶斯判别、费歇判别、逐步判别、序贯判别等方法。 第三节主成分分析(Principal components analysis)

相关文档
相关文档 最新文档