文档库 最新最全的文档下载
当前位置:文档库 › 第二章 抽样分布

第二章 抽样分布

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

第五章 抽样分布

第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、

1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

抽样技术课后习题_参考答案_金勇进.

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s

1706366666206*300 50000300 1500001)()?(222=- =-==s n f N y N v Y V 19.413081706366666(==)y v 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1* 96.1≤- 即n ≥862 欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(1 1)(=---= ∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为: ])()([2 ∧ ∧±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180

第 5 章 抽样调查及参数估计(练习题)

第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-

第5章 样本及抽样分布课后习题答案(高教出版社,浙江大学)

第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<x ,所以 (1) 联合概率密度为)()()()(),,,(43214321x f x f x f x f x x x x g = )(2432116x x x x e +++-=,(0,,,4321>X X X X ) (2)2 1,X X 的联合概率密度为) (2212x x e +-,所以 ????----== <<<<2 .17 .0221 5 .01215.02 .17 .021222121 2 1224}2.17.0,15.0{dx e dx e dx dx e X X P x x x x ))((4.24.121------=e e e e (3),21)(41)(41==∑=i i X E X E 16 1 2141)(161)(2 41=? ?? ???==∑=i i X D X D ; (4)4 1 )()()(2121==X E X E X X E ,(由独立性) ]4 1)()([21]41[21])5.0[()(])5.0([22 2222221221+-=+-= -=-X E X E X X E X E X E X X E 8 1]412141[21]4121)()([212 222=-??? ??+=+-+=X E X D ; (5)2 2 22 12122212141)()()(])[()(?? ? ??-=-=X E X E X X E X X E X X D 16 3161)4141)(4141(161)]()()][()([222121=-++=- ++=X E X D X E X D 。

第5章抽样与参数统计。分析

第五章抽样与参数估计 学习内容 一、抽样推断概述 二、抽样分布及其应用 三、常见的抽样分布 四、参数估计 五、区间估计的计算 学习目标 1. 了解抽样和抽样分布的基本概念。 2. 理解抽样分布与总体分布的关系。 3. 了解点估计的概念和估计量的优良标准。 4. 掌握总体均值、总体比例和总体方差的区间估计。 一、抽样推断概述 ①推断统计的内容 ②抽样推断的过程 统计推断的基本假定 a)总体看作是一个随机变量X,其概率分布为f(x)。 b)样本看作是n个独立的随机变量(X1, X2, …, X n),每个都具有与总体X相同的分布。 c)样本中每个个体必须取自同一总体, X1, X2, …, X n相互独立。

统计推断涉及的概念 参数与统计量 –参数:描述总体分布特征的量,如平均数μ,标准差σ。 –统计量:由样本观察值算出的量,如,S2,S。 –统计量是随机变量。 ③抽样分布及其形成过程 抽样分布(概念要点) 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布。 抽样分布是一种理论概率的分布。 抽样分布的结果来自容量相同的所有可能样本。 单选题 样本平均数和总体平均数() – A、前者是一个确定值,后者是随机变量 – B、前者是随机变量,后者是一个确定值 – C、两者都是随机变量 – D、两者都是确定值 ④抽样推断的理论基础 (1)大数定律 a)大数定律在统计中是指一切关于大量随机现象之平均结果稳定性的定理。 –尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋 于稳定。 b)为整个推断统计提供了最基本的理论依据。 猜硬币赌局 赌局1:–掷10次硬币,赌正面朝上的频率为0.4到0.6次。 赌局2:–掷100次硬币,赌正面朝上的频率0.4到0.6次。 赌局3:–掷1000次硬币,赌正面朝上的频率0.4到0.6次。

抽样技术第二章参考答案

第二章习题 判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y (千瓦时),=2 s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少 解:由已知可得,N=50000,n=300,5.9y =,2062=s 1706366666206*300 50000300 1500001)()?(22 2 =- =-==s n f N y N v Y V 19.413081706366666(==)y v

该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±*] 即为(,) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1* 96.1≤- 即n ≥862 欲使相对误差限不超过10%,则样本量至少应为862 某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0== N n f 又有:35.0)()(===∧p p E p E 0012.0)1(1 1)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[,] 研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n

抽样分布和样本分布

抽样分布和样本分布 导读:我根据大家的需要整理了一份关于《抽样分布和样本分布》的内容,具体内容:你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统... 你们知道各是什么吗?以下是有我为大家整理的,希望能帮到你。抽样分布: 从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 如果从容量为的有限总体抽样,若每次抽取容量为的样本,那么一共可以得到N取n的组合个样本(所有可能的样本个数)。抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。 样本分布: 总体是指考察的对象的全体,个体是总体中的每一个考察的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目样本分布是用来估计总体分布的。样本分布有区别于总体分布,它是从总体中按一定的分组标志选出来的部分样本容量。

实际中很多不确定现象都可以用随机变量描述,而应用中的一个十分重要的问题是找到随机变量的分布或其数字特征。例如:某进出口贸易公司进口了10万台微型计算器,按产品技术规定,使用寿命小于4000小时即为次品,且次品率大于1% 就不接受这批产品。如何得知这批产品的次品率呢?是否要测量每一台计算器呢?显然,这是不现实的,解决这个问题的好办法就是随机抽样,然后根据抽样检验得到的次品率来估计整批产品的次品率。也就是从10万台产品中按随机原则,抽取一部分(假如100件)产品组成一个样本,由样本(100件产品)次品率推断整批产品的次品率。 这里,我们把被观察对象的全体(本例中的10万台计算器)称作总体,把从总体中随机抽取的(被抽中的100台计算器)小群体称作样本,而样本中所包含的个体单位数目称为样本容量(100个)。 对于这批计算器,我们关心的是它的使用寿命(低于4000小时的比例有多少)的分布,设X表示"任一台计算器的使用寿命",它是一个随机变量,我们把随机抽中的100件产品看作是100个随机变量X1,X2......,X100,每一个计算器的使用寿命都是一个随机变量,一旦测试完毕,测试的结果就是100个观测值x1,x2,......x100, 统计抽样的任务就是根据测试结果x1,x2,......x100来估计总体X的分布情况。 我们作如下概括:设X是一个随机变量,X1,X2......,Xn是一组相互独立与X具有相同分布的随机变量,称X为总体,X1,X2......,Xn为来自总体的简单随机样本,简称样本,n为样本容量,称样本观察值为样本值,由于按随机原则取样,在试验之前,人们无法知道试验的结果,

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

样本及抽样分布

样本及抽样分布 §6.1 基本概念 一、总体: 在统计学中, 我们把所研究的全部元素组成的集合称作母体或总体, 总体中的每一个元素称为个体。 我们只研究感兴趣的某个或者几个指标(记为X),因此

把这些指标的分布称为总体的分布,记为X~F(x)。 二、样本: 设总体X具有分布函数 F(x),若X 1, X 2 ,…,X n 是具有分布 函数F(x)的相互独立的随机向量,则称其为总体F(或总体X )的简单随机样本, 简称样本, 它们的观察值x 1,x 2 , …, x n 称为样

本观察值, 又称为X 的n 个独立的观察值。 三、统计量: 设X 1, X 2, … , X n 是来自总体X 的一个样本, g (X 1, X 2, … , X n )是一个与总体分布中未知参数无关的样本的连续函数,则称g (X 1,X 2,… ,X n )为统计量。

统计量是样本的函数,它是一个随机变量,如果x 1, x 2, … , x n 是样本观察值, 则g (x 1, x 2, … , x n )是统计量g (X 1, X 2, … , X n )的一个观察值. 四、 常用的统计量:

, ,)(x 11s ,,x 1x 1. n 1 2 i 2n 1 i 称为样本方差均值仍称为样本 它们的观察值为∑∑==--==i i x n n . B ,, 1,2,X A ,1k 2.222 21S S n n B k ≈-====当样本容量很大时时当时当3.k k k k 若总体X 的k 阶矩E(X )存在, 则当n 时, A . P 注: n i i 1 11. X X ; n ==∑样本均值2 n 2 i i 1 12. S (X ); n-1X ==-∑样本方差n k k i 1 13. k A X , k 1, 2, ; n i ===∑样本阶原点矩n k i i 1 14. k B (X ) , k 2, 3, . n k X ==-=∑样本阶中心矩

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

抽样技术第二章参考答案

抽样技术第二章参考答案-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s

1706366666206*300 50000300 1500001)()?(222=- =-==s n f N y N v Y V 19.413081706366666(==)y v 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862 欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧ p p E p E 0012.0)1(1 1)(=---= ∧ p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为: ])()([2 ∧ ∧±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

样本及抽样分布讲解学习

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。

§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:

第二章抽样调查基本原理

第二章抽样调查基本原理 第一节有关基本概念 一、总体 总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。 在抽样以前,把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。 总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:总体总和、总体均值、总体比率、总体比例。 二、样本 样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n 维随机变量,属样本空间;抽样后,样本是一个n元数组,是样本空间的一个点。 抽样的效果好不好,依赖于样本对总体是否有充分的代表性。影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本容量的大小)。 (3)抽样方法。 一般将反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要的样本统计量有:样本总和、样本均值、样本比率、样本比例。 三、必要样本容量和样本可能数目 样本中包含的抽样单元个数称为样本容量。样本容量与总体容量之比为抽样比,用f 表示,即f=n/N。 样本可能数目则是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数。正确理解样本可能数目的概念,对于准确理解和把握抽样误差的计算、样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 四、抽样框 抽样框是在抽样前,为便于抽样工作的组织,在可能条件下编制的用来进行抽样的、记录或表明总体所有抽样单元的框架,在抽样框中,每个抽样单元都被编上号码。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),也可以是一段时序。 第二节样本统计量的抽样分布 标准的统计问题为:总体未知,故需从总体中抽取一个较小的、花费不多的随机样本,然后构造样本统计量,并以其估计总体。问题是用样本指标估计总体指标的可靠程度如何?为此要研究样本统计量的抽样分布。在此之前,有必要先回顾一下有关正态分布的知识。 一、正态分布 如果总体各个体的标志值以总体平均数为中心,形成钟型对称分布,其分布曲线向两侧扩展,逐渐向横轴逼近,无限延伸出去,但不接触横轴,则这种分布就叫做正态分布,或高斯分布、常态分布。服从正态分布的总体称为正态总体。 一个正态分布完全由总体的理论平均数和理论方差这两个参数所决定。其数学特征为:

相关文档