文档库 最新最全的文档下载
当前位置:文档库 › 第四章 数字特征

第四章 数字特征

第四章 数字特征
第四章 数字特征

第四章 数字特征

前面讨论了随机变量的概率分布,它完整地描述了随机变量的概率性质,而数字特征则是由概率分布所决定的常数,它刻划了随机变量的某一方面的性质。在许多实际问题中,分布往往不易求得或不需求得,而只需了解某些数字特征,而数字特征往往容易通过数理统计的方法得到。

§1 数学期望

对于一个随机变量ξ,有时希望知道ξ的取值集中在哪里,即要确定

ξ的平均值。由于其取值是随机的,如1.0)1(==ξP ,9.0)2(==ξP ,1和2的算术平均值1.5并不能真实体现ξ取值的平均水平,这是由于ξ取1与取2的概率不等所致,实际上ξ取2比取1的概率大得多。因此,要真正体现ξ取值的平均,不能用简单算术平均方法来确定,还应考虑到

它取各不同值的概率大小,即采用概率权方法,用数学期望来表示随机变量ξ的平均值。

一、离散型随机变量的数学期望

例1 有甲、乙两射手,他们的射击技术如下表:

问哪一个射手水平较高?

解 假定各射N 枪,则他们打中的环数约为

甲:N N N N 3.96.0101.093.08=?+?+? 乙:N N N N 1.93.0105.092.08=?+?+?

平均起来每枪甲得9.3环,乙得9.1环,因此甲的水平高些。

定义 设离散型随机变量ξ的概率分布为

{}i i p x P ==ξ, ,2,1=i

则称

ξE =i i

i p x ∑

为ξ的数学期望。考虑到ξE 的存在和唯一性,要求级数i

i

i

p x ∑绝对收

敛,即

+∞

i

p x

例2 面额为1元的彩票共发行1万张,其中可得奖金1000元、

20元、5元的彩票分别有2张、50张和500张。若某人购买1张彩票,则他获奖金额ξ的数学期望ξE 为多少? 解 ξ

则 55.005.05005.0200002.01000=?+?+?=ξE

数学期望在经济管理中经常用到,特别是在决策问题中。

例3 假定有一个商业企业面临着是否扩大经营问题,根据现有

资料估计,如果未来的市场繁荣而现在就进行扩展经营,则一年内可以获利328(万元);如果未来市场萧条,则将损失80(万元)。如果这个企业等待下一年再扩展,在市场繁荣的情况下,将获利160(万元),而在市场萧条的情况下,则仅能获利16(万元)。现在的问题是,这个企业的领导人将怎样作出决策?

解 首先要对未来市场作出适当估计。假定企业领导人认为未来市场萧条较之市场繁荣是2对1之比,即市场萧条和繁荣的概率分别为3/2和3/1,因此,如果立即扩展,则利润的期望值是

563

2

)80(31328=?-+?(万元)

如果他决定下一年再扩展,则利润的期望值为

643

2

1631160=?+?(万元)

按此计算结果,自然应当以采取推迟扩展的决策为有利。 如果领导人对未来市场的估计不是2:1,而是3:2,那么,他立即扩展所期望的利润为

2.835

3

)80(52328=?-+?(万元)

而推迟扩展所期望的利润为

6.735

3

1652160=?+?(万元)

按此计算结果,则立即扩展较为有利。 二、连续型随机变量的数学期望

定义 设连续型随机变量ξ的概率密度为)(x f ,如果积分

?

+∞

-dx x xf )(绝对收敛,则称该积分为ξ的数学期望,记为ξE ,即

ξE =?+∞

∞-dx x xf )(。

例4 设随机变量ξ的概率密度函数为

???=03)(2x x f 其它10<

求ξ的数学期望。 解 ?∞

∞-=

=dx x xf E )(ξ4

331

2=

??

dx x x 三、随机变量的函数的数学期望

定理 设随机变量η是随机变量ξ的函数)(ξηg =,这里g 是连续函数,那么

(1)若ξ是离散型随机变量,且其概率分布为{}i i p x P ==ξ, ,2,1=i ,则

∑==i i i p x g g E E )())((ξη;

(2)若ξ是连续型随机变量,且其概率密度为)(x f ,则

?+∞

-==dx x f x g g E E )()())((ξη

例5

求)13(+ξE ,2ξE 。

解 14.043.012.021.05)13()13(=?+?+?-?-=+=+∑i i p x E ξ

2ξE =14.013.002.011.042

=?+?+?+?=∑i i p x

例6 设随机变量ξ的概率密度为拉普拉斯分布

x

e x

f -=2

1)(,∞<<∞-x

求ξE ,2ξE

解 ?+∞∞-=dx x xf E )(ξ?∞+∞--?=dx e x x 21?∞+-=021dx xe x ?∞

-+021dx xe x

?∞+--=021x xde ?∞

-+0

21x xde 0=

2ξE ?+∞∞-=dx x f x )(2221022=?=?=??∞+-∞+∞--dx e x dx e x x x

四、数学期望的性质

性质1 c c E =)(,其中c 是常数。

证 常数c 可看作单点分布的随机变量,由数学期望的定义得

c c c E =?=1)(

性质2 ξξaE a E =)(

性质3 b E b E +=+ξξ)(

综合性质2和性质3,有 b aE b a E +=+ξξ)(。 性质4 ηξηξE E E +=+)(

推广:设n ξξξ,,,21 是n 个随机变量,则有

∑∑===n

i i i n i i i E k k E 1

1

)(ξξ

例如,∑∑===n i i n i i E E 1

1)(ξξ,∑∑===n

i i n

i i E n n E 111)1(ξξ。

性质5 设ξ与η是两个相互独立的随机变量,则有 ηξξηE E E ?=)(

这些性质的证明略去。

§2 方差

随机变量ξ的数学期望,描述了随机变量ξ取值的集中趋势或平均水平,但是仅仅知道ξ的数学期望有时还不能完全刻划随机变量ξ的统计特征。比如,某厂生产一批元件,平均使用寿命ξE =1000小时,仅由此我们还很难了解这批元件质量的好坏,因为有可能有一半的元件质量很高,

寿命在1500小时以上,而另一半却质量很差,寿命不足500小时,从而反映出质量不稳定。可见应进一步考察元件寿命ξ对期望ξE 的偏离程度。下面介绍的方差就是用来描述随机变量的可能取值与其期望之间的差异程度的数量特征。

一、方差的定义

如果随机变量ξ的数学期望ξE 存在,称ξξE -为随机变量ξ的离差。由于0)(=-=-ξξξξE E E E ,离差有正有负,为了消除离差符号的影响和数学上便于处理,用2)(ξξE -来衡量ξ与ξE 的偏差。 定义 设ξ是随机变量,数学期望ξE 存在,并且2)(ξξE E -也存在,称2)(ξξE E -为ξ的方差,记作ξD ,即

ξD =2)(ξξE E -

ξD 称为ξ的标准差。

据此定义,若ξ是离散型随机变量,其概率分布为{}i i p x P ==ξ,

,2,1=i ,则

i i i p E x D 2)(ξξ-=∑ ;

若ξ为连续型随机变量,其概率密度为)(x f ,则

ξD =?+∞

--dx x f E x )()(2ξ

从方差的定义我们可以看出,ξ的方差ξD 实际上是随机变量

2)(ξξE -的期望,因此ξD ≥0。当随机变量的可能取值以很大的概率

集中在数学期望附近时,方差较小,否则方差较大。因此,方差的大小可以反映随机变量分布的分散程度。

利用数学期望的性质,有

])(2[)(2

2

2

ξξξξξξξE E E E E D +?-=-= 2

2

2

2

)()(2ξξξξξξE E E E E E -=+?-=

于是我们得到了计算方差的一个重要公式

ξD 22)(ξξE E -=

例 设ξ表示机床A 一天生产的产品废品数,η表示机床B 一天

问:B A ,两机床哪台质量好?设两台机床的日产量相等。 解 8.01.031.023.015.00=?+?+?+?=ξE 8.01.032.021.016.00=?+?+?+?=ηE

ηξE E =,因此两台机床平均每天生产废品数都是0.8件,仅此不能作出判断,为此再计算ξD 与ηD 。

6.11.091.043.015.002=?+?+?+?=ξE 8.11.092.041.016.002=?+?+?+?=ηE ξD 96.08.06.1)(222=-=-=ξξE E 16.18.08.1)(222=-=-=ηηηE E D

由于ηξD D <,因此机床A 的波动较机床B 的波动小,质量较稳定。

二、方差的性质

性质1 设c 是常数,则0)(=c D

证 0)()()(2

2

=-=-=c c E Ec c E c D

性质2 ξξD k k D 2)(=

证 [][]2

2

)()()(ξξξξξE k E k E k E k D -=-=

ξξξD k E E k 2

22)(=-=

性质3 ξξD c D =+)(

证 []2

)()(c E c E c D +-+=+ξξξ

ξξξD E E =-=2

)(

性质4 设ξ和η是两个相互独立的随机变量,则ηξηξD D D +=+)(

证 []2)()(ηξηξηξ+-+=+E E D []2

)()(ηηξξE E E -+-=

[]

))((2)()(22ηηξξηηξξE E E E E --+-+-= []))((2)()(22ηηξξηηξξE E E E E E E --+-+-= ηξηξξηηξD D E E E D D +=-++=])([2

推广:设1ξ,2ξ,…,n ξ是n 个相互独立的随机变量,则有

∑∑===n

i i i

n

i i i D k k D 1

21

)(ξξ,特别,∑∑===n

i i n

i i D D 1

1

)(ξξ。

§3 几种重要分布的数字特征

一、离散型随机变量

1. 两点分布

设随机变量ξ

(10<

则 ξE =p p q =?+?10,p p q E =?+?=102ξ, ∴ pq p p E E D =-=-=222)(ξξξ。 2. 二项分布

设随机变量),(~p n B ξ,即分布列为

k

n k k n q p C k P -==)(ξ ),,2,1,0(n k =(p q -=1)

则 =ξE ∑=n

k k 0k

n k k n q p C -∑=-=n k k n k n k 1

)!(!!k n k q p -

∑=---=n

k k n k n np 1)!()!1()!

1()1(11----k n k q p (令1-=k i )

np q p np q p i n i n np n n i i n i =+=---=--=--∑11

01)()!1(!)!

1(

∑=-=n k k

n k k n q p C k E 022ξ∑=-=n

k k n k n k 1

2)!(!!k n k q p -

∑==n

k k np 1)!()!1()!

1(k n k n ---k n k q p --1

k

n k n k q p k n k n k np --=---???-=∑11

)!()!1()!1()1(]

∑=-----+n

k k n k q p k n k n 11)!()!1()!1(

∑-=---=1

0)!

1(!)!

1(n i i n i n i np i n i q p --1np +

[]1)1(+-=p n np

故 npq np p np np E E D =-+-=-=2

2

2

)()1()(ξξξ 3. 普阿松分布

设随机变量)(~λξp ,即分布列为

λλξ-=

=e k k P k

!

)(,)0(>λ, ,2,1,0=k

ξE =∑∞

=0

k k

λ

λ-e

k k

!

=--=1

)!

1(k k

e

k λ

λλλλλ==-∞

=∑

e i i i

!

2

ξE ∑∞

=-=02

!

k k

e

k k

λ

λ∑∞

=---=1

1

)!

1(k k e k k

λλλ λ=∑∞

=-1

)

1([k k λ

λ---e

k k )!

1(1

])!

1(1

1

∞=---+k k e k λλ

λλλλ+=+=2)1(

故 λλλλξξξ=-+=-=2

222)(E E D

4. 几何分布

设ξ的分布列为 p q k P k ?==-1

)(ξ, ,2,1=k

由无穷级数知识知,x

x

k k

-=

∑∞

=11

,1

2

1

1)1(1

x kx k k -=

∑∞

=-,1

21

1

1)1(1p q kq k k =-=∑∞

=- ∴ p q p kq p E k k 1

)1(12

1

1=-?==∑∞

=-ξ 对(*)再逐项求导,3

2

2

)1(2)1(x x k k k k -=-∑∞

=-,1

2

2

)1(2)1(q q k k k k -=-∑∞

=-, ∴ []∑∑∞

=-∞

=-+-==1

11

1

22

)1(k k k k p q k k k p q

k E ξ

2

31

121

21)1(2)1(p p

q p qp q p kq p q

k k k k k k +=+?-=

+-=∑∑∞

=-∞

=- ∴ 2

222212)(p q

p p p q E E D =-+=-=ξξξ

二、连续型随机变量

1. 均匀分布

设随机变量[]b a U ,~ξ,其概率密度函数为

?

?

?-=0)

/(1)(a b x f 其它b x a ≤≤ 则?∞∞-=dx x xf E )(ξ?-?=b a dx a b x 122122b

a a

b a b +=-?-=

2

ξE =dx x f x )(2?∞∞-?-=b a dx a b x

123133a b a b -?-=322a ab b ++= ∴ 2

2)(ξξξE E D -=-++=

3

22a ab b 2)2(a b +12)(2a b -= 2. 指数分布

设随机变量)(~λξE ,其概率密度函数为

??

?=-0

)(x

e x

f λλ其它

0≥x (0>λ)

则 ξE ?

+∞

-=

dx x xf )(?+∞

-?=0dx e x x λλ

??+∞

-∞+-+∞-+-=-=0

dx e xe xde x x

x λλλλ

λ

λ1

1

=

-

=∞+-x

e

2ξE ?+∞∞

-=dx x f x )(2?+∞

-?=0

2dx e x x λλ

2

20

22

2λλλλ=

?+-=-=?

?

+-∞+-∞

+-dx e x e x de x x x

x

222

2

2

1)1(2

)(λ

λλξξξ=-=-=E E D

3.正态分布

设随机变量),(~2

σμξN ,其概率密度函数为

2

22)(21)(σμσπ--

=

x e

x f ∞<<∞-x

则 ?

+∞

-=

dx x xf E )(ξdx xe

x ?∞

---

=

2

22)(21

σμσ

π (令

t x =-σ

μ

π

21=

?

+∞

-+) (μσt dt

e

t 2

2-π

σ2=

?

+∞

--dt te

t 2

2

?

+∞

-+π

μ21dt e t 2

2-

上式右边第一项,其被积函数为奇函数,且积分区间关于原点对称,因此

其值为0,第二项中被积函数是标准正态分布)1,

0(N 的概率密度函数,其积分为1,因此有 ξE =μ。

ξD =2)(ξξE E -?+∞

--=2

)(μx σ

π212

22)(σμ--

x e

dx (令

t x =-σ

μ

?∞

+∞

--

=

dt e

t t 2

2

2

2

σ

π

σ

22

=

?

+∞

-t 222

2t d e

t - π

σ

22

-

=?

+∞

--2

2t tde ∞+∞

--

-

=22

2

2t te

π

σ

πσ

22

+

dt e

t ?

--

2

22σ=

在这里,我们看到正态分布的两个参数μ和2

σ都有明确的概率意义,它们分别是ξ的数学期望和方差。

几种常用的随机变量的数学期望与方差

例 设随机变量ξ~),(p n B ,已知2=ξE ,8.1=ξD ,试求p 和n ,并写出ξ的概率分布。

解 2==np E ξ, 8.1==npq D ξ 解方程组得

9.0=q ,1.0=p ,20=n

所以

)(k P =ξk n k k n p p C --=)1(k n k k

C -=)9.0()1.0(20,

20,,1,0 =k

§4 矩

下面简单介绍一下比数学期望和方差更广一类的数字特征——矩,它们在概率论和数理统计中有许多应用,这里,我们仅限于介绍最常用的两种矩的概念。 1.原点矩

对于正整数k ,如果+∞

E ξ

,称

k k E v ξ=, ,2,1=k

为随机变量ξ的k 阶原点矩。

容易看出ξE v =1,即随机变量ξ的一阶原点矩就是ξ的数学期望。 2.中心矩

对于正整数k ,如果+∞<-k

E E )(ξξ,称

k k E E )(ξξμ-=, ,2,1=k

为随机变量ξ的k 阶中心矩。

显然,ξμμD ==21,0,即随机变量ξ的二阶中心矩就是ξ的方差。

§5 随机向量的数字特征

一、随机向量的数学期望

对随机向量),(ηξ,每个分量有各自的期望,下面给出),(ηξ的某个函数),(ηξg 的数学期望)],([ηξg E 的计算方法。

若),(ηξ是离散型随机向量,其联合分布为

ij j i p y x P ===),(ηξ, ,2,1,=j i

∑∑=i

j ij j i p y x g g E ),()],([ηξ

若),(ηξ是连续型随机向量,其联合密度函数为),(y x f ,则

?

?

+∞∞-+∞

-=dxdy y x f y x g g E ),(),()],([ηξ

二、随机向量的协方差和相关系数

对随机向量来说,除了研究每个分量的数学期望和方差以外,还希望知道分量之间的相关程度,因此引进协方差和相关系数这两个概念。

定义 称()()[]ηηξξE E E --为ξ和η的协方差,记为),cov(

ηξ。 计算公式:=),cov(

ηξηξξηE E E ?-)( 协方差的性质

1. 对称性:=),cov(

ηξ),cov(ξη; 2. 线性性:),cov(

),cov(ηξηξab b a =, =+),cov(21ηξξ),cov(),cov(21ηξηξ+

3. 若ξ和η相互独立,则0),cov(

=ηξ(因为ηξξηE E E )(=); 4. ),cov(

2)(ηξηξηξ±+=±D D D , 证 2)]([)(ηξηξηξ

±-±=±E E D 2)]()[(ηηξξE E E -±-=

))((2)()(22ηηξξηηξξE E E E E E E --±-+-= ),cov(2ηξηξ±+=D D

因此,若ξ与η独立,则ηξηξD D D +=±)(;

定义 称η

ξηξD D )

,cov(为ξ与η的相关系数,记作ξηρ。

我们把ξξξξD E -=*和ηη

ηηD E -=*称为ηξ,的标准化随机变量,

可以验证,0==**ηξE E ,1==*

*ηξD D 。标准化随机变量消除了量纲的影响,因此它可用来刻划随机变量ξ与η之间的相关性。事

实上,*ξ与*

η的协方差即为ξ与η的相关系数,即

=

**),cov(ηξη

ξηξD D )

,cov(

相关系数的性质: 性质1 1≤ξηρ

证 ),cov(2)(******±+=±ηξηξηξD D D 022≥±=ξηρ

? 即11≤≤

-ξηρ,故得ξηρ≤1。 定义 如果0=ξηρ,称ξ与η不相关。

下列事实彼此等价:

(1)ξ与η不相关(即0=ξηρ);

(2)0),cov(

=ηξ; (3)ηξξηE E E ?=)(; (4)ηξηξD D D +=±)(。

性质2 若ξ与η相互独立,则ξ与η不相关。

证 由协方差性质3可得。

注意:该性质的逆命题不成立,即ξ与η不相关时,不一定相互独立。

例 设),(ηξ服从单位圆内的均匀分布,即联合密度为

???≤+=其它

, 01

, 1/),(22y x y x f π

边际密度为

π

π

ξ2

11121

),()(2

2

x dy dy y x f x f x x -=

==?

?

---∞

+∞

-,1≤x

π

η2

12)(y y f -=

,1≤y

故 012)(1

1

2

=-?

=

?

ξx x E (奇函数),同理 0)(=ηE ,

而 0cos sin 1

1

)(1

320

1

22===

??

??≤+dr r d xydxdy E y x π

θθθππ

ξη

∴ 0),cov(

=ηξ,即ξ与η不相关; 但 )()(),(y f x f y x f ?≠,即ξ与η不独立。

事实上,ξηρ只是描述了ξ与η的线性相关程度,ξηρ越大,表

明ξ与η的线性关系的程度越密切,当1=ξηρ时,ξ与η则成为完

全的线性关系;而ξηρ越小,表明ξ与η的线性关系的程度越小,当

0=ξηρ时,ξ与η已完全没有线性关系,但并不排除ξ与η有其它

的非线性关系。

不过,在正态分布的场合,独立性与不相关性是一致的。

性质3 若ξηb a +=,则1=ξηρ

证 ξξηbE a b a E E +=+=)(,ξξηD b b a D D 2)(=+=,

2)()(ξξξξξηbE aE b a E E +=+=,

∴ ==

ηξηξρξηD D ),cov(η

ξη

ξξηD D E E E )(- ξ

ξξξξξD b D bE a E bE aE 2

2)

(+-+=

()[]

??

?<->==?-=0

10

1 22b b b b b D E E b ξξξ 三、随机向量的协方差矩阵和相关系数矩阵

),(ηξ的协方差矩阵:???? ?

?=ηξηηξξ

D D C ),cov(),cov( ),(ηξ的相关系数矩阵:????

??=11ηξξηρρR 例1 设离散型随机向量),(ηξ的联合分布为

试求),cov(

ηξ和ξηρ,并写出协方差矩阵和相关系数矩阵。 解 1.1)3.04.0(2)1.02.0()1(=+?++?-=ξE

1.3)3.04.0(2)1.0

2.0()1(222=+?++?-=ξE ∴ 89.11.11.3)(222=-=-=ξξξE E D =ηE 4.0)

3.01.0(1)

4.02.0(0=+?++? =2ηE 4.0)3.01.0(1)4.02.0(022=+?++?

∴ 24.04.04.0)(222=-=-=ηηηE E D

)(ξηE =()

ij i

j

j i p y x ∑∑5.03.024.001.0)1(2.00=?+?+?-+?=

∴ 协方差 06.04.01.15.0)(),cov(

=?-=?-=ηξξηηξE E E 相关系数089.024.089.106

.0),cov(=?==ηξηξρξηD D

协方差矩阵为 ???

? ??=24.006.006.089.1C ,

相关系数矩阵为

???? ?

?=1089.0089.01

R 。 例2 设随机向量),(ηξ的联合密度为

??

?≤≤≤≤+=其它 ,

0 2

0 ,20 , )(),(y x y x A y x f 求:(1)系数A ;(2)ηξηξD D E E ,,,;

(3)),cov(ηξ;(4)ξηρ。 解(1)18)44()22()(2

2

2

==+=+=+???A A dx x A dy y x A dx

? 8/1=A

(2)边际密度

)1(41

)(81)(20+=+=?x dy y x x f ξ,20≤≤x

)1(41

)(+=y y f η,20≤≤y

∴ 67)1(4120=+?=?dx x x E ξ,同理,6

7

=ηE

35)1(412022=+?=?dx x x E ξ,∴ 3611=ξD ,同理,36

11

=ηD

(3)3

4

)382(81)(81)(2022020=+=+?=???dx x x dy y x xy dx E ξη

∴ 36

1

6734)(),cov(

2

-=??? ??-=?-=ηξξηηξE E E (4)111

3611361),cov(-=-==η

ξηξρξηD D

大数据的4V特征

大数据的4V特征 近几年很多领域都在讨论如何发展和运用大数据,那么什么是大数据?大数据的特征是什么?好多人不怎么了解,下文对这些方面进行简单的阐述。 (一)大数据(Big Data) 大数据是指那些超过传统数据库系统处理能力的数据。它的数据规模和转输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据中的价值,我们必须选择另一种方式来处理它。数据中隐藏着有价值的模式和信息,在以往需要相当的时间和成本才能提取这些信息。如沃尔玛或谷歌这类领先企业都要付高昂的代价才能从大数据中挖掘信息。而当今的各种资源,如硬件、云架构和开源软件使得大数据的处理更为方便和廉价。即使是在车库中创业的公司也可以用较低的价格租用云服务时间了。对于企业组织来讲,大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能揭示隐藏其中的信息。例如零售业中对门店销售、地理和社会信息的分析能提升对客户的理解。对大数据的二次开发则是那些成功的网络公司的长项。例如Facebook通过结合大量用户信息,定制出高度个性化的用户体验,并创造出一种新的广告模式。这种通过大数据创造出新产品和服务的商业行为并非巧合,谷歌、雅虎、亚马逊和Facebook它们都是大数据时代的创新者。 (二)大数据的4V特征 大量化(V olume):企业面临着数据量的大规模增长。例如,IDC最近的报告预测称,到2020年,全球数据量将扩大50倍。目前,大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。简而言之,存储1PB数据将需要两万台配备50GB硬盘的个人电脑。此外,各种意想不到的来源都能产生数据。 多样化(Variety):一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。然而,数据多样性的增加主要是由于新型多结构数据,以及包括网络日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。其中,部分传感器安装在火车、汽车和飞机上,每个传感器都增加了数据的多样性。 快速化(Velocity):高速描述的是数据被创建和移动的速度。在高速网络时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。根据IMS Research关于数据创建速度的调查,据预测,到2020年全球将拥有220亿部互联网连接设备。 价值化(Value):大量的不相关信息,浪里淘沙却又弥足珍贵。对未来趋势与模式的可预测分析,深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等) 蚁坊软件在舆情大数据处理中注重大量化、多样化、快速化、价值化,凭借自身的大数据平台为客户提供舆情应用服务,其中鹰击提供微博舆情监测分析服务,正是基于这四个维度,其舆情“早发现”的能力显著领先竞争对手,为舆情早报告、早响应提供先机;而蚁坊软件旗下的另外一款典型产品,则是从多样性(全网)、快速性方面独有优势——鹰眼提供全网舆情监测分析服务,方便客户“速读网”,掌控舆情发展态势。

样本的数字特征估计总体的数字特征练习题

限时练 093 一、选择题 1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是 ( ) A .85,85,85 B .87,85,86 C .87,85,85 D .87,85,90 2.(2015·乐清高一检测)某台机床加工的1000只产品中次品数的频率分布如下表: 次品数 0 1 2 3 4 频率 则次品数的众数、平均数依次为 ( ) A .0, B .0,1 C .4,1 D .,2 3.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示: 甲 乙 丙 丁 平均环数x 方差s 2 A .甲 B .乙 C .丙 D .丁 4.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为 ( ) A .6 C .66 D . 5.(2015三门峡高一检测)若样本1+x 1,1+x 2,1+x 3,…,1+x n 的平均数是10,方差为2,则对于样本2+x 1,2+x 2,…,2+x n ,下列结论正确的是 ( ) A .平均数是10,方差为2 B .平均数是11,方差为3 C .平均数是11,方差为2 D .平均数是10,方差为3 6.(2013·重庆)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8 7.(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分, 7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( ) A .1169 B .367 C .36 D .67 7

用样本的数字特征估计总体的数字特征(教案)

2.2.2 用样本的数字特征估计总体的数字特征 一、教学目标 1.能从样本数据中提取基本的数字特征,并做出合理的解释. 2.会求样本的众数、中位数、平均数. 3.能从频率分布直方图中,求得众数、中位数、平均数. 二、教学重难点 重点:根据实际问题,对样本数据提取基本的数字特征并做出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性. 难点:在频率分布直方图中分析众数、中位数、平均数. 三、众数、中位数、平均数的概念 1.众数的概念 一组数据中重复出现次数_____的数叫做这组数的众数 2.中位数的定义 把一组数据按大小顺序排列,把处于_____位置的那个数称为这组数据的中位数; 当数据个数为奇数时,中位数是按大小顺序排列的____的那个数; 当数据个数为偶数时,中位数是按大小顺序排列的最中间两个数的_________。 3.平均数的概念 如果有n 个数12,,,n x x x ,那么这n 个数的算术平均数就是这组数平均数,即 例1:在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下: 甲运动员:7,8,6,8,6,5,8,10,7,4 乙运动员:9,5,7,8,7,6,8,6,7,7 观察上述样本数据,分别求这些运动员成绩的众数,中位数与平均数? 甲运动员命中环数: 众数: 中位数: 平均数: 78686581074 6.9 10x +++++++++= = 乙运动员命中环数: 众数: 中位数:

平均数: 9578768677 7 10x +++++++++= = 例2、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 分别求这些运动员成绩的众数,中位数与平均数 . 众数(最多的): ;中位数(最中间的): 平均数 : 四、众数、中位数、平均数与频率分布直方图的关系 思考1:如何从频率分布直方图中估计出众数的值? 例3:在上一节调查的100位居民的月均用水量的问题中,这些样本数据的频率分布直方图如下所示:观察图形,估计出众数的 思考2:如何从频率分布直方图中估计出中位数的值? 在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数 反映到频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。 所以,中位数在频率分布直方图中,就是使其左右小矩形面积和相等 思考3:如何从频率分布直方图中估计出平均数的值?

北师大版高中数学必修三§4 数据的数字特征

§4 数据的数字特征 4.1 平均数、中位数、众数、极差、方差 4.2标准差 双基达标(限时20分钟) 1.已知一组数据20,30,40,50,50,60,70,80,其中平均数、中位数和众数的大小关系是( ).A.平均数>中位数>众数

B.平均数<中位数<众数 C.中位数<众数<平均数 D.众数=中位数=平均数 解析中位数、平均数、众数都是50,从中看出一组数据的中位数、众数、平均数可以相同. 答案 D 2.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是( ).A.81.2,4.4 B.78.8,4.4 C.81.2,84.4 D.78.8,75.6 解析由题意得原来数据的平均数是80+1.2=81.2,方差为4.4. 答案 A 3.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值为( ) A.150.2克B.149.8克 C.149.4克D.147.8克 解析这车苹果单个重量的平均值为 x-=150+152+…+147 10 =149.8(克).故选B. 答案 B 4.已知数据a,a,b,c,d,b,c,c,且a

数学:《用样本的数字特征估计总体的数字特征》教案 (北师大版必修3)

1.6用样本的数字特征估计总体的数字特征2 一、教学目标: 1、知识与技能:(1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差。(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释。(3)会用样本的基本数字特征估计总体的基本数字特征。(4)形成对数据处理过程进行初步评价的意识。 2、过程与方法:在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观:会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系。 二、重点与难点 重点:用样本平均数和标准差估计总体的平均数与标准差。难点:能应用相关知识解决简单的实际问题。 三、教学方法:探究归纳,思考交流 四、教学过程 (一)、创设情境 在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员:7,8,6,8,6,5,8,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。——用样本的数字特征估计总体的数字特征(板出课题)。(二)、探究新知 <一>、众数、中位数、平均数 〖探究〗:P62(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论) 初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息。例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见课本第62页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少。

(完整版)用样本的数字特征估计总体的数字特征(高考题)

2.2.2用样本的数字特征估计总体的数字特征 链接高考 1.(2014课标Ⅰ,18,12分,★★☆)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8 (1)作出这些数据的频率分布直方图; (2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定? 2.(2014陕西,9,5分,★★☆)某公司10位员工的月工资(单位:元)为x1,x2, (x10) 其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为() A.,s2+1002 B.+100,s2+1002 C.,s2 D.+100,s2

3. (2015广东,17,12分,★★☆)某城市100户居民的月平均用电量(单位:度),以 [160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图 . (1)求直方图中x 的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 4. (2014课标Ⅱ节选,19,★★☆)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下: 甲部门 乙部门 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 59 0448 122456677789 011234688 00113449 123345

用样本的数字特征

安徽铜都双语学校高效课堂数学登山型创感学道班级:高二()姓名编号 3206 日期: 2015-10-20 等级认定:主备校长: 课题:用样本的数字特征估计总体的数字特征(一)设计者: 高二数学组展示课(时段:正课时间: 60 分钟) 学习主题:1、能根据实际问题选择样本,从样本数据中提取基本的数字特征;2、正确理解样本数据标准差的意义和作用,学会计算数据的标准差。 【主题定向·五环导学·当堂反馈】 课堂 结构 课程结构 自研自探合作探究展示表现总结归纳 自学指导 (内容·学法·时间) 互动策略 (内容·形式·时间) 展示方案 (内容·方式·时间) 随堂笔记 (成果记录·知识生成·同步演练) 概念认知【学法指导】 ※思考:为了研究总体数据的数字特征,我们能 否利用样本数据的数字特征进行估计? ※初中有哪些数可以估计总体数据特征? ※频率分布直方图能否呈现样本数据? ※结合图2.2-5,如何通过频率分布直方图估计 众数? ※中位数如何通过直方图估计,样本数据中并没 有2.02,为什么? ※同理:平均数又该如何利于频率直方图估计? ☆☆☆☆☆ 标准差: 自研教材P74、75页内容,归纳用样本数据求标 准差的步骤 标准差如何刻画样本数据的离散程度,它的取值 范围是多少? 自研例1,体会如何不同数据如何利于标准差刻 画其分散程度 (15分钟) 师友对子 (4分钟) 迅速找到自己的 师友小对子,对 自学指导内容进 行交流 ☆以上部分为概 念认知 十人共同体 (10分钟) 课研长就本 组学情将本组分 为两组: A组(5人) 就展示方案进行 解读,分解,进 行板书预展 B组(5人) 就双基再次进行 巩固性学习,相 互检测,对不明 白的地方标注, 展示过程中作为 质疑 检测性展示 (4分钟) 导师就师友对子成 果进行双基反馈性 检效展示 以抽查形式展开 主题性展示 标准差 1.呈现案例、探究 评价方法 2.展示求标准差的 基本步骤 3.分析标准差如何 刻画数据的离散程 度,值为0的样本 数据有何特征 4.展示例题解题思 路 (15分钟) 【重点识记】 小练笔 关于平均数、中位数、众数的下 列说法中正确一个是() A.中位数可以准确的反映出总体 的情况 B.平均数数可以准确的反映出总 体的情况 C.众数数可以准确的反映出总体 的情况 D.平均数、中位数、众数都有局 限性,都不能准确的反映出总体 的情况 等级评定 同类演练同类演练(17分钟) 用1分钟时间自主研读下列题目,并在作答区解答: 课本P79页练习题第2题 解答区:

1.4《数据的数字特征》教学案

§1.4《数据的数字特征》教学案 一、教学背景分析 在义务教育阶段,学生已经通过实例,学习了平均数、中位数、众数、极差、方差等,并能解决简单的实际问题。(由于义务教育阶段《大纲》中对统计部分的要求与《标准》的要求相差较大,若是承接现行《大纲》的话,建议先补充《标准》中第三学段相应部分的内容。)在这个基础上高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征。 二、教学目标 1、能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息,培养学生解决问题的能力。 2、通过实例理解数据标准差的意义和作用,学会计算数据的标准差,提高学生的运算能力。 三、教学重、难点 教学重点:平均数、中位数、众数、极差、方差、标准差的计算、意义和作用。 教学难点:根据问题的需要选择适当的数字特征来表达数据的信息。 四、设计思路 (1)、教法构想 本节教学设计依据课程标准,在义务教育阶段的基础上,进一步掌握平均数、中位数、众数、极差、方差、标准差的计算、意义和作用。通过具体的实例,让学生理解数字特征的意义,并能选择适当的数字特征来表达数据的信息。 (2)学法指导 学生自主探究,交流合作,教师归纳总结相结合。 五、教学实施 导入新课 提出问题:小明开设了一个生产玩具的小工厂,管理人员由小明、他的弟弟和六个亲戚组成。工作人员由五个领工和十个工人组成。工厂经营的很顺利,需增加一个新工人,小亮需要一份工作,应征而来与小明交谈。小明说:“我们这里报酬不错,平均薪金是每周3 00元。你在学徒期每周75元,不过很快就可以加工资了。”小亮工作几天后找到小明说:“你欺骗了我,我已经找其他工人核对过了,没有一个人的工资超过每周100元,平均工资怎么可能是一周300元呢?”小名说:“小亮啊,不要激动,平均工资是300元,你看,这是一张工资表。”工资表如下:

教学参考高一北师大数学必修3同步作业:第1章 第4节 数据的数字特征3 含答案

数据的数字特征同步练习思路导引 1.在8个试验点对两个早稻品种进行栽培对比试验,它们在各试验点的单位面积产量如下(单位:kg): 甲402 492 495 409 460 420 456 501 乙428 466 465 428 436 455 449 459 在这些试验点中哪种水稻的产量比较稳定? 解:比较甲、乙两组数据标准差的大小.S甲=37.5,S乙=14.7.S 乙

教案数据的数字特征

教案数据的数字特征 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】

课时教案4 课题:数据的数字特征 一、教学分析 在初中阶段,学生已经学习了平均数、中位数、众数、极差、方差与标准差等概念,它们都是一些统计量,反映了数据的集中趋势与离散程度。在这个基础上高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征。 二、教学建议 1、本节开始,可结合上一节茎叶图的相关内容,让学生计算初中已经学习过的统计量,让学生复习初中学习的统计量的内容,并能在这个过程中体会用不同的统计量刻画数据集中趋势的不同。 2、在选择适当的数来分别表示这两组数据的离散程度时,学生会很自然地想到义务教育阶段时学习过的极差和方差。在教学时,可以先让学生自主思考,选择适当的数来表示,在此基础上,再鼓励他们积极交流,并认真观察、比较不同刻画方式之间的异同。 3、作为本节的结束,可安排教材的“动手实践”活动,让学生经历收集数据、整理数据、分析数据、作出推断的过程,进一步体会统计对决策的作用。 三、教学目标 1、知识与技能 (1)能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息。 (2)通过实例理解数据标准差的意义和作用,学会计算数据的标准差。

2、过程与方法 在分析和解决具体实际问题的过程中,学会用恰当的统计量表示数据的方法,并能结合统计量对所给数据的分布情况作出合理的解释。2 3、情感态度价值观 通过对现实生活和其他学科中统计问题的分析和解决,体会用数学知识解决现实生活及各学科问题的方法,认识数学的重要性。 四、教学重点、难点 教学重点:理解各个统计量的意义和作用,学会计算数据的标准差。 教学难点: 根据给定的数据,合理地选择统计量表示数据。 (一)课题引入 数据的信息除了通过前面介绍的各种统计图表来加以整理和表达之外,还可以通过一些统计量来表述,也就是将多个数据“加工”为一个数值,使这个数值能够反映这组数据的某些重要的整体特征。 (二)探求新知 请大家思考,初中时我们学习了几个统计量它们在刻画数据时,各有什么样的优点和缺点请大家结合下面问题的解决,对这个问题进行思考。 1、平均数、中位数、众数 某公司的33名职工的月工资(单位:元)如下: (1)求该公司职工月工资的平均数、中位数、众数; (2)假设副董事长的工资从5000元提升到20000元,董事长的工资从

《2.2.2用样本的数字特征估计总体的数字特征》教学案2

《2.2.2用样本的数字特征估计总体的数字特征》教学案2 一、教材分析 教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计. 教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用. 二、教学目标 1、知识与技能 (1)正确理解样本数据标准差的意义和作用,学会计算数据的标准差. (2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. (3)会用样本的基本数字特征估计总体的基本数字特征. (4)形成对数据处理过程进行初步评价的意识. 2、过程与方法 在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法. 3、情感态度与价值观 会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系. 三、重点难点 教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.

教案《数据的数字特征》

课时教案4 课题:数据的数字特征 一、教学分析 在初中阶段,学生已经学习了平均数、中位数、众数、极差、方差与标准差等概念,它们都是一些统计量,反映了数据的集中趋势与离散程度。在这个基础上高中阶段还将进一步学习标准差,并在学习中不断地体会它们各自的特点,在具体的问题中根据情况有针对性地选择一些合适的数字特征。 二、教学建议 1、本节开始,可结合上一节茎叶图的相关内容,让学生计算初中已经学习过的统计量,让学生复习初中学习的统计量的内容,并能在这个过程中体会用不同的统计量刻画数据集中趋势的不同。 2、在选择适当的数来分别表示这两组数据的离散程度时,学生会很自然地想到义务教育阶段时学习过的极差和方差。在教学时,可以先让学生自主思考,选择适当的数来表示,在此基础上,再鼓励他们积极交流,并认真观察、比较不同刻画方式之间的异同。 3、作为本节的结束,可安排教材的“动手实践”活动,让学生经历收集数据、整理数据、分析数据、作出推断的过程,进一步体会统计对决策的作用。 三、教学目标 1、知识与技能 (1)能结合具体情境理解不同数字特征的意义,并能根据问题的需要选择适当的数字特征来表达数据的信息。 (2)通过实例理解数据标准差的意义和作用,学会计算数据的标准差。 2、过程与方法 在分析和解决具体实际问题的过程中,学会用恰当的统计量表示数据的方法,并能结合统计量对所给数据的分布情况作出合理的解释。2 3、情感态度价值观 通过对现实生活和其他学科中统计问题的分析和解决,体会用数学知识解决现实生活及各学科问题的方法,认识数学的重要性。

四、教学重点、难点 教学重点:理解各个统计量的意义和作用,学会计算数据的标准差。 教学难点: 根据给定的数据,合理地选择统计量表示数据。 (一)课题引入 数据的信息除了通过前面介绍的各种统计图表来加以整理和表达之外,还可以通过一些统计量来表述,也就是将多个数据“加工”为一个数值,使这个数值能够反映这组数据的某些重要的整体特征。 (二)探求新知 请大家思考,初中时我们学习了几个统计量?它们在刻画数据时,各有什么样的优点和缺点?请大家结合下面问题的解决,对这个问题进行思考。 1、平均数、中位数、众数 某公司的33名职工的月工资(单位:元)如下: (1)求该公司职工月工资的平均数、中位数、众数; (2)假设副董事长的工资从5000元提升到20000元,董事长的工资从 5500元提升到30000元,那么新的平均数、中位数、众数又是什么? (3)你认为哪个统计量更能反映这个公司员工的工资水平?为什么? (4)公司经理会选取上面哪个数据来代表该公司员工的月工资情况? 税务官呢?工会领导呢? 通过这个问题的解决,我们应该认识到,各个不同的统计量适用于刻画不同的统计数据,并且有着各自的特点。 平均数:一般地,对于N 个数N x x x ,,,21 ,我们把 N x x x N +++ 21叫做这 N 个数的算术平均数,简称平均数。平均数是数据的重心,它是反映数据集中 趋势的一项指标。它的优点在于:对变量的每一个观察值都加以利用,比起众数与中位数,它会获得更多的信息;但是平均数对个别的极端值敏感,当数据有极端值时,最好不要用均值刻画数据。 众数:一组数据中出现次数最多的数据。众数着眼于对各数据出现的次数的

数据的数字特征

§4 数据的数字特征 【自主探讨学习】 【自主归纳】 1、平均数:一组数据的和与这组数据的个数的商,数据 , , ……,的平均数 = n x x x n +++ 21 2、中位数:一组数据按从小到大的顺序排成一列,处于中间位置的数成为这组数据的中位数。若个数为偶数,中位数为位于中间的数的平均数,若个数为奇数,位于中间的数为中位数。 3、(1)众数:一组数据中出现次数最多的数为这组数据的众数。 (2)众数特征:一组数据中的众数可能不止一个,也可能没有。反应该数据的集中趋势 4、极差 一组数据的最大值与最小值的差成为这组数据的极差,表示该组数据之间的差异情况。 5、标准差:样本数据到平均数的一种平均距离。 S= n x x x x x x n 2 2 22 1) ()()( -++-+- 6、方差,即标准差的平方 = 【问题研讨】 疑点一:中位数,众数和平均数的作用及区别 ①中位数,众数及平均数都是描述一组数据集中趋势的量 ②平均是的大小与一组数据里的每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动。 ③众数考察各数出现的频率,其大小与这组数据中部分数据又关,当一组数据中有不少数据重复出现时,其众数往往能反映问题。 ④中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不再所给数据中,当一组数据中个别数据较大时,可用中位数描述其中集中趋势。 【问题研讨】: 1、已知一组数据为10,20,80,40,30,90,50,40,50,40.这组数据的众数是40,中位数是40 平均数是_____。 2、某鞋厂为了了解中学生穿鞋的鞋号情况,对某中学初二某班的20名男生所穿鞋号的统计如右表: 那么这20名男生鞋号数据的平均数是24.55,中位数是24.5,众数是25,在平均数、中位

《用样本的数字特征估计总体的数字特征》教案

《用样本的数字特征估计总体的数字特征》教案 教学目标 1.能从样本数据中提取基本的数字特征,并做出合理的解释. 2.会求样本的众数、中位数、平均数. 3.能从频率分布直方图中,求得众数、中位数、平均数. 教学重难点 教学重点:用样本众数,中位数,平均数估计总体的众数,中位数,平均数.. 教学难点:用样本的数字特征估计总体的数字特征,统计思维的建立. 教学过程 情境导学 美国NBA 在2011——2012年度赛季中,甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30, 36,36,37,39,44,49;乙运动员得分:8,13,14,16,23,26, 28,38,39,51,31,39.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就应有相应的数据作为比较依据,即通过样本数字特征对总体的数字特征进行研究.所以今天我们开始学习用样本的数字特征估计总体的数字特征. 探究点一 众数、中位数和平均数 问题 在初中我们学过众数、中位数和平均数的概念,它们都是描述一组数据的集中趋势的特征数,只是描述的角度不同,你还能回忆起众数、中位数和平均数的定义及特点吗? 思考1 众数是如何定义的?有什么特点?举例加以说明. 答 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.特点:(1)众数是这组数据中出现次数最多的数;(2)众数可以有一个或多个; 如:一组数据为2,2,3,4,4,5,5,6,7,8;众数为2,4,5. 思考2 中位数是如何定义的?有什么特点?举例加以说明. 答 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 特点:(1)排序后找中位数;(2)中位数只有一个;(3)中位数不一定是这组数据中的数. 如:一组数据为2,2,3,4,4,5,5,6,7,8;中位数为1 2 (4+5)=4.5.

(完整版)用样本的数字特征估计总体的数字特征

2.2.2用样本的数字特征估计总体的数字特征 (两课时) 零号作业 一、众数、中位数、平均数 1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数. (2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势 [破疑点] 众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征. (3)在直方图中为最高矩形下端中点的横坐标 2、中位数: (1)定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数. (2)特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等. [破疑点] 中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点. (3) 直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半 3、平均数:(1)定义:一组数据的和与这组数据的个数的商.数据x 1,x 2,…,x n 的平均数为x n = x 1+x 2+…+x n n (2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平.任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低. (3) 直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 二、标准差、方差 1、标准差 (1)定义:标准差是样本数据到平均数的一种平均距离,一般用s 表示,通常用以下公式来计算 s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]可以用计算器或计算机计算标准差. (2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_ 小. 2.方差 (1)定义:标准差的平方, 即s 2 =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小. (3)取值范围:[0,+∞) 3、数据组x 1,x 2,…,x n 的平均数为x ,方差为s 2,标准差为s ,则数据组ax 1+b ,ax 2 +b ,…,ax n +b (a ,b 为常数)的平均数为a x +b ,方差为a 2s 2,标准差为 4、规律总结 (1)用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据. 样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度. 用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据 (2)平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策. (3)标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围. 列出一组样本数据的频率分布表步骤 说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性. 2.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性. 用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案. 3.在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.

高中数学 1.4数据的数字特征检测试题 北师大版必修3(3)

【成才之路】2014-2015学年高中数学 1.4数据的数字特征检测试题 北师大版必修3 一、选择题 1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 为( ) A .21 B .22 C .20 D .23 [答案] A [解析] 由x +232=22得x =21. 2.下列说法正确的是( ) A .在两组数据中,平均值较大的一组方差较大 B .平均数反映数据的集中趋势,标准差则反映数据离平均值的波动大小 C .方差的求法是求出各个数据与平均值的差的平方后再求和 D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 [答案] B [解析] 平均数、中位数、众数都是反映一组数据的“集中趋势”的统计量,方差、标准差、极差都是反映数据的离散程度的统计量,故选B. 3.在一次歌声大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A .9.4 0.484 B .9.4 0.016 C .9.5 0.04 D .9.5 0.016 [答案] D [解析] 去掉一个最高分和一个最低分后剩余分数为9.4,9.4,9.6,9.4,9.7. 其平均数为x =3×9.4+9.6+9.75 =9.5. 方差s 2=15 (0.12+0.12+0.12+0.12+0.22) =15 ×0.08=0.016. 4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的

用样本的数字特征估计总体的数字特征(高考题)【精选】

2.2.2用样本的数字特征估计总体的 数字特征 链接高考 1.(2014课标Ⅰ,18,12分,★★☆)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125) 频数 6 26 38 22 8 (1)作出这些数据的频率分布直方图; (2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定? 2.(2014陕西,9,5分,★★☆)某公司10位员工的月工资(单位:元)为x1,x2, (x10) 其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为() A.,s2+1002 B.+100,s2+1002 C.,s2 D.+100,s2

3.(2015广东,17,12分,★★☆)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图. (1)求直方图中x的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 4.(2014课标Ⅱ节选,19,★★☆)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下: 甲部门乙部门 4 97 97665332110 98877766555554443332100 6655200 632220 3 4 5 6 7 8 59 0448 122456677789 011234688 00113449 123345

学而思高中题库完整版统计.板块四.统计数据的数字特征.学生版

一.随机抽样 1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法: ⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法. ②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法. 简单随机抽样是最简单、最基本的抽样方法. ⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法. 抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整 除,设N k n =,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作 为起始数,然后顺次抽取第2(1)s k s k s n k +++-L ,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样. 系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样. ⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样. 分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛. 2.简单随机抽样必须具备下列特点: ⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样. ⑸简单随机抽样的每个个体入样的可能性均为n N . 3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取N k n =; 若N n 不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍 知识内容 板块四.统计数据的数字特征

相关文档