数学实验四(概率论)
一.用MATLAB 计算随机变量的分布
1.用MA TLAB 计算二项分布
当随变量(),X B n p 时,在MATLAB 中用命令函数
(,,)Px binopdf X n p =
计算某事件发生的概率为p 的n 重贝努利试验中,该事件发生的次数为X 的概率。
例1 在一级品率为0.2的大批产品中,随机地抽取20个产品,求其中有2个一级品的概率。 解 在MATLAB 中,输入 >>clear
>> Px=binopdf(2,20,0.2) Px =
0.1369
即所求概率为0.1369。
2.用MA TLAB 计算泊松分布
当随变量()X P λ 时,在MATLAB 中用命令函数
(,)P poisspdf x lambda =
计算服从参数为lambda 的泊松分布的随机变量取值x 的概率。用命令函数
(,)P poisscdf x lambda =
计算服从参数为lambda 的泊松分布的随机变量在[]0,x 取值的概率。
例2 用MATLAB 计算:保险公司售出某种寿险保单2500份.已知此项寿险每单需交保费120元,当被保人一年内死亡时,其家属可以从保险公司获得2万元的赔偿(即保额为2万元).若此类被保人一年内死亡的概率0.002,试求:
(1)保险公司的此项寿险亏损的概率;
(2)保险公司从此项寿险获利不少于10万元的概率; (3)获利不少于20万元的概率.
利用泊松分布计算. 25000.0025np λ==?=
(1) P(保险公司亏本)= ()()15
250025000(3020)1(15)10.0020.998k
k
k
k P X P X C -=-<=-≤=-
?∑
=15
5
051!
k k e k -=-∑
在MATLAB 中,输入 >> clear
>> P1=poisscdf(15,5) P1 =
0. 9999
即 15
5
05!
k k e k -=∑= P1 =0.9999
故 P(保险公司亏本)=1-0.9999=0.0001
(2) P(获利不少于10万元)= ()()
10
10
25002500
25000
(30210)(10)0.0020.998k k
k k
k k P X P X C
C -==-≥=≤=
?≈∑∑ =10
5
05!
k k e k -=∑ 在MATLAB 中,输入 >>P=poisscdf(10,5) P =
0.9863
即 10
5
05!
k k e k -=∑=0.9863
(3) P(获利不少于20万元)= ()()
5
25002500
(30220)(5)0.0020.998k k
k k P X P X C
-=-≥=≤=?∑ =5
5
05!
k k e k -=∑ 在MATLAB 中,输入 >>P=poisscdf(5,5) P =
0.6160
即 5
5
05!
k k e k -=∑= 0.6160
3.用MA TLAB 计算均匀分布
当随机变量(),X U a b 时,在MATLAB 中用命令函数
(),,P unifpdf x a b =
计算在区间[],a b 服从均匀分布的随机变量的概率密度在x 处的值。用命令函数 (),,P unifcdf X a b =
计算在区间[],a b 服从均匀分布的随机变量的分布函数在X 处的值。
例3乘客到车站候车时间ξ()0,6U ,计算()13P ξ<≤。 解 ()13P ξ<≤()()31P P ξξ=≤-≤ 在MATLAB 中,输入 >>p1=unifcdf(3,0,6) p1 =
0.5000
>>p2=unifcdf(1,0,6) p2= 0.1667 >>p1-p2 ans = 0. 3333
即 ()13P ξ<≤=0.3333
4.用MA TLAB 计算指数分布
当随变量()X E λ 时,在MATLAB 中用命令函数
()exp ,P pdf x lamda =
计算服从参数为λ的指数分布的随机变量的概率密度。用命令函数
()exp ,P cdf x lamda =
计算服从参数为1
λ-的指数分布的随机变量在区间[]0,x 取值的概率。
例4 用MA TLAB 计算:某元件寿命ξ服从参数为λ(λ=1
1000-)的指数分布.3个这样的元件使用1000小时后,都没有损坏的概率是多少?
解 由于元件寿命ξ服从参数为λ(λ=1
1000-)的指数分布, )1000(1)1000(≤-=>ξξP P 在MATLAB 中,输入 >>p=expcdf(1000,1000) p =
0. 6321 >>1-p ans =
0.3679
即 )1000(1)1000(≤-=>ξξP P = 0.3679 再输入
>>p2=binopdf(3,3,0.3679) p2 = 0.0498
即3个这样的元件使用1000小时都未损坏的概率为0.0498。
5。用MATLAB 计算正态分布
当随变量()
2
,X N μσ 时,在MATLAB 中用命令函数
(),,P normpdf K mu sigma =
计算服从参数为,μσ的正态分布的随机变量的概率密度。用命令函数
(),,P normcdf K mu sigma =
计算服从参数为,μσ的正态分布的随机变量的分布函数在K 处的值。
例5 用MA TLAB 计算:某厂生产一种设备,其平均寿命为10年,标准差为2年.如该设备的寿命服从正态分布,求寿命不低于9年的设备占整批设备的比例?。
解 设随机变量ξ为设备寿命,由题意)2,10(~2
N ξ )9(1)9(<-=≥ξξP P
在MATLAB 中,输入 >>clear
>> p1=normcdf(9,10,2) p1 =
0. 3085 >>1-p1
ans = 0.6915
二.利用MATLAB 计算随机变量的期望和方差
1. 用MATLAB 计算数学期望
(1)用MATLAB 计算离散型随机变量的期望
通常,对取值较少的离散型随机变量,可用如下程序进行计算:
1212[,,,];[,,,];*n n X x x x P p p p EX X P '===
对于有无穷多个取值的随机变量,其期望的计算公式为:
0()i i i E X x p ∞
==∑
可用如下程序进行计算:
(,0,inf)i i EX symsum x p =
例6 一批产品中有一、二、三等品、等外品及废品5种,相应的概率分别为0.7、0.1、0.1、0.06及0.04,若其产值分别为6元、5.4元、5元、4元及0元.求产值的平均值
解 将产品产值用随机变量ξ表示,则ξ的分布为:
产值ξ 6 5.4 5 4 0 概率p 0.7 0.1 0.1 0.06 0.04
产值的平均值为ξ的数学期望。在MA TLAB 中,输入
[]654540.ξ=; []0701*******
4p .....=; '*p E ξξ= =ξE
54800.
即产品产值的平均值为5.48.
例7 已知随机变量X 的分布列如下:
{}k
k X p 21
== ,,2,1n k = 计算.EX
解 112k
k EX k
∞
==∑ 在MA TLAB 中,输入
k syms ;
inf),1,,)^2/1(*(k k k symsum
=ans
2 即 2=EX
值得注意的是,对案例3.15中简单随机变量,直接用公式计算即可,不一定使用软件计算。
(2)用MATLAB 计算连续型随机变量的数学期望
若X 是连续型随机变量,数学期望的计算公式为:
()EX xf x dx +∞-∞
=?
程序如下:
int(*(),inf,inf)EX x f x =-
例8 用MATLAB 计算:假定国际市场上对我国某种商品的年需求量是一个随机变量ξ(单位:吨),服从区间[],a b 上的均
匀分布,其概率密度为: 1
()0
a x b
x b a
??≤≤?
=-???其它
计算我国该种商品在国际市场上年销售量的期望.ξE .
解 ()1
b
a
E xf x dx x
dx b a
ξ∞-∞
==-?
? 在MA TLAB 中,输入
;;b a x syms clear
ξE =int (b a x a b x ,,),/(-) ξE =1/2/(b-a)*(b^2-a^2)
即 ξE =()/2a b +
(3)用MATLAB 计算随机变量函数的数学期望
若()g X 是随机变量X 的函数,则当X 为离散型随机变量且有分布律k k p x X P ==}{n k ,2,1(=或 21
,=k )时,随机变量()g X 的数学期望为:
0[()]()k k k E g X g x p ∞
==∑
其MA TLAB 计算程序为:
[()](()*,0,inf)k k E g X symsum g x p =
当X 为连续型随机变量且有概率密度)(x ?时,随机变量()g X 的数学期望为:?
∞
+∞
-=
dx x x g x g E )()()]([?
其MA TLAB 计算程序为:
int(()*(),inf,inf)EX g x f x =-
例9 利用MATLAB 计算:假定国际市场每年对我国某种商品的需求量是随机变量X (单位:吨),服从[20,40]上的均匀分布,
已知该商品每售出1吨,可获利3万美元,若销售不出去,则每吨要损失1万美元,如何组织货源,才可使收益最大?
解 设y 为组织的货源数量,R 为收益,销售量为ξ.依题意有
3()3()y R g y ξξξ?
==?--?
y y ξξ≥<
化简得
3()4y g y ξξ?=?
-?
y y ξξ≥< 又已知销售量ξ服从[20,40]上的均匀分,即
1
2040
()20
x x ξ??<
=??? 其它
于是 ()[()]()()E R E g g x x dx ξ?+∞-∞
==?
40
20
1()20g x dx =
? 40
2011(4)32020y y
x y dx ydx =
-+??
在MA TLAB 命令窗口输入
>>;clear syms x y
>>EY=1/20*(int((4*x-y),x,20,y)+int(3*y,x,y,40))
结果显示
1/10*y^2-40-1/20*y*(y-20)+3/20*y*(40-y) 将其化简,输入命令
>>simplify(1/10*y^2-40-1/20*y*(y-20)+3/20*y*(40-y)) 结果显示
-1/10*y^2-40+7*y
再对y 在区间[]20,40上求最大值,在命令窗口输入 >>min ('1/10*^27*40',20,40)f bnd x x -+
结果显示
3.5000e+001
即当组织35吨货源时,收益最大。
(注: simplify (f )是对函数f 化简;fminbnd(‘f ’,a,b)是对函数f 在区间[a,b]上求极小值。要求函数的极大值时只需将‘f ’变为 ‘-f ’)
2. 用MATLAB 计算方差
计算方差的常用公式为:22()()[()]D X E X E X =-
若离散型随机变量X 有分布律k k p x X P ==}{n k ,2,1(=或 21,=k ),
其MA TLAB 计算程序为
1212[,,,];[,,,];;*n n X x x x P p p p EX X P '===
2^()
.*2D X X P EX '=-
若X 是连续型随机变量且密度函数为()f x ,则方差的MA TLAB 计算程序为
int(*(),inf,inf);EX x f x =-
2^()int(*(),inf,inf)2D X x f x
EX =--
例10 利用10元,一年后它们的价格及其分布分别如下表:
试比较购买这两种股票时的投资风险.
解 两公司的股票价格都是离散型随机变量.先计算甲公司股票的方差,在MATLAB 命令窗口输入
[8,121,15];[0.4,0.5,0.1];.*;
.^2*^2X P EX X P DX X P EX '==='=-
运行结果显示
5.7425DX =
类似的程序我们可得乙公司股票的方差为 39.09DY =
相比之下,甲公司股票方差小得多,故购买甲公司股票风险较小。
例11 用MATLAB 计算:例8中我国商品在国际市场上的销售量的方差.
解 已知销售量为[],a b 上均匀分布,即密度函数为
1()0
a x b
x b a
??≤≤?
=-???其它
在MATLAB 命令窗口输入
;;b a x syms clear
ξE =int (b a x a b x ,,),/(-);
int(1/()^2,,,)^2D b a x x a b E ξξ=--
运行后结果显示
1/3/(b-a)*(b^3-a^3)-1/4/(b-a)^2*(b^2-a^2)^2
将其化简,在命令窗口中输入
simplify(1/3/(b-a)*(b^3-a^3)-1/4/(b-a)^2*(b^2-a^2)^2)
结果显示
1/12*a^2-1/6*b*a+1/12*b^2
即 ()2
/12b a -,这与前面的结论是一致的。
3. 常见分布的期望与方差
常见分布的期望与方差可以调用如下函数完成(表3.1)
例12 求二项分布参数100,0.2n p ==的期望方差 解 程序如下
100;0.2;
[,](,)
n p E D binostat n p ===
结果显示 E= 20 D= 16
例13 求正态分布参数100,0.2MU SIGMA ==的期望方差
解 程序如下
6;0.25;
[,](,)MU SIGMA E D normstat MU SIGMA ===
结果显示 E= 6 D=
0.062 5
实验四方差分析和回归分析 四、实验结果 1、用5种不同的施肥方案分别得到某种农作物的收获量(kg)如右: 在显著性水平= 对农作物的收获量是否有显著影响. >> X=[67 67 55 42 98 96 91 66 60 69 50 35 79 64 81 70 90 70 79 88]; group=[ones(1,4),2*ones(1,4),3*ones(1,4),4*ones(1,4),5*ones(1,4)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [+03] [ 4] [] [] [] 'Error' [+03] [15] [] [] [] 'Total' [+03] [19] [] [] []
stats = gnames: {5x1 cell} n: [4 4 4 4 4] source: 'anova1' means: [ ] df: 15 s: 因为p=<,所以施肥方案对农作物的收获量有显著影响。且由箱型图可知:第2种施肥方案对对农作物的收获量的影响最好,即产量最高。 2、某粮食加工产试验三种储藏方法对粮食含水率有无显著影响,现取一批粮食分成若干份,分别用三种不同的方法储藏,过段时间后测得的含水率如右表:
在显著性水平=α下,i x 检验储藏方法对含水率有无显著的影响. >> X=[ 10 ]; group=[ones(1,5),2*ones(1,5),3*ones(1,5)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [] [ 2] [] [] [] 'Error' [ ] [12] [] [] [] 'Total' [] [14] [] [] [] stats = gnames: {3x1 cell} n: [5 5 5] source: 'anova1'
习题一 1.1 写出下列随机试验的样本空间,并把指定的事件表示为样本点的集合: (1)随机试验:考察某个班级的某次数学考试的平均成绩(以百分制记分,只取整数); 设事件A 表示:平均得分在80分以上。 (2)随机试验:同时掷三颗骰子,记录三颗骰子点数之和; 设事件A 表示:第一颗掷得5点; 设事件B 表示:三颗骰子点数之和不超过8点。 (3)随机试验:一个口袋中有5只球,编号分别为1,2,3,4,5,从中取三个球; 设事件A 表示:取出的三个球中最小的号码为1。 (4)随机试验:某篮球运动员投篮练习,直至投中十次,考虑累计投篮的次数; 设事件A 表示:至多只要投50次。 (5)随机试验:将长度为1的线段任意分为三段,依次观察各段的长度。 1.2 在分别标有号码1~8的八张卡片中任抽一张。 (1)写出该随机试验的样本点和样本空间; (2)设事件A 为“抽得一张标号不大于4的卡片”,事件B 为“抽得一张标号为偶数的 卡片”,事件C 为“抽得一张标号能被3整除的卡片”。 试将下列事件表示为样本点的集合,并说明分别表示什么事件? (a )AB ; (b) B A +; (c) B ; (d) B A -; (e) BC ; (f) C B + 。 1.3 设A 、B 、C 是样本空间的事件,把下列事件用A 、B 、C 表示出来: (1)A 发生; (2)A 不发生,但B 、C 至少有一个发生; (3)三个事件恰有一个发生; (4)三个事件中至少有两个发生; (5)三个事件都不发生; (6)三个事件最多有一个发生; (7)三个事件不都发生。 1.4 设}10,,3,2,1{ =Ω,}5,3,2{=A ,}7,5,3{=B ,}7,4,3,1{=C ,求下列事件: (1)B A ; (2))(BC A 。 1.5 设A 、B 是随机事件,试证:B A AB A B B A +=-+-)()(。 1.6 在11张卡片上分别写上Probability 这11个字母,从中任意抽取7张,求其排列结果为ability 的概率。 1.7 电话号码由6位数字组成,每个数字可以是0,1,2,…,9中的任一个数字(但第一位不能为0),求电话号码是由完全不相同的数字组成的概率。 1.8 把10本不同的书任意在书架上放成一排,求其中指定的3本书恰好放在一起的概率。
北京交通大学海滨学院考试试题 课程名称:数学实验2010-2011第一学期出题教师:数学组适用专业: 09机械, 物流, 土木, 自动化 班级:学号:姓名: 选做题目序号: 1.一对刚出生的幼兔经过一个月可以长成成兔, 成兔再经过一个月后可以 繁殖出一对幼兔. 如果不计算兔子的死亡数, 请用Matlab程序给出在未来24个月中每个月的兔子对数。 解: 由题意每月的成兔与幼兔的数量如下表所示: 1 2 3 4 5 6 ··· 成兔0 1 1 2 3 5··· 幼兔 1 0 1 1 2 3··· 运用Matlab程序: x=zeros(1,24); x(1)=1;x(2)=1; for i=2:24 x(i+1)=x(i)+x(i-1); end x 结果为x = 1 1 2 3 5 8 13 21 3 4 5 5 89 144 233 377 610 987 1597 2584 4181 6765 1094 6 7711 2865 7 46368 2.定积分的过程可以分为分割、求和、取极限三部分, 以1 x e dx 为例, 利用
已学过的Matlab 命令, 通过作图演示计算积分的过程, 并与使用命令int() 直接积分的结果进行比较. 解:根据求积分的过程,我们先对区间[0,1]进行n 等分, 然后针对函数x e 取和,取和的形式为10 1 i n x i e e dx n ξ=≈ ∑ ? ,其中1[ ,]i i i n n ξ-?。这里取i ξ为区间的右端点,则当10n =时,1 x e dx ?可用10 101 1.805610 i i e ==∑ 来近似计算, 当10n =0时,100 100 1 01 =1.7269100 i x i e e dx =≈ ∑?,当10n =000时,10000 10000 1 1 =1.718410000 i x i e e dx =≈ ∑ ?. 示意图如下图,Matlab 命令如下: x=linspace (0,1,21); y=exp(x); y1=y(1:20); s1=sum(y1)/20 y2=y(2:21); s2=sum(y2)/20 plot(x,y); hold on for i=1:20 fill([x(i),x(i+1),x(i+1),x(i),x(i)],[0,0,y(i),y(i),0],'b') end syms k;symsum(exp(k/10)/10,k,1,10);%n=10 symsum(exp(k/100)/100,k,1,100);%n=100 symsum(exp(k/10000)/10000,k,1,10000);%n=10000
实验四 方差分析和回归分析 四、实验结果 1、用5种不同的施肥方案分别得到某种农作物的收获量(kg )如右: 在显著性水平=α下,检验施肥方案对农作物的收获量是否有显著影 响. >> X=[67 67 55 42 98 96 91 66 60 69 50 35 79 64 81 70 90 70 79 88]; group=[ones(1,4),2*ones(1,4),3*ones(1,4),4*ones(1,4),5*ones(1,4)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [+03] [ 4] [] [] [] 'Error' [+03] [15] [] [] [] 'Total' [+03] [19] [] [] [] 5 9 778
stats = gnames: {5x1 cell} n: [4 4 4 4 4] source: 'anova1' means: [ ] df: 15 s: 因为p=<,所以施肥方案对农作物的收获量有显著影响。且由箱型图可知:第2种施肥方案对对农作物的收获量的影响最好,即产量最高。 2、某粮食加工产试验三种储藏方法对粮食含水率有无显著影响,现取一批粮食分成若干份,分别用三种不同的方法储藏,过段时间后测得的含水率如右表:
在显著性水平=α下,i x 检验储藏方法对含水率有无显著的影 响. >> X=[ 10 ]; group=[ones(1,5),2*ones(1,5),3*ones(1,5)]; [p,table,stats] = anova1(X,group,'on') p = table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [] [ 2] [] [] [] 'Error' [ ] [12] [] [] [] 'Total' [] [14] [] [] [] stats = gnames: {3x1 cell} n: [5 5 5]
北京科技大学计算机与通信工程学院 模式分类第二次上机实验报告 姓名:XXXXXX 学号:00000000 班级:电信11 时间:2014-04-16
一、实验目的 1.掌握支持向量机(SVM)的原理、核函数类型选择以及核参数选择原则等; 二、实验内容 2.准备好数据,首先要把数据转换成Libsvm软件包要求的数据格式为: label index1:value1 index2:value2 ... 其中对于分类来说label为类标识,指定数据的种类;对于回归来说label为目标值。(我主要要用到回归) Index是从1开始的自然数,value是每一维的特征值。 该过程可以自己使用excel或者编写程序来完成,也可以使用网络上的FormatDataLibsvm.xls来完成。FormatDataLibsvm.xls使用说明: 先将数据按照下列格式存放(注意label放最后面): value1 value2 label value1 value2 label 然后将以上数据粘贴到FormatDataLibsvm.xls中的最左上角单元格,接着工具->宏执行行FormatDataToLibsvm宏。就可以得到libsvm要求的数据格式。将该数据存放到文本文件中进行下一步的处理。 3.对数据进行归一化。 该过程要用到libsvm软件包中的svm-scale.exe Svm-scale用法: 用法:svmscale [-l lower] [-u upper] [-y y_lower y_upper] [-s save_filename] [-r restore_filename] filename (缺省值:lower = -1,upper = 1,没有对y进行缩放)其中,-l:数据下限标记;lower:缩放后数据下限;-u:数据上限标记;upper:缩放后数据上限;-y:是否对目标值同时进行缩放;y_lower为下限值,y_upper为上限值;(回归需要对目标进行缩放,因此该参数可以设定为–y -1 1 )-s save_filename:表示将缩放的规则保存为文件save_filename;-r restore_filename:表示将缩放规则文件restore_filename载入后按此缩放;filename:待缩放的数据文件(要求满足前面所述的格式)。缩放规则文件可以用文本浏览器打开,看到其格式为: y lower upper min max x lower upper index1 min1 max1 index2 min2 max2 其中的lower 与upper 与使用时所设置的lower 与upper 含义相同;index 表示特征序号;min 转换前该特征的最小值;max 转换前该特征的最大值。数据集的缩放结果在此情况下通过DOS窗口输出,当然也可以通过DOS的文件重定向符号“>”将结果另存为指定的文件。该文件中的参数可用于最后面对目标值的反归一化。反归一化的公式为: (Value-lower)*(max-min)/(upper - lower)+lower 其中value为归一化后的值,其他参数与前面介绍的相同。 建议将训练数据集与测试数据集放在同一个文本文件中一起归一化,然后再将归一化结果分成训练集和测试集。 4.训练数据,生成模型。 用法:svmtrain [options] training_set_file [model_file] 其中,options(操作参数):可用的选项即表示的涵义如下所示-s svm类型:设置SVM 类型,默
1.(1) [1 2 3 4;0 2 -1 1;1 -1 2 5;]+(1/2).*([2 1 4 10;0 -1 2 0;0 2 3 -2]) 2. A=[3 0 1;-1 2 1;3 4 2],B=[1 0 2;-1 1 1;2 1 1] X=(B+2*A)/2 3. A=[-4 -2 0 2 4;-3 -1 1 3 5] abs(A)>3 % 4. A=[-2 3 2 4;1 -2 3 2;3 2 3 4;0 4 -2 5] det(A),eig(A),rank(A),inv(A) 求计算机高手用matlab解决。 >> A=[-2,3,2,4;1,-2,3,2;3,2,3,4;0,4,-2,5] 求|A| >> abs(A) ans = ( 2 3 2 4 1 2 3 2 3 2 3 4 0 4 2 5 求r(A) >> rank(A) ans =
4 求A-1 《 >> A-1 ans = -3 2 1 3 0 -3 2 1 2 1 2 3 -1 3 -3 4 求特征值、特征向量 >> [V,D]=eig(A) %返回矩阵A的特征值矩阵D 与特征向量矩阵V , V = - + + - - + - + - + - + D = { + 0 0 0 0 - 0 0 0 0 + 0 0 0 0 - 将A的第2行与第3列联成一行赋给b >> b=[A(2,:),A(:,3)'] b = 《 1 - 2 3 2 2 3 3 -2