1、第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描述了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完整地描述随机变量,但能更突出地描述随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说
2、,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击水平,需要知道射手平均命中环数.设射手A在同样条件下进行射击,命中的环数X是一随机变量,其分布律如下:表4-1X10 9 8 7 6 5 0pk0.1 0.1 0.2 0.3 0.1 0.1 0.1由X的分布律可知,若射手A共射击N次,根据频率的稳定性,所以在N次射击中,大约有0.1N次击中10环,0.1N次击中9环,0.2N次击中8环,0.3N次击中7环,0.1N次击中6环,0.1N次击中5环,0.1N次脱靶.于是在N次射击中,射手A击中的环数之和约为100.1N+90.1N+80.2N+70.3N+
3、60.1N+50.1N+00.1N.平均每次击中的环数约为(100.1N+90.1N+80.2N+70.3N+60.1N+50.1N+00.1N)=100.1+90.1+80.2+70.3+60.1+50.1+00.1=6.7(环).由这样一个问题的启发,得到一般随机变量的“平均数”,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念”.一般地,有如下定义:定义4.1 设离散型随机变量X的分布律为PX=xk=pk k=1,2,,若级数 绝对收敛,则称级数为随机变量X的数学期望(Mathematical expectation),记为E(X
4、).即E(X)=. (4.1)设连续型随机变量X的概率密度为f(x),若积分绝对收敛,则称积分的值为随机变量X的数学期望,记为E(X).即E(X)=. (4.2)数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进行有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X的数学期望.解每次摇奖摇出的奖金额X是一个随机变量,易知它的分布律为表4-2X10000 100
5、0 100 10 1pk0.0001 0.0015 0.0134 0.1 0.885因此,E(X)=100000.0001+10000.0015+1000.0134+100.1+10.885=5.725.可见,平均起来每次摇奖的奖金额不足6元.这个值对商店作计划预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其分布律为表4-3到站时刻810,910 830,930 850,950概率1/6 3/6 2/6一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X分钟,易知X的分布律为表4-4X1
6、0 30 50 70 90pk3/6 2/6 1/36 3/36 2/36在上表中pk的求法如下,例如PX=70=P(AB)=P(A)P(B)=1/63/6=3/36,其中A为事件“第一班车在8:10到站”,B为事件“第二班车在9:30到站”,于是候车时间的数学期望为E(X)=103/6+302/6+501/36+703/36+902/36=27.22(分钟).例4.3 有5个相互独立工作的电子装置,它们的寿命Xk(k=1,2,3,4,5)服从同一指数分布,其概率密度为f(x)= (1) 若将这5个电子装置串联起来组成整机,求整机寿命N的数学期望;(2) 若将这5个电子装置并联组成整机,求整机
7、寿命M的数学期望.解 Xk(k=1,2,3,4,5)的分布函数为F(x)=(1) 串联的情况由于当5个电子装置中有一个损坏时,整机就停止工作,所以这时整机寿命为N=minX1,X2,X3,X4,X5.由于X1,X2,X3,X4,X5是相互独立的,于是i=minX1,X2,X3,X4,X5的分布函数为FN(x)=PNx=1-PNx=1-PX1x,X2x,X3x,X4x,X5x=1-PX1xPX2xPX3xPX4xPX5x=1-1-1- 1-1-1-=1-1-F(x)5=因此N的概率密度为fN(x)=则N的数学期望为E(N)=(2) 并联的情况由于当且仅当5个电子装置都损坏时,整机才停止工作,所以
8、这时整机寿命为M=maxX1,X2,X3,X4,X5.由于X1,X2,X3,X4,X5相互独立,类似可得M的分布函数为FM(x)=F(x)5=因而M的概率密度为fM(x)=于是M的数学期望为E(M)=这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X服从柯西(Cauchy)分布,其概率密度为f(x)=,-xx+,试证E(X)不存在.证 由于故E(X)不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y是随机变量X的函数Y=g(X)(g是连续函数).(1)
9、X是离散型随机变量,它的分布律为P(X=xk)=pk,k=1,2,若绝对收敛,则有E(Y)=Eg(X)=. (4.3)(2) X是连续型随机变量,它的概率密度为f(x),若绝对收敛,则有E(Y)=Eg(X)=. (4.4)定理4.4的重要意义在于当我们求E(Y)时,不必知道Y的分布而只需知道X的分布就可以了.当然,我们也可以由已知的X的分布,先求出其函数g(X)的分布,再根据数学期望的定义去求Eg(X),然而,求Y=g(X)的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形.例如,设Z是随机变量X,Y的函
10、数,Z=g(X,Y)(g是连续函数),那么Z也是一个随机变量,当(X,Y)是二维离散型随机变量,其分布律为PX=xi,Y=yj=pij(i,j=1,2,)时,若绝对收敛,则有E(Z)=Eg(X,Y)=. (4.5)当(X,Y)是二维连续型随机变量,其概率密度为f(x,y)时,若绝对收敛,则有E(Z)=Eg(X,Y)=. (4.6)特别地有E(X)=E(Y)=例4.5 设随机变量X的分布律为表4-5X-1 0 2 3P1/8 1/4 3/8 1/4求E(X2),E(-2x+1).解 由(4.5)式得E(X2)=(-1)2+02+22+32=,E(-2X+1)=-2(-1)+1+-20+1+-22
11、+1+-23+1= -74.例4.6 对球的直径作近似测量,设其值均匀分布在区间a,b内,求球体积的数学期望.解 设随机变量X表示球的直径,Y表示球的体积,依题意,X的概率密度为f(x)=球体积Y=,由(4.6)式得E(Y)=例4.7 设国际市场每年对我国某种出口商品的需求量X(吨)服从区间2000,4000上的均匀分布.若售出这种商品1吨,可挣得外汇3万元,但如果销售不出而囤积于仓库,则每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大?解设预备这种商品y吨(2000y4000),则收益(万元)为g(X)=则 Eg(X)= =.当y=3500吨时,上式达到最大值.所以预备350
12、0吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量(X,Y)在区域A上服从均匀分布,其中A为x轴,y轴及直线x+ =1所围成的三角区域,求E(X),E(Y),E(XY).解 由于(X,Y)在A内服从均匀分布,所以其概率密度f(x,y)=E(X)=E(Y)=E(XY)=3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X,Y的数学期望E(X),E(Y)存在.1E(c)=c,其中c是常数;2E(cX)=cE(X);3E(X+Y)=E(X)+E(Y);4若X,Y是相互独立的,则有E(XY)=E(X)E(Y).证 就连续型的情况我们来证明性质3、4,
13、离散型情况和其他性质的证明留给读者.3设二维随机变量(X,Y)的概率密度为f(x,y),其边缘概率密度为fX(x),fY(y),则E(X+Y)=.4又若X和Y相互独立,此时f(x,y)=fX(x)fY(y),故E(XY)=性质3可推广到任意有限个随机变量之和的情形;性质4可推广到任意有限个相互独立的随机变量之积的情形.例4.9 设一电路中电流I(安)与电阻R(欧)是两个相互独立的随机变量,其概率密度分别为g(i)= h(r)=试求电压V=IR的均值.解 E(V)=E(IR)=E(I)E(R)=(伏).例4.10 设对某一目标进行射击,命中n次才能彻底摧毁该目标,假定各次射击是独立的,并且每次射
14、击命中的概率为p,试求彻底摧毁这一目标平均消耗的炮弹数.解 设X为n次击中目标所消耗的炮弹数,Xk表示第k-1次击中后至k次击中目标之间所消耗的炮弹数,这样,Xk可取值1,2,3,其分布律见表4-6.表4-6Xk1 2 3 m P(Xk=m)p pq pq2 pqm-1 其中q=1-p,X1为第一次击中目标所消耗的炮弹数,则n次击中目标所消耗的炮弹数为X=X1+X2+Xn.由性质3可得E(X)=E(X1)+E(X2)+E(Xn)=nE(X1).又 E(X1)=故 E(X)=.4.常用分布的数学期望(1) 两点分布设X的分布律为X0 1P1-p p则X的数学期望为E(X)=0(1-p)+1p=p
15、.(2) 二项分布设X服从二项分布,其分布律为PX=k=, (k=0,1,2,n),(0p0).则X的数学期望为E(X)=,令k-1=t,则有E(X)=.(4) 均匀分布设X服从a,b上的均匀分布,其概率密度函数为f(x)=则X的数学期望为E(X)=.(5) 指数分布设X服从指数分布,其分布密度为f(x)=则X的数学期望为E(X)=.(6) 正态分布设XN(,2),其分布密度为f(x)=,则X的数学期望为E(X)=令=t,则E(X)=注意到=, =0,故有E(X)=.第二节 方 差1.方差的定义数学期望描述了随机变量取值的“平均”.有时仅知道这个平均值还不够.例如,有A,B两名射手,他们每次射
16、击命中的环数分别为X,Y,已知X,Y的分布律为:表4-7X8 9 10P(X=k)0.2 0.6 0.2表4-8Y8 9 10P(Y=k)0.1 0.8 0.1由于E(X)=E(Y)=9(环),可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X与它的平均值E(X)之间的离差X-E(X)的均值EX-E(X)来度量,EX-E(X)愈小,表明X的值愈集中于E(X)的附近,即技术稳定;EX-E(X)愈大,表明X的值很分散,技术不稳定.但由于EX-
17、E(X)带有绝对值,运算不便,故通常采用X与E(X)的离差X-E(X)的平方平均值EX-E(X)2来度量随机变量X取值的分散程度.此例中,由于EX-E(X)2=0.2(8-9)2+0.6(9-9)2+0.2(10-9)2=0.4,EY-E(Y)2=0.1(8-9)2+0.8(9-9)2+0.1(10-9)2=0.2.由此可见B的技术更稳定些.定义4.2 设X是一个随机变量,若EX-E(X)2存在,则称EX-E(X)2为X的方差(Variance),记为D(X),即D(X)=EX-E(X)2. (4.7)称为随机变量X的标准差(Standard deviation)或均方差(Mean squar
18、e deviation),记为(X).根据定义可知,随机变量X的方差反映了随机变量的取值与其数学期望的偏离程度.若X取值比较集中,则D(X)较小,反之,若X取值比较分散,则D(X)较大.由于方差是随机变量X的函数g(X)=X-E(X)2的数学期望.若离散型随机变量X的分布律为PX=xk=pk,k=1,2,则D(X)=. (4.8)若连续型随机变量X的概率密度为f(x),则D(X)= (4.9)由此可见,方差D(X)是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D(X)=EX-E(X)2=EX2-2XE(X)+E(X)2=E(X2)-2E(X)E(X)+E(X)2=E(X2)-
19、E(X)2.于是得到常用计算方差的简便公式D(X)=E(X2)-E(X)2. (4.10)例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进行检验,结果如下表:表4-9X28 29 30 31 32P0.1 0.15 0.5 0.15 0.1表4-10Y28 29 30 31 32P0.13 0.17 0.4 0.17 0.13其中X,Y分别表示甲,乙两种棉花的纤维的长度(单位:毫米),求D(X)与D(Y),且评定它们的质量.解 由于E(X)=280.1+290.15+300.5+310.15+320.1=30,E(Y)=280.13+290.17+300.4+310.17+320.13=
20、30,故得D(X)=(28-30)20.1+(29-30)20.15+(30-30)20.5+(31-30)20.15+(32-30)20.1=40.1+10.15+00.5+10.15+40.1=1.1,D(Y)=(28-30)20.13+(29-30)20.17+(30-30)20.4+(31-30)20.17+(32-30)20.13=40.13+10.17+00.4+10.17+40.13=1.38.因D(X)D(Y),所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X的概率密度为f(x)=求D(X).解 E(X)= =0,E(X2)=1/
21、6,于是 D(X)=E(X2)-E(X)2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X与Y的方差存在,则1设c为常数,则D(c)=0;2设c为常数,则D(cX)=c2D(X);3D(XY)=D(X)+D(Y)2E(X-E(X)(Y-E(Y);4若X,Y相互独立,则D(XY)=D(X)+D(Y);5对任意的常数cE(X),有D(X)E(X-c)2.证 仅证性质4,5.4D(XY)=E(XY)-E(XY)2=E(X-E(X)(Y-E(Y)2=EX-E(X)22E(X-E(X)(Y-E(Y)+EY-E(Y)2=D(X)+D(Y)2E(X-E(X)(Y-E(Y).当X与Y相互独立时,
22、X-E(X)与Y-E(Y)也相互独立,由数学期望的性质有E(X-E(X)(Y-E(Y)=E(X-E(X)E(Y-E(Y)=0.因此有D(XY)=D(X)+D(Y).性质4可以推广到任意有限多个相互独立的随机变量之和的情况.5对任意常数c,有E(X-c)2=E(X-E(X)+E(X)-c)2 =E(X-E(X)2+2(E(X)-c)EX-E(X)+(E(X)-c)2=D(X)+(E(X)-c)2.故对任意常数cEX,有DXE(X-c)2.例4.13 设随机变量X的数学期望为E(X),方差D(X)=2(0),令Y=,求E(Y),D(Y).解 E(Y)= D(Y)=常称Y为X的标准化随机变量.例4.
23、14 设X1,X2,Xn相互独立,且服从同一(0-1)分布,分布律为PXi=0=1-p,PXi=1=p, i=1,2,n.证明 X=X1+X2+Xn服从参数为n,p的二项分布,并求E(X)和D(X).解 X所有可能取值为0,1,n,由独立性知X以特定的方式(例如前k个取1,后n-k个取0)取k(0kn)的概率为pk(1-p)n-k,而X取k的两两互不相容的方式共有种,故PX=k=pk(1-p)n-k, k=0,1,2,n,即X服从参数为n,p的二项分布.由于E(Xi)=0(1-p)+1p=p,D(Xi)=(0-p)2(1-p)+(1-p)2p=p(1-p), i=1,2,n,故有E(X)= 由
24、于X1,X2,Xn相互独立,得D(X)= 3.常用分布的方差(1) (0-1)分布设X服从参数为p的0-1分布,其分布律为X0 1P1-p p由例4.14知,D(X)=p(1-p).(2) 二项分布设X服从参数为n,p的二项分布,由例4.14知,D(X)=np(1-p).(3) 泊松分布设X服从参数为的泊松分布,由上一节知E(X)=,又E(X2)=EX(X-1)+X=EX(X-1)+E(X)= =2e-e+=2+,从而有D(X)=E(X2)-E(X)2=2+ -2=.(4) 均匀分布设X服从a,b上的均匀分布,由上一节知E(X)=,又E(X2)=,所以D(X)=E(X2)-E(X)2=.(5)
25、 指数分布设X服从参数为的指数分布,由上一节知.E(X)=1/,又E(X2)=,所以D(X)=E(X2)-E(X)2= (6) 正态分布设XN(,2),由上一节知E(X)=,从而D(X)=令=t则D(X)= =2.由此可知:正态分布的概率密度中的两个参数和分别是该分布的数学期望和均方差.因而正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,若XiN(i,i2),i=1,2,n,且它们相互独立,则它们的线性组合c1X1+c2X2+cnXn(c1,c2,cn是不全为零的常数)仍然服从正态分布.于是由数学期望和方差的性质知道:c1X1+c2X2+cnXn.这是一个重要的结
26、果.例4.15 设活塞的直径(以cm计)XN(22.40,0.032),气缸的直径YN(22.50,0.042),X,Y相互独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率.解按题意需求PXY=PX-Y0.令Z=X-Y,则E(Z)=E(X)-E(Y)=22.40-22.50=-0.10,D(Z)=D(X)+D(Y)=0.032+0.042=0.052,即ZN(-0.10,0.052),故有PXY=PZ0=(2)=0.9772.第三节 协方差与相关系数对于二维随机变量(X,Y),数学期望E(X),E(Y)只反映了X和Y各自的平均值,而D(X),D(Y)反映的是X和Y各自偏离平均值的程度,
27、它们都没有反映X与Y之间的关系.在实际问题中,每对随机变量往往相互影响、相互联系.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种相互联系称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设(X,Y)为二维随机变量,称EX-E(X)Y-E(Y)为随机变量X,Y的协方差(Covariance),记为Cov(X,Y),即Cov(X,Y)=EX-E(X)Y-E(Y). (4.11)而称为随机变量X,Y的相关系数(Correlation coefficient)或标准协方差(Standard covariance),记为XY,即XY=. (4.12)特别地
28、,Cov(X,X)=EX-E(X)X-E(X)=D(X),Cov(Y,Y)=EY-E(Y)Y-E(Y)=D(Y).故方差D(X),D(Y)是协方差的特例.由上述定义及方差的性质可得D(XY)=D(X)+D(Y)2Cov(X,Y).由协方差的定义及数学期望的性质可得下列实用计算公式Cov(X,Y)=E(XY)-E(X)E(Y). (4.13)若(X,Y)为二维离散型随机变量,其联合分布律为PX=xi,Y=yj=pij,i,j=1,2,则有Cov(X,Y)=. (4.14)若(X,Y)为二维连续型随机变量,其概率密度为f(x,y),则有Cov(X,Y)=. (4.15)例4.16 设(X,Y)的分
29、布律为表4-12XY0 1011-p 00 p0p1,求Cov(X,Y)和XY.解 易知X的分布律为PX=1=p,PX=0=1-p,故 E(X)=p, D(X)=p(1-p).同理E(Y)=p,D(Y)=p(1-p),因此Cov(X,Y)=E(XY)-E(X)E(Y)=p-p2=p(1-p),而XY=例4.17 设(X,Y)的概率密度为f(x,y)=求Cov(X,Y).解 由于fX(x)= fY(y)=E(X)=,E(Y)=,E(XY)=因此 Cov(X,Y)=E(XY)-E(X)E(Y)=.协方差具有下列性质:1若X与Y相互独立,则Cov(X,Y)=0;2Cov(X,Y)=Cov(Y,X);
30、3Cov(aX,bY)=abCov(X,Y);4Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).证 仅证性质4,其余留给读者.Cov(X1+X2,Y) =E(X1+X2)Y-E(X1+X2)E(Y)=E(X1Y)+E(X2Y)-E(X1)E(Y)-E(X2)E(Y)=E(X1Y)-E(X1)E(Y)+E(X2Y)-E(X2)E(Y)=Cov(X1,Y)+Cov(X2,Y).下面给出相关系数XY的几条重要性质,并说明XY的含义.定理4.3 设D(X)0,D(Y)0,XY为(X,Y)的相关系数,则1如果X,Y相互独立,则XY=0;2XY1;3XY=1的充要条件是存在常数a,b使P
31、Y=aX+b=1(a0).证 由协方差的性质1及相关系数的定义可知1成立.2对任意实数t,有D(Y-tX)=E(Y-tX)-E(Y-tX)2=E(Y-E(Y)-t(X-E(X)2=EY-E(Y)2-2tEY-E(Y)X-E(X)+t2EX-E(X)2=t2D(X)-2tCov(X,Y)+D(Y)=.令t= =b,于是D(Y-bX)=由于方差不能为负,所以1-0,从而XY1.性质3的证明较复杂,从略.当XY=0时,称X与Y不相关,由性质1可知,当X与Y相互独立时,XY=0,即X与Y不相关.反之不一定成立,即X与Y不相关,X与Y却不一定相互独立.例4.18 设X服从0,2上均匀分布,Y=cosX,
32、Z=cos(X+a),这里a是常数.求YZ.解 E(Y)=0, E(Z)= =0,D(Y)=EY-E(Y)2=,D(Z)=EZ-E(Z)2=,Cov(Y,Z)=EY-E(Y)Z-E(Z)= ,因此 YZ= 当a=0时,YZ=1,Y=Z,存在线性关系; 当a=时,YZ=-1,Y=-Z,存在线性关系; 当a=或时,YZ=0,这时Y与Z不相关,但这时却有Y2+Z2=1,因此,Y与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定相互独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数XY描述了随机变量X,Y的线性相关程度,XY愈接近1,则X与Y之间愈接近线性关系.当XY=
33、1时,X与Y之间依概率1线性相关.不过,下例表明当(X,Y)是二维正态随机变量时,X和Y不相关与X和Y相互独立是等价的.例4.19 设(X,Y)服从二维正态分布,它的概率密度为f(x,y)= 求Cov(X,Y)和XY.解 可以计算得(X,Y)的边缘概率密度为fX(x)=,-x+,fY(y)=,-y+,故E(X)=1,E(Y)=2, D(X)=12,D(Y)=22.而Cov(X,Y)= 令t=,u=,则Cov(X,Y)=+=于是XY= =.这说明二维正态随机变量(X,Y)的概率密度中的参数就是X和Y的相关系数,从而二维正态随机变量的分布完全可由X,Y的各自的数学期望、方差以及它们的相关系数所确定
34、.由上一章讨论可知,若(X,Y)服从二维正态分布,那么X和Y相互独立的充要条件是=0,即X与Y不相关.因此,对于二维正态随机变量(X,Y)来说,X和Y不相关与X和Y相互独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩(Moment).矩是更广泛的数字特征.定义4.4 设X和Y是随机变量,若E(Xk),k=1,2,存在,称它为X的k阶原点矩,简称k阶矩.若 EX-E(X)k, k=1,2,存在,称它为X的k阶中心矩.若 E(XkYl), k,l=1,2,存在,称它为X和Y的k+l阶混合矩.若 EX-E(X)kY-E(Y)l存在,称它为X和Y的
35、k+l阶混合中心矩.显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差Cov(X,Y)是X和Y的1+1阶混合中心矩.当X为离散型随机变量,其分布律为PX=xi=pi,则E(Xk)=,EX-E(X)k=.当X为连续型随机变量,其概率密度为f(x),则E(Xk)=,EX-E(X)k=.下面介绍n维随机变量的协方差矩阵.设n维随机变量(X1,X2,Xn)的1+1阶混合中心矩ij=Cov(Xi,Xj)=EXi-E(Xi)Xj-E(Xj), i,j=1,2,n都存在,则称矩阵=为n维随机变量(X1,X2,Xn)的协方差矩阵.由于ij=ji(i,j=1,2,n),因此是一个对
36、称矩阵.协方差矩阵给出了n维随机变量的全部方差及协方差,因此在研究n维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n维正态分布的概率密度.首先用协方差矩阵重写二维正态随机变量(X1,X2)的概率密度.f(x1,x2)=令X=,=,(X1,X2)的协方差矩阵为=它的行列式=1222(1-2),逆阵-1=由于 (X-)T-1(X-)= =,因此(X1,X2)的概率密度可写成f(x1,x2)=上式容易推广到n维的情形.设(X1,X2,Xn)是n维随机变量,令X=, =,定义n维正态随机变量(X1,X2,Xn)的概率密度为f(x1,x2,xn)= 其中是(X1,X2,Xn)的协
37、方差矩阵.n维正态随机变量具有以下几条重要性质: 1n维随机变量(X1,X2,Xn)服从n维正态分布的充要条件是X1,X2,Xn的任意的线性组合l1X1+l2X2+lnXn服从一维正态分布.(其中l1,l2,ln不全为零).2若(X1,X2,Xn)服从n维正态分布,设Y1,Y2,,Yk是X1,X2,Xn的线性函数,则(Y1,Y2,Yk)服从k维正态分布.3设(X1,X2,Xn)服从n维正态分布,则X1,X2,Xn相互独立的充要条件是X1,X2,Xn两两不相关.小 结随机变量的数字特征是由随机变量的分布确定的,能描述随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E(X
38、)描述随机变量X取值的平均大小,方差D(X)=EX-E(X)2描述随机变量X与它自己的数学期望E(X)的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完整地描述随机变量,但它们能描述随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g(X)的数学期望E(Y)=Eg(X)的计算公式(4.3)和(4.4).这两个公式的意义在于当我们求E(Y)时,不必先求出Y=g(X)的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D(X)=E(X2)-E(X)2来计算方差D(X),请注意这里E(X2)和E(X)2的区别.要掌握数学期望和方差的性质,提请读者注意的是:(1) 当X1,X2独立或X1,X2不相关
版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。
Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1
陕公网安备 61072602000132号 违法和不良信息举报:0916-4228922