1、概率论与数理统计各章重点知识整理第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E的所有可能结果组成的集合. 样本点(基本事件):E的每个结果.随机事件(事件):样本空间S的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(F):每次试验中一定不会发生的事件.二. 事件间的关系和运算1.AB(事件B包含事件A )事件A发生必然导致事件B发生.2.AB(和事件)事件A与B至少有一个发生.3. AB=AB(积事件)事件A与
2、B同时发生.4. A-B(差事件)事件A发生而B不发生.5. AB=F (A与B互不相容或互斥)事件A与B不能同时发生.6. AB=F且AB=S (A与B互为逆事件或对立事件)表示一次试验中A与B必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德摩根律 三. 概率的定义与性质1.定义 对于E的每一事件A赋予一个实数,记为P(A),称为事件A的概率.(1)非负性 P(A)0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A1,A2,(A iAj=, ij, i,j=1,2,),P(A1A2)=P( A1)+P(A2)+2.性质
3、(1) P(F) = 0 , 注意: A为不可能事件 P(A)=0 . (2)有限可加性 对于n个两两互不相容的事件A1,A2,A n ,P(A1A2A n)=P(A1)+P(A2)+P(A n) (有限可加性与可列可加性合称加法定理)(3)若AB, 则P(A)P(B), P(B-A)=P(B)-P(A) . (4)对于任一事件A, P(A)1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(AB)=P(A)+P(B)-P(AB) .对于任意n个事件A1,A2,A n+(-1)n-1P(A1A2A n)四.等可能(古典)概型1.定义 如果试验E满足:(1)样本空间的
4、元素只有有限个,即S=e1,e2,e n;(2)每一个基本事件的概率相等,即P(e1)=P(e2)= P(e n ).则称试验E所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k是A中包含的基本事件数, n是S中包含的基本事件总数.五.条件概率1.定义 事件A发生的条件下事件B发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)0); P(AB)=P(B) P (A|B) (P(B)0). P(A1A2A n)=P(A1)P(A2|A1)P(A3|A1A2)P(A n|A1A2A n
5、-1) (n2, P(A1A2A n-1) 0)3. B1,B2,B n是样本空间S的一个划分(BiBj=,ij,i,j=1,2,n, B1B2B n=S) ,则当P(B i)0时,有全概率公式 P(A)=当P(A)0, P(B i)0时,有贝叶斯公式P (Bi|A)= . 六.事件的独立性 1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B为相互独立的事件.(1)两个事件A,B相互独立 P(B)= P (B|A) .(2)若A与B,A与,与B, ,与中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C满足P(AB) =P(A) P(B), P(AC)= P(A)
6、 P(C), P(BC)= P(B) P(C),称A,B,C三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C三事件相互独立.3.n个事件A1,A2,A n,如果对任意k (1kn),任意1i1i2i kn.有,则称这n个事件A1,A2,A n相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E的样本空间S=e上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X的分布函数F(x)=PXx , x是任意实数. 其性质为:(1)0F(x)1 ,F(-)=0,F()=1. (2)F(x)单调不减,即若x1x2 ,则 F(x1
7、)F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)Px1Xx2=F(x2)-F(x1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 PX= x k= p k (k=1,2,) 也可以列表表示. 其性质为:(1)非负性 0Pk1 ; (2)归一性 .2.离散型随机变量的分布函数 F(x)=为阶梯函数,它在x=x k (k=1,2,)处具有跳跃点,其跳跃值为p k=PX=x k .3.三种重要的离散型随机变量的分布(1)X(0-1)分布 PX=1= p ,PX=0=1p (0p1) .(2)Xb(n,p)参数为n,p的二项分布PX
8、=k=(k=0,1,2,n) (0p0)三.连续型随机变量1.定义 如果随机变量X的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=,- x ,则称X为连续型随机变量,其中f (x)称为X的概率密度(函数).2.概率密度的性质(1)非负性 f(x)0 ; (2)归一性 =1 ;(3) Px 10).(3)XN (m,s2 )参数为m,s的正态分布 -x0.特别, m=0, s2 =1时,称X服从标准正态分布,记为XN (0,1),其概率密度 , 标准正态分布函数 , F(-x)=1-(x) .若XN (m,s2), 则Z=N (0,1), Px1z a= PZz a/2= a,则
9、点z a,-z a, z a/ 2分别称为标准正态分布的上,下,双侧a分位点. 注意:F(z a)=1-a , z 1- a= -z a.四.随机变量X的函数Y= g (X)的分布1.离散型随机变量的函数 Xx 1 x2 x k p kp 1 p2 p k Y=g(X)g(x1) g(x2) g(x k) 若g(x k) (k=1,2,)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k) (k=1,2,)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X的概率密度为fX(x),则求其函数Y=g(X)的概率密度fY(y)常用两种方法:(
10、1)分布函数法 先求Y的分布函数FY(y)=PYy=Pg(X)y=其中k(y)是与g(X)y对应的X的可能值x所在的区间(可能不只一个),然后对y求导即得fY(y)=FY /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)0 (或g / (x)0 ),则Y=g (X)是连续型随机变量,其概率密度为 其中h(y)是g(x)的反函数 , a= min (g (-),g () b= max (g (-),g () .如果f (x)在有限区间a,b以外等于零,则 a= min (g (a),g (b) b= max (g (a),g (b) .第三章 二维随机变量及其概率分布 一.二维随
11、机变量与联合分布函数1.定义 若X和Y是定义在样本空间S上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=PXx,Yy称为(X,Y)的(X和Y的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x和y单调不减.(2)0F(x,y)1 , F(x,- )=0, F(-,y)=0, F(-,-)=0, F(,)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1x 2 , y 1y 2Px 1Xx 2 , y 1Yy
12、2= F(x2,y2)- F(x2,y1)- F(x1,y2)+ F(x1,y1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i,y j) (i ,j =1,2, )称(X,Y)为二维离散型随机变量.并称PX= x i,Y= y j = p i j为(X,Y)的联合分布律.也可列表表示. 2.性质(1)非负性 0p i j1 . (2)归一性 . 3. (X,Y)的(X和Y的联合)分布函数F(x,y)= 三.二维连续型随机变量及其联合概率密度 1.定义 如果存在非负的函数f (x,y),使对任意的x和y,有F(x,y)= 则称(X,Y)为
13、二维连续型随机变量,称f(x,y)为(X,Y)的(X和Y的联合)概率密度.2.性质 (1)非负性 f (x,y)0 . (2)归一性 .(3)若f (x,y)在点(x,y)连续,则(4)若G为xoy平面上一个区域,则.四.边缘分布1. (X,Y)关于X的边缘分布函数 FX (x) = PXx , Y= F (x , ) .(X,Y)关于Y的边缘分布函数 FY (y) = PX0,则称PX=x i |Y=yj 为在Y= yj条件下随机变量X的条件分布律.同样,对于固定的i,若PX=xi0,则称PY=yj|X=x i 为在X=xi条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期
14、望和方差的定义随机变量X 离散型随机变量 连续型随机变量 分布律PX=x i= pi ( i =1,2,) 概率密度f (x)数学期望(均值)E(X) (级数绝对收敛) (积分绝对收敛)方差D(X)=EX-E(X)2 =E(X2)-E(X)2 (级数绝对收敛) (积分绝对收敛)函数数学期望E(Y)=Eg(X) (级数绝对收敛) (积分绝对收敛)标准差s(X)=D(X) .二.数学期望与方差的性质1. c为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y为任意随机变量时, E (XY)=E(X)E(Y)
15、.3. X与Y相互独立时, E(XY)=E(X)E(Y) , D(XY)=D(X)+D(Y) .4. D(X) = 0 PX = C=1 ,C为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X (0-1)分布PX=1= p (0p1) p p (1- p)2.X b (n,p) (0p1) n p n p (1- p)3.X p(l) l l4.X U(a,b) (a+b)/2 (b-a) 2/125.X服从参数为q的指数分布 q q26.X N (m,s2) m s2四.矩的概念随机变量X的k阶(原点)矩E(X k ) k=1,2,随机变量X的k阶中心矩EX-E(X) k随机
16、变量X和Y的k+l阶混合矩E(X kY l) l=1,2,随机变量X和Y的k+l阶混合中心矩EX-E(X) k Y-E(Y) l 第六章 样本和抽样分布一.基本概念总体X即随机变量X ; 样本X1 ,X2 ,X n是与总体同分布且相互独立的随机变量;样本值x1 ,x2 ,x n为实数;n是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值 样本方差 样本标准差S样本k阶矩( k=1,2,) 样本k阶中心矩( k=1,2,)二.抽样分布 即统计量的分布1.的分布 不论总体X服从什么分布, E () = E(X) , D () = D(X) / n .特别,若X N (m,s2 )
17、 ,则 N (m, s2 /n) .2.c2分布 (1)定义 若XN (0,1 ) ,则Y = c2(n)自由度为n的c2分布.(2)性质 若Y c2(n),则E(Y) = n , D(Y) = 2n .若Y1 c2(n1) Y2 c2(n2) ,则Y1+Y2 c2(n1 + n2).若X N (m,s2 ), 则 c2(n-1),且与S2相互独立. (3)分位点 若Y c2(n),0 a 1 ,则满足 的点分别称为c2分布的上、下、双侧a分位点. 3. t分布(1)定义 若XN (0,1 ),Y c2 (n),且X,Y相互独立,则t=t(n)自由度为n的t分布.(2)性质n时,t分布的极限为
18、标准正态分布.XN (m,s2 )时, t (n-1) .两个正态总体 相互独立的样本 样本均值 样本方差X N (m1,s12 ) 且s12=s22=s2 X1 ,X2 ,X n1 S12Y N (m2,s22 ) Y1 ,Y2 ,Y n2 S22则 t (n1+n2-2) , 其中 (3)分位点 若t t (n) ,0 a1 , 则满足的点分别称t分布的上、下、双侧a分位点. 注意: t 1- a (n) = - t a (n).4.F分布 (1)定义 若Uc2(n1), V c2(n2), 且U,V 相互独立,则F =F(n1,n 2)自由度为(n1,n2)的F分布.(2)性质(条件同3
19、.(2) F(n1-1,n2-1)(3)分位点 若F F(n1,n2) ,0 a 1,则满足的点分别称为F分布的上、下、双侧a分位点. 注意: 第七章 参数估计一.点估计 总体X的分布中有k个待估参数q1, q2, qk.X1 ,X2 ,X n是X的一个样本, x1 ,x2 ,x n是样本值.1.矩估计法先求总体矩解此方程组,得到,以样本矩Al取代总体矩m l ( l=1,2,k)得到矩估计量,若代入样本值则得到矩估计值.2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, q1, q2, qk),称样本X1 ,X2 ,X n的联合分布为似然函数.取使似然函数达到最大值的,称为
20、参数q1, q2,qk的最大似然估计值,代入样本得到最大似然估计量. 若L(q1, q2, qk)关于q1, q2, qk可微,则一般可由似然方程组 或 对数似然方程组 (i =1,2,k) 求出最大似然估计.3.估计量的标准(1) 无偏性 若E()=q,则估计量称为参数q的无偏估计量.不论总体X服从什么分布, E ()= E(X) , E(S2)=D(X), E(Ak)=mk=E(Xk),即样本均值, 样本方差S2,样本k阶矩Ak分别是总体均值E(X),方差D(X),总体k阶矩mk的无偏估计, (2)有效性 若E(1 )=E(2)= q, 而D(1) D(2), 则称估计量1比2有效.(3)
21、一致性(相合性) 若n时,则称估计量是参数q的相合估计量.二.区间估计1.求参数q的置信水平为1-a的双侧置信区间的步骤(1)寻找样本函数W=W(X1 ,X2 ,X n,q),其中只有一个待估参数q未知,且其分布完全确定.(2)利用双侧a分位点找出W的区间(a,b),使PaW b=1-a.(3)由不等式aWb解出则区间()为所求.2.单个正态总体待估参数 其它参数 W及其分布 置信区间m s2已知 N (0,1) ()m s2未知 t (n-1) s2 m未知 c2(n-1) 3.两个正态总体 (1)均值差m 1-m 2 其它参数 W及其分布 置信区间 N(0,1) t(n1+n2-2) 其中Sw等符号的意义见第六章二. 3 (2).(2) m 1,m 2未知, W= F(n1-1,n2-1),方差比s12/s22的置信区间为 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标a/2改为a,另外的下(上)限取为- ()即可. 12