连续型随机变量及其分布.docx
- 文档编号:28440062
- 上传时间:2023-07-13
- 格式:DOCX
- 页数:12
- 大小:35.58KB
连续型随机变量及其分布.docx
《连续型随机变量及其分布.docx》由会员分享,可在线阅读,更多相关《连续型随机变量及其分布.docx(12页珍藏版)》请在冰豆网上搜索。
连续型随机变量及其分布
连续型随机变量及其分布
上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的
概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长
度,因为在理论上说这个长度的值X可以取区间(0,+?
)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如1.824cm)的事件{X=1.824}几乎是不可能的,应认为
P{X=1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机
变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.
28一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的
面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数.
1?
若x<0,因为事件{X?
x}是不可能事件,所以
F(x)=P{X?
x}=0.
2?
若0?
x?
2,由题意P{0?
X?
x}=kx2,k是常数,为了确定k的值,取x=2,有P{0
22?
X?
2}=2k,但事件{0?
X?
2}是必然事件,故P{0?
X?
2}=1,即2k=1,所以k=1/4,即
2P{0?
X?
x}=x/4.
于是
2F(x)=P{X?
x}=P{X<0}+P{0?
X?
x}=x/4.
3?
若x?
2,由于{X?
2}是必然事件,于是
F(x)=P{X?
x}=1.
综上所述
0,x,0,,
12F(x)=x,0,x,2,,4,1,x,2,,
它的图形是一条连续曲线如图2,2所示.
图2,2
另外,容易看到本例中X的分布函数F(x)还可写成如下形式:
xF(x)=f(t)dt,,,,
1,,t,0,t,2,其中f(t)=,2,0,其他.,
这就是说F(x)恰好是非负函数f(t)在区间(,?
,x]上的积分,这种随机变量X我们称为连续型随机变量.一般地有如下定义.
23若对随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有
xF(x)=f(t)dx,(2.8),,,
则称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称概率密度或密度函数
1
(Densityfunction).
由(2.8)式知道连续型随机变量X的分布函数F(x)是连续函数.由分布函数的性质F(,?
)=0,F(+?
)=1及F(x)单调不减,知F(x)是一条位于直线y=0与y=1之间的单调不减的连续(但不一定光滑)曲线.
由定义2.3知道,f(x)具有以下性质:
1?
f(x)?
0;
,,2?
=1;f(x)dx,,,
x23?
P{x<X?
x}=F(x),F(x)=(x?
x);f(x)dx122112,x1
4?
若f(x)在x点处连续,则有F′(x)=f(x).
由2?
知道,介于曲线y=f(x)与y=0之间的面积为1.由3?
知道,X落在区间(x,1x]的概率P{x<X?
x}等于区间(x,x]上曲线y=f(x)之下的曲边梯形面积.由4?
知21212
道,f(x)的连续点x处有
F(x,,x),F(x)P{x,X,x,,x}f(x)=,.limlim,,,x,x,x,0,x,0
这种形式恰与物理学中线密度定义相类似,这也正是为什么称f(x)为概率密度的原因.同样我们也指出,反过来,任一满足以上1?
、2?
两个性质的函数f(x),一定可以作为某个连续型随机变量的密度函数.
前面我们曾指出对连续型随机变量X而言它取任一特定值a的概率为零,即P{X=a}=0,事实上,令Δx>0,设X的分布函数为F(x),则由
{X=a},{a,Δx<X?
a},
得0?
P{X=a}?
P{a,Δx<X?
a}=F(a),F(a,Δx).由于F(x)连续,所以F(a,,x)=F(a).lim,x,0
当Δx?
0时,由夹逼定理得
P{X=a}=0,
由此很容易推导出
P{a?
X<b}=P{a<X?
b}=P{a?
X?
b}=P{a<X<b}.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X=a}“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”
而不是不可能事件.
2.9设连续型随机变量X的分布函数为
0,,0,x,F(x)=2,,0,,1,Axx,
1,,1.x,
试求:
(1)系数A;
(2)X落在区间(0.3,0.7)内的概率;
(3)X的密度函数.
(1)由于X为连续型随机变量,故F(x)是连续函数,因此有
2
2F(x),Ax1=F
(1)==A,limlim1010x,,x,,
即A=1,于是有
0,,0,x,2,F(x)=,0,,1,xx,
1,,1.x,
22
(2)P{0.3 (3)X的密度函数为 2x,0,x,1;,f(x)=F′(x)=,0,其他., 由定义2.3知,改变密度函数f(x)在个别点的函数值,不影响分布函数F(x)的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x=0或x=1上f(x)的值). 2.10设随机变量X具有密度函数 kx,0,x,3,, xf(x)=2,,3,x,4,,2,0,其他., 7 (1)确定常数k; (2)求X的分布函数F(x);(3)求P{1 }.2 (1)由f(x)dx=1,得,,, 34x=1,kxdx,(2,)dx,,032 解得k=1/6,故X的密度函数为 x,,0,x,3,,6,x,f(x)=2,,3,x,4,,2,0,其他., , x (2)当x<0时,F(x)=P{X? x}=f(t)dt=0;,,, 2xx0xtx当0? x<3时,F(x)=P{X? x}=t,f(t)dtf(t)dt,f(t)dt==;d0,,,,,,,,0612 x03x当3? x<4时,F(x)=P{X? x}=f(t)dtftdtftdtftdt()()(),,=,,,,03,,,, 2x3ttx=dtdtx,,,,,, (2)23;,,03624 3 x034x当x? 4时,F(x)=P{X? x}==f(t)dtf(t)dt,f(t)dt,f(t)dt,f(t)dt,,,,,,,,,034 34tt==1.dt,(2,)dt,,0362 即 0,x,0,,2,x,0,x,3,,,F(x)=12,2x,,,2x,3,3,x,4,,4 1,x,4., (3)P{1 7/2}=F(7/2),F (1)=41/48. 下面介绍三种常见的连续型随机变量. (1)均匀分布 若连续型随机变量X具有概率密度 1,f(x)=,,a,x,b,(2.9),b,a 0,其他., 则称X在区间(a,b)上服从均匀分布(Uniformdistribution),记为X~U(a,b).易知f(x)? 0 b1且=1.f(x)dx,dx,,,,a,ba 由(2.9)可得 a1? P{X? b}=0dx0dx=0,P{X? a}==0,,,b,, 即P{a b},P{X? a}=1; 2? 若a? c b,则 d1d,cP{c 因此,在区间(a,b)上服从均匀分布的随机变量X的物理意义是: X以概率1在区间(a,b)内取值,而以概率0在区间(a,b)以外取值,并且X值落入(a,b)中任一子区间(c,d) 中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X的分布函数为 0,x,a,, x,aF(x)=(2.10),a,x,b,,b,a,1,x,b., 密度函数f(x)和分布函数F(x)的图形分别如图2,3和图2,4所示. 4 图2,3图2,4 在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X,一般可以看作是一个服从在[,0.5,0.5]上的均匀分布的随机变量;又如在(a,b)中随机掷质点,则该质点的 坐标X一般也可看作是一个服从在(a,b)上的均匀分布的随机变量. 211某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时 间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率. 设乘客于7时过X分钟到达车站,由于X在[0,30]上服从均匀分布,即有 1,f(x)=,,0,x,30,,30 0,其他., 显然,只有乘客在7? 10到7? 15之间或7? 25到7? 30之间到达车站时,他(或她) 等车的时间才少于5分钟,因此所求概率为 153011P{10<X? 15}+P{25<X? 30}==1/3.dx,dx,,10253030 (2)指数分布 若随机变量X的密度函数为 ,x,,e,x,0,f(x)=(2.11),0,x0.,, 其中λ>0为常数,则称X服从参数为λ的指数分布(Exponentiallydistribution),记作X~E(λ). ,,,x显然f(x)? 0,且f(x)dx,,edx=1.,,,,0 容易得到X的分布函数为 ,x,1,e,x,0,F(x)=,0,x0.,, 指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s,t>0,有 P{X>s+t|X>s}=P{X>t}.(2.12) 如果用X表示某一元件的寿命,那么上式表明,在已知元件已使用了s小时的条件下,它还能再使用至少t小时的概率,与从开始使用时算起它至少能使用t小时的概率相等.这就是说元件对它已使用过s小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但 “无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很 小,在这一阶段,指数分布比较确切地描述了其寿命分布情况. (2.12)式是容易证明的.事实上, PXsXstPXst{,}{},,,,,PXstXs{},,,,,PXsPXs{}{},,,,,()st1()e,,Fst,t,,,,,,e{}.PXtλs-1()e,Fs (3)正态分布 若连续型随机变量X的概率密度为 5 2(,)x,1,22,ef(x)=,,? <x<+? ,(2.13),2π 其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布(Normaldistribution), x,u2记为X~N(μ,σ).显然f(x)? 0,下面来证明f(x)dx=1.令=t,得到,,,, 22(,),xt,,,,121,22edx,edt.,,,,,,,2π2π 222tts,,,,,,222记I=,则有I=.edtedtds,,,,,,,,, 作极坐标变换: s=rcosθ,t=rsinθ,得到 2r2π,,22I=,redrd,,2π,,,,0 而I>0,故有I=2π,即有 2t,,2edt,2π.,,, 于是 2x,(,),,1122,edx,,2π,1.,,,22π,, 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从 或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别 因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身 高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布. 参数μ,σ的意义将在第四章中说明.f(x)的图形如图2,5所示,它具有如下性质: 图2,5图2,6 1? 曲线关于x=μ对称; 2? 曲线在x=μ处取到最大值,x离μ越远,f(x)值越小.这表明对于同样长度的区间, 6 当区间离μ越远,X落在这个区间上的概率越小; 3? 曲线在μ? σ处有拐点; 4? 曲线以x轴为渐近线; 5? 若固定μ,当σ越小时图形越尖陡(图2,6),因而X落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数.由(2.13)式得X的分布函数 2t(,,),x12F(x)=,2.(2.14)edt,-,2π, 特别地,当,=0,,=1时,称X服从标准正态分布N(0,1),其概率密度和分布函数分别用,,x,表示,即有,(x), 2x,12,(2.15),(x),e2π 2t,x12,,x,,.(2.16)edt,,,2π 易知,,(,x)=1,,(x). 人们已事先编制了,(x)的函数值表(见本书附录). X,,2一般地,若X~N(,,,),则有~N(0,1)., X,,事实上,Z=的分布函数为, X,,P{Z? x}==P{X? +,x}P{,x}, 2t,(,),,x,,122,=edt,,,,2π, t,,令=s,得, 2s,x12P{Z? x}=eds=,(x),,,,2π X,,由此知Z=~N(0,1).,2因此,若X~N(,,,),则可利用标准正态分布函数,(x),通过查表求得X落在任一区间(x,x]内的概率,即12 ,,,,,xXx,,12P{x,,P x}=12,,,,,,, ,,,,,,,XxXx,,,,21=,,,PP,,,,,,,,,,,, 7 ,x,x,,,,,21,,,=.,,,,,,,,,, 例如,设X~N(1.5,4),可得 1,1.5X,1.52,1.5,,P{,1? X? 2}=P,,,,222,, =Φ(0.25),Φ(,1.25) =Φ(0.25),[1,Φ(1.25)] =0.5987,1+0.8944=0.4931. 2设X~N(,,,),由,(x)函数表可得 P{μ,σ (1),Φ(,1)=2Φ (1),1=0.6826, P{μ,2σ (2),Φ(,2)=0.9544, P{μ,3σ 我们看到,尽管正态变量的取值范围是(,? ? ),但它的值落在(,,3,,,+3,)内几乎是肯定的事,因此在实际问题中,基本上可以认为有|X,,|<3σ.这就是人们所说的“3,原则”. 212公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的. 2设男子身高X服从,=170(cm),,=6(cm)的正态分布,即X~N(170,6),问车门高度应如何确定? 设车门高度为h(cm),按设计要求P{X? h}? 0.01或P{X<h}? 0.99,因为X~N(170,26),故 X,170h,170h,170,,,,P{X<h}=P,,,? 0.99,,,,,666,,,, 查表得,(2.33)=0.9901>0.99. h,170故取=2.33,即h=184.设计车门高度为184(cm)时,可使成年男子与车门碰6 头的机会不超过1%. 2.13测量到某一目标的距离时发生的随机误差X(单位: 米)具有密度函数 2x,(20),1f(x)=3200.e402π 试求在三次测量中至少有一次误差的绝对值不超过30米的概率. X的密度函数为 22x(,20)x(,20),,112f(x)=32002,40ee,,402π402π, 2即X~N(20,40),故一次测量中随机误差的绝对值不超过30米的概率为 30,20,30,20,,,,P{|X|? 30}=P{,30? X? 30}=,,,,,,,4040,,,, =Φ(0.25),Φ(,1.25)=0.5981,(1,0.8944)=0.4931. 设Y为三次测量中误差的绝对值不超过30米的次数,则Y服从二项分布b(3,0.4931),故 P{Y? 1}=1,P{Y=0}=1,(0.5069)3=0.8698. 8 为了便于今后应用,对于标准正态变量,我们引入了,分位点的定义. 设X~N(0,1),若z满足条件, P{X>z}=,,0<,<1,(2.17), 则称点z为标准正态分布的上,分位点,例如,由查表可得z=1.645,z=3.16.故1.645与,0.050.0013.16分别是标准正态分布的上0.05分位点与上0.001分位点. 分享源源不断 9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 连续 随机变量 及其 分布