第七章概率与概率分布.docx
- 文档编号:24975989
- 上传时间:2023-06-03
- 格式:DOCX
- 页数:28
- 大小:140.08KB
第七章概率与概率分布.docx
《第七章概率与概率分布.docx》由会员分享,可在线阅读,更多相关《第七章概率与概率分布.docx(28页珍藏版)》请在冰豆网上搜索。
第七章概率与概率分布
第三章概率与概率分布
3.1随机事件与概率
3.1.1样本空间与随机事件
随机现象:
自然现象和社会现象有许多,但按对结果的观察可分为必然现象与随机现象。
我们把在一定条件(条件组)下,每次观察都得到相同结果(必然发生),叫必然现象。
如“水在1000C时一定沸腾”,“早晨,太阳必然从东方升起”,“一棵石子掷到河中,必然要沉到河底”。
我们把在相同条件(条件组)下重复进行,试验的可能结果不止一个,试验前无法预料哪一个结果出现的现象叫随机现象。
如“掷一枚硬币,得到正面或反面”,“从一批产品中抽取一件,抽到正品或次品”,
“用枪射击一只鸟,鸟被击中”等。
曾有某个知名物理学家提出,只要事件发生的条件组给得十分充分,偶然、随机事件也是一种必然事件。
如掷硬币时把受力的方向、空气的阻力计算清楚,可知结果朝向;从袋中抽球、或抽取产品朝某个方向、排在第几位置的产品或球,则可知道抽得球的颜色或产品的等级。
但是,从现实和应用的角度来看,事件发生的条件不可能知道齐备,例如,对未来发生的事情,难以预知。
如买一张彩票,是否中奖;
“某地区明天的用电量在1500兆瓦与1600兆瓦之间”,难以预料,所以随机现象的研究是有意义的。
概率论与统计学就是研究随机现象的统计规律性的科学。
随机试验:
为了研究随机现象,我们要对随机现象进行观察,我们把对随机现象进行一次观察,叫做一次随机试验。
基本事件:
在随机试验中,它的的每一个最简单不能分解的观察结果称为基本随机事件,简称基本事件,对应于由基本事件组合而成的事件称复合事件。
样本空间:
用集合论的观点来描述随机事件,若将每一个基本随机事件用一个样本点表示,所有样本点的集合,即所有基本随机事件的集合,称为样本空间。
例:
如掷一骰子,有6种可能的点数,S={1,2,3,4,5,6},{2},{4}为基本事件,A={2,4,6}即掷的偶数点事件,B为掷得点数大于等于3为复合事件。
例:
连续掷硬币两次,观测正、反面朝上的情况,令w1={正面,正面},w2={反面,正面},w3={正面,反面},w4={反面,反面},则
样本空间:
Ω={w1,w2,w3,w4}=({正面,正面},{反面,正面},{正面,反面},{反面,反面})
例:
你的一个同学约定在某天晚上7点到8点之间来你家作客,令w为“他来到你家的时间”,则:
Ω={w|19时<=w<=20时}。
3.1.2事件的概率
随机事件怎么描述?
它发生的可能性的测度用概率、隶属度、证据等描述。
进行随机试验时,有些是必然会发生的,称必然事件,P(S)=1。
有些是必然不会发生的,称不可能事件。
P(
)=0,但一般随机事件发生的可能性介于0与1之间。
将事件A发生的可能性称为事件A的概率。
概率有多种定义法:
1.概率的古典概型:
当样本空间的样本点总数为有限时,称为古典概率模型,简称古典概型。
定义3.1在古典概型中,事件A的概率为A所包含的基本事件个数m与样本空间中含的基本事件总数n的比值:
P(A)=事件A包含的基本事件个数/样本空间中含的基本事件总数=m/n
例3.1一箱产品共100件,其中有5件次品,从中任取一件,取到次品的概率是多少?
解:
A={1,2,3,4,5},S={1,2,…,100},
P(A)=5/100=0.05
例:
袋中有a只白球和b只黑球,我们采用有放回及不放回两种方式从中取出n个球,问恰好有k个黑球的概率各为多少?
设a=6,b=4,取出n=7只球,恰有k=3只黑球的概率.
解:
用A表示“取n=7个球中恰有k=3个黑球”的事件。
不放回抽取方式:
不放回时,基本事件总数为从a+b=10个球中随机取出n=7个的所有可能取法的种数
=
而n=7个中恰有k=3个黑球应有
种取法。
所以,事件A的概率为P(A)=
有放回抽取方式:
有放回地取球,就是取出一个球,记下它的颜色后再放回袋中,再取第二个,。
。
。
,这种方式,每次从中取一个球时都是从a+b个球中摸取,从a+b个球中摸取一个球有a+b种方法,取n次共(a+b)n种方法,故取n个球的所有可能取法为(a+b)n种。
分子:
从选取的n个球中选k个位置放黑球,有
种选法,对每一种这种选法,每一个黑球有b种选法,k个黑球有bk种选法,每一个白球有a种选法,n-k个白球有an-k种选法,所以,恰有k个黑球的取法为
bkan-k种取法。
所以,事件A的概率为:
P(A)=
=C
(
如把白球看作工厂生产的一批产品中的正品,黑球
例:
2.概率的统计概型:
(统计概率模型)在古典概型中,我们利用数样本点的方法,计算事件的概率。
但多数问题的样本空间有无限多个样本点,难以一一列出。
人们很容易想到用利用事件发生的实际频率来估计概率的方法。
随机事件有多种可能的结果,虽然每一种结果可能发生,可能不发生,但发生的可能性有大小,例如某个人某天骑自行车在街上与汽车相撞的可能性就很小。
若统计出事件发生的频率,则可近似这种事件发生的可能性。
设E为一随机试验,A为其中任一事件,在同一条件下,把E独立地重复n次,用nA表示事件A在这n次试验中出现的次数,比值:
fn(A)=
称为事件A在这n次试验中出现的频率。
在表3.1中,列举了历史上数学家掷硬币试验的数据
表3.1历史上数学家掷硬币试验的数据
---------------------------------------------------------------
试验者试验次数正面朝上次数正面朝上的频率
---------------------------------------------------------------------------------------------
520.4
50220.44
5002510.502
5002490.498
蒲丰404020480.5069
K.皮尔逊1200060190.5016
K.皮尔逊24000120120.5005
维尼30000149940.4998
----------------------------------------------------------------------------------------------
从上表中可看出,正面朝上次数稍多,正面朝上的频率逐渐趋于0.5:
0.5069,0.5016,0.50050.4998
例:
某种子发芽率。
从一大批种子做发芽试验,结果如表:
---------------------------------------------------------------------------------------------------------
种子粒数251070130310700150020003000
发芽粒数24960116282639133918062715
发芽率10.80.90.8570.8920.9100.9130.8930.9030.905
趋于0.9
---------------------------------------------------------------------------------------------------------
从上面例子中可以看出,当试验次数少时,频率变化较大;但当试验次数增大时,频率变得稳定。
因此我们有:
定义3.2在同一条件组下重复进行n次试验,当试验次数n充分大时,事件A发生的频率f(A)=
趋向于某一数值p,或稳定地在p值附近波动(0
p
1),则定义p为事件A发生的概率:
P(A)=p
这种定义方法为“代替准则”中的“频率代替”构造了基础,由于概率是频率的极限,所以在试验次数较大时,可以用频率代替概率或总体比例。
3.几何概型:
事件用几何区域表达的情形:
P(A)=
定义3.3面对不确定性,由个人判断某事件发生的可能性称为主观概率。
例3.2对某国经济地位
样本空间S={无变化,改善,恶化}
3.2概率的运算法则
3.2.1加法公式
事件间的关系:
1.和事件:
事件A与事件B中至少有一个发生,C=A+B
2.积事件:
事件A与事件B中同时发生,C=AB
3.差事件:
事件A发生但事件B不发生,C=A—B
4.互斥事件(互不相容事件):
事件A与事件B不可能同时发生,AB=φ
5.逆事件:
A+B是必然事件,A与B是互斥事件,A+B=S,AB=φ
事件的概率之间的关系:
性质1若AB=φ,则有:
P(A+B)=P(A)+P(B)
性质2A与B是互斥事件,A+B=S,AB=φ,用B=
表示,由加法公式:
1=P(S)=P(A+B)=P(A)+P(B)或
P(
)=1-P(A)
性质3概率加法公式(加法定理):
A、B是任意随机事件,则:
P(A+B)=P(A)+P(B)—P(AB)
例甲、乙两高射炮手,各自单独击中敌机的概率分别为0.8和0.6,求敌机被击中的概率。
解:
设A表示事件“甲击中敌机”,B表示事件“乙击中敌机”,C表示事件“敌机被击中”。
由题意有:
C=A∪B,所以:
P(C)=P(A∪B)=P(A)+P(B)-P(AB)=
=P(A)+P(B)-P(A)P(B)=0.8+0.6-0.48=0.92
即两个人打比一个人打更容易击中。
例3.4某企业职工中女职工占60%,管理人员占20%,从该企业职工中任选一人,是女职工或管理人员的概率是多少?
解:
令A表示女职工,B表示管理人员。
则:
P(A)=0.60,P(B)=0.20,
P(AB)=0.60×0.20=0.12,从该企业职工中任选一人,是女职工或管理人员的概率为:
P(A+B)=0.60+0.20—0.12=0.68
3.2.2乘法公式
1.条件概率
在许多情况下,我们需要研究某些事件出现时对另一事件所发生概率的影响,这就是条件概率。
我们以下列例子说明无条件概率和条件概率是不同的。
例如,两张足球票,十个人依次抽,每个人抽得足球票的无条件概率是
,但如果已知第一个人已经抽得一张足球票的情况下,第二个人抽得球票的概率为
,如果已知第一个人没有抽得足球票,第二个人抽得球票的概率为
。
定义3.5在已知随机事件B发生的条件下,A发生的概率称为A对于B的条件概率,用P(A|B)表示。
条件概率可以用乘法公式来计算。
2.乘法公式
可以验证:
P(A|B)=
称为乘法公式。
乘法公式的另一种写法:
P(AB)=P(B)P(A|B)
将A、B位置互换:
P(AB)=P(A)P(B|A)
3.独立性
若随机事件B的发生对A的发生没有影响,随机事件A的发生对B的发生没有影响,即P(A|B)=P(A)
P(AB)=P(B)P(A|B)=P(B)P(A)
定义3.6若A、B两个事件满足条件:
P(AB)=P(A)P(B)
称A与B相互独立。
例:
一盒产品中有8个正品,2个次品,第一次取出一个产品,检验后不再放回,再取第二次(称为不放回抽样),问两次都取得正品的概率是多少?
解:
设A表示“第一次取得正品”,B表示“第二次取得正品”,因为:
P(A)=
P(B|A)=
,
因为“两次都取得正品”就是事件AB,
P(AB)=P(A)P(B|A)=
4.全概率公式设事件A1,A2,…,Ak满足条件:
(1)A1,A2,…,Ak两两互斥,即AjAk=φ,
(2)A1+A2+…+Ak=S(全空间),
(满足这两个条件的事件组称为完备事件组。
)
则对于任一随机事件B有
P(B)=P(A1B)+P(A2B)+…+P(AkB)=
全概率公式通过完备事件组将样本空间分为许多较简单的类型,这样可以把较复杂的事件化为一些较简单的事件的和,便于计算。
例:
在对空演习中,某高射炮的目标是正在行进中的一架战斗机。
已知该炮能击中发动机、机舱及其它部位的概率分别是0.10,0.08,0.39,又若击中上述各部位而使飞机坠毁的概率分别是0.95,0.89,0.51,试求该炮任意发射的一炮弹使飞机坠毁的概率。
解:
设A1、A2、A3、A4分别表示炮弹击中发动机、机舱及其它部位以及不击中飞机的事件,B为飞机坠毁的事件。
由题设知:
P(A1)=0.10,P(A2)=0.08,P(A3)=0.39,P(A4)=0.43,
显然,A1、A2、A3、A4同时发生,是互斥事件,构成完备事件组,且:
P(B|A1)=0.95,P(B|A2)=0.89,P(B|A3)=0.51,P(B|A4)=0.0,
由全概率公式知:
P(B)=P(BΩ)=P(BA1+BA2+BA3+BA4)=P(BA1)+P(BA2)+P(BA3)+P(BA4)
=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)+P(A4)P(B|A4)
=0.10×0.95+0.08×0.89+0.39×0.51+0.43×0=0.3651,
例:
某企业有甲、乙、丙三个车间生产同一种产品,各车间的产量分别占全厂总产量的20%,30%,50%。
根据过去产品质量检验记录,知道甲、乙、丙车间的次品率分别为4%,3%,2%,从该厂产品中随机抽取一件为次品的概率是多少?
解:
令A1、A2、A3分别表示甲、乙、丙车间的产品,B表示产品为次品,则有
P(A1)=0.20,P(A2)=0.30,P(A3)=0.50,
P(B|A1)=0.04,P(B|A2)=0.03,P(B|A3)=0.02
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)=
3.3贝叶斯公式
若已知Ai发生时B发生的条件概率P(B|Ai),
要求B发生时Ai发生的条件概率P(Ai|B),则可以用以下贝叶斯公式:
P(Ai|B)=
=
=
P(Ai|B)=
例如,A1=“感冒”,A2=“肺炎”,A3=“鼻炎”,A4=“肝炎”,B=“头痛”,根据经验可以求出在患各种疾病情况下,有“头痛”症状的概率P(B|Ai),在这样的已知条件下,当某个病人有“头痛”症状时,要求他患各种疾病的概率。
例:
用血清甲胎蛋白法诊断肝癌,A=“诊断患有肝癌”,C=“患有肝癌”。
已知人群患有肝癌的概率为P(C)=0.0004,而P(A|C)=0.95,即只有百分五假阴性率,P(
)=0.90,即“实际不患肝癌”情况下用该检验法的结论也为“不患肝癌”的可能性为百分之九十,也即:
P(
)=0.10,正常人有百分之十被误诊,表面看此法很可靠。
求用该检验法诊断患有肝癌情况下,确实“患肝癌”的可能性。
解:
P(C|A)=
=
=
=
=
=0.0038
这一结果出乎意料,但仔细想,设某地有10000人去检查,约有4人患肝癌,有9996人不患肝癌,由于P(
)=0.10,误诊率百分之十,被误诊的人有:
9996×0.1=999.6人,总共被诊断为患有肝癌的人为1004人,所以有前结果。
例:
设某一工厂有A、B和C三个车间,它们生产同一种锣钉。
在整个工厂的产量中,三个车间的产量分别占25%,35%和40%。
如果在三个车间的产品中,次品数分别占该车间出产量的5%,4%和2%。
试求从全厂总产品中抽到一个次品,它恰好是车间A(B或C)生产的概率。
解:
设M表示“抽到的一个锣钉是次品”这一事件,D1表示“抽到的锣钉属于A车间”,D2表示“抽到的锣钉属于B车间”,D3表示“抽到的锣钉属于C车间”。
按题目条件有:
P(D1)=25/100,P(D2)=35/100,P(D3)=40/100,
P{M|D1}=5/100,P{M|D2}=4/100,P{M|D3}=2/100,
根据贝叶斯公式,
P{D1|M}=
=
=25/69
P{D2|M}=
=
=28/69
P{D3|M}=
=
=16/69
这一次品是由B车间生产的可能性最大,由C车间生产的可能性最小。
3.4随机变量及其分布
3.4.1随机变量
我们引入了样本空间和样本点的概念,用以描述随机事件,基本随机事件用单个样本点表示,复杂复合随机事件用样本点的集合来表示。
但是,这些表达方法虽然对随机事件的刻画严格化,具体化,但量化程度还不够,还不能象函数关系那样,在坐标平面上加以刻画。
为此,我们将每一个样本点与一个实数相对应,这个定义在样本空间上的样本点的函数我们称为随机变量。
随机变量是对随机现象、随机事件的量化描述,根据随机现象、随机事件的特点,量化过程可以分为两类:
(1)一类是可以直接用数量描述或比较容易用数量描述,如电池的使用寿命、灯泡的使用寿命、某一零件的直径、长度等,随机变量可直接等于这个变量。
(2)随机事件的结果本身与数量无关或不易直接用数量描述,例如用户对某一新产品的态度,有非常欢迎、比较欢迎、一般、比较不欢迎、不欢迎等几种,可规定
设一个箱子内有红、黄、兰、黑、白五种球,随便摸一个,可规定:
3.4.2密度函数
在前面我们讨论次数分布的直方图、折线图、曲线图,这些在概率论中叫密度函数。
例:
某公司聘用50名营业员,下表是过去一年营业员所获得的新顾客数目,
xixii的频数xii的频率
011/50
122/50
244/50
333/50
466/50
588/50
61010/50
777/50
855/50
933/50
1011/50
可画出概率分布图:
(P88)
概率
┃
10/50┃
9/50┃
8/50┃
7/50┃
6/50┃
5/50┃
4/50┃
3/50┃
2/50┃
1/50┃┃┃┃┃┃┃┃┃┃┃┃
┗━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻━┻
012345678910
新顾客数
推广次数分布,我们提出密度函数的概念。
密度函数是描述随机变量取哪些值、和以多大的可能性取这些值,如离散型随机变量,指出它取离散可能值的可能性:
P(
=xi)=pi,i=1,2,…,k,…
取其它值的可能性为0。
称
f(x)=
(3.12)
把(3.12)式称为离散型随机变量X的密度函数、概率函数,当只有有限多个可能值时称分布列。
例3.9十件同一类型的产品中,有2件次品,任取2件,取2件中的次品数为随机变量,用
表示,则
可取0,1,2三个值,容易计算:
P(
=0)=
P(
=1)=
P(
=2)=
于是,写成分布列形式:
----------------------------------------------------------------------------
=012
-----------------------------------------------------------------------------
pi
------------------------------------------------------------------------------
3.4.3离散型随机变量的分布密度
1.两点分布
随机试验的结果多种多样,单有一种随机现象只有两个结果。
如置硬币,正面或反面;打比赛,失败或赢得;打一只鸟,打中或打不中;进行试验的结果,成功或失败;抽查一件产品,结果是正品或废品;有些试验的结果不止一个,例如电子管的寿命,当寿命大于500小时时是合格品,当寿命小于500小时时是废品;股票的价格变化有多种,但有上升和下跌两种情况。
只有两种可能结果的随机试验叫贝努里试验,这种随机事件叫贝努里概型。
贝努里概型可以用具有两点分布的随机变量来描述。
分别用“1”和“0”表示两种可能性,如:
X=
则分布密度为:
P(X=x)=
2.二项分布
当贝努里试验重复进行时,形成二项分布。
如抽查n件产品,每一件可能合格或不合格,总共有k件不合格。
在人寿保险中,某一人群的死亡率。
n个射手同时射击,有k人射中的概率。
9台车床有7台运行2台停机的概率。
n个两点分布的随机变量之和称为二项分布。
例:
某连锁总店每天向n=4家商店供应货物,每家商店订货与否是相互独立的,且每家商店订货的概率皆为p=0.4,求n=4家商店中订货商店家数的概率分布。
解:
q=1-0.4=0.6,为每家商店不订货的概率.
(1)4家分店都不订货:
qqqq=(0.6)4
(2)仅有1家分店订货的概率:
pqqq=0.4(0.6)3,qpqq=0.4(0.6)3,
qqpq=0.4(0.6)3qqqp=0.4(0.6)3共4种情况,概率为
pq4-1
(3)恰有2家分店订货的概率:
ppqq=(0.4)2(0.6)2pqpq=(0.4)2(0.6)2
pqqp=(0.4)2(0.6)2,qppq=(0.4)2(0.6)2,qpqp=(0.4)2(0.6)2,qqpp=(0.4)2(0.6)2
共6种情况,概率为
p2q4-2
(4)恰有3家分店订货的概率:
pppq=(0.4)3(0.6),ppqp=(0.4)3(0.6),pqpp=(0.4)3(0.6),qppp=(0.4)3(0.6)共4种情况,概率为
p4-1q
(5)4家分店订货的概率,pppp仅1种情况,概率为
p4q4-4
综合以上5种情况,用X表示订货分店数,则:
p(X=0)=
p0q4-0,p(X=1)=
p1q4-1,p(X=2)=
p2q4-2,
p(X=3)=
p3q4-3,p(X=4)=
p4q4-4,
分布律为:
p(X=x)=
pxq4-x,
------------------------------------------------------------------------------------------------
x01234
P
p0q4-0,
p1q4-1,
p2q4
p3q4-3,
p4q4-4,
-------------------------------------------------------------------------------------------------
3.4.4.连续型随机变量的分布密度
若存在非负的可积函数f(x),使得对于任何x
有
P(
则称f(x)为随机变量 的密度函数. 可以用密度函数的积分表示出随机变量落入任何一个区间的概率: P(x1<= 由于分布函数的值域仅位于[0,1]之间,太窄小。 密度函数用来刻画随机变量的特征比较方便,并且易于用数学表达式表达,计算起来也更加方便。 3.4.2分布函数 在研究次数分布时,我们引入了以下累计(向下累计)的概念,在概率论中以下累计对应于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 概率 分布