概率统计常见题型及方法总结.docx
- 文档编号:6371220
- 上传时间:2023-01-05
- 格式:DOCX
- 页数:25
- 大小:210.84KB
概率统计常见题型及方法总结.docx
《概率统计常见题型及方法总结.docx》由会员分享,可在线阅读,更多相关《概率统计常见题型及方法总结.docx(25页珍藏版)》请在冰豆网上搜索。
概率统计常见题型及方法总结
常见大题:
1.全概率公式与贝叶斯公式问题
B瞧做“结果”,有多个“原因或者条件”可以导致B这个
“结果”发生,考虑结果B发生得概率,或者求在B发生得
条件下,源于某个原因得概率问题全概率公式:
贝叶斯公式:
分〉对以往的数据分析结果农明当机器调整得良好时,产鼎的合格率为90%鷲巴警生某故障时,其合格率为30%。
每天早上机器开动时,机器调幣良’警貲为75%。
已知某犬早上第■件产甜是合格品,试求机器调整得良好的概率疋多少?
・(12分)今有四个口袋,它们就是甲、乙、丙、丁,每个口袋中都装有只红球与只白球。
先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球得槪率为多少?
解表示从第个口袋放入第个口袋红
球,
表示从第个口袋中任取一个球为红球,
2分
则
2分
2分
依
次
类
推
2分
二(10分)袋中装有只正品硬币,只次品硬币(次品硬币得两而均印有国徽),在袋中任取一只,将它投掷次,已知每次都出现国徽,问这只硬币就是次品得概率为多少?
、解记曰取到次品},二{取到正品},={将硬币投掷次每次都出现国徽}
则,,一一5分
・■…xl
pl£(4)=▲严厂\八了-=JIIT=
17P(B)P(A\B)+P(B)P(小B)+丄2rn+m
m+nm+n2r
三、(1o分)一批产品共100#,其中有4件次品,其余皆为正品。
现在每次从中任取一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。
在检验时,一件正品被误判为次品得概率为0>05,而一件次品被误判为正品得概率为0.Ole
(1)求任取一件产品被检验为正品得概率;
(2)求这批产品被检验为合格品得概率。
解设表示“任取一件产品被检验为正品”,表示“任取一件产品就是正品”,则
99>
(1)由全概率公式得
(2)这批产品被检验为合格品得概率为
四、在电报通讯中不断发出信号O与T,统计资料表明,发出O与T得概率分别为0.6与0。
4,由于存在干扰,发出'0时,分别以概率0。
7与0。
1接收到・0与T,以0、2得概率收为模糊信号,-;发出T时,分别以概率0、85与0、05收到T与©,以概率0。
1收到模糊信号
(D求收到模糊信号得概率;
(2)当收到模糊信号时,以译成哪个信号为好?
为什么?
解设二“发出信号”,二“收到信号”、由题意知
(D由全概率公式得
4分
o
(2)由贝叶斯公式得
3分
3分
二、随机变量函数得分布及其边缘密度及其独立性得判断记住如下知识占:
八、、常见分布律与概率密度:
I-(0—1)分布一&
-o-1
A
1PP
P{X=k)=/(!
・=0丄(0sV1).
2.X〜b(mp).P{X=k}=C:
pq^Xk=0丨2…/
(2>0)
P(X-k}—i尸一02
4•均匀分布
5.X〜E⑵
x>0
x<0
\JL|/
6.正态分布X〜N(W)
1宰
念)二~T=^e",
J2tt0
曲线尖于X二“对称,i
3•泊松分布
P5Ll・h X〜叫b\ xVxV+OCa/2tt X〜N(0: 1) 0(x)=/(x)=]Q2, 般正态分布得计算转化为标准正态分布去做: ]Xf〜 ®(x)=j(p^dt-ifj工2at—oc —oc 结论 1若X〜则它的分布函数可以写成 Fv(x)二P{X 'aa 2若X〜N3届丫=-〜N(0,1) a P(a (7(7 不丄一“、“ci」]、二0(—)-0(—) acr 二、分布函数的性质F(x)=P{X 离散型连续型 0 F(-x)二0? F(+oo)二1 单调不减性 右连续性连续性 P{X=a}=F(a)-F{a一0)P{X二q}二0 连续随机变〔RX: F(x)二P(X 概率密度的性质 1)非负性幷兀丿>02)归一性(f{x)dx二1 J-乂 二维随机变量得分布函数: ・OSF(x』)S1,且 对任意固定的ye7? ,F(・co』)二0・ 对任意固定的xeR,F(x,-co)=0, F(-J-QO)=0,F(+oo,+oo)二1• 3.F尖于x』右连续,即 F(x』)=F(兀+0』),F(x』)二尸(兀? +0) F(x・y)尖于右连续,即 F)-F(x+0,yyF(xfy)=F(x,y+0) 联合密度: F(xj)=P{X J-oCJ-oC P{(x.Y)eG}=]]f{x,y)dxdy, G 的性质: ①/(x」)no (2)/{x.y^xdy=1 J—cJ―e (4)边缘分布函数 Fx(x)=F(x,+8)Fy(y)二尸(+8,刃 (5)边缘分布律 □c P{X=xi}=^Pij=Pi. 丿=1 P{Y=yj}=tPu=P.j (6)边缘密度函数i fxM=rf(xfy)dy J-8 f? (y)^\_J(^>y)dx 三、分布律和概率密度函数的性质 禺散型 ZA=1k P{XeS}iP, 连续型 AV>o f/(x)dv=1s rb P{a swSF{x,y)=Fx(x)Fy(y) 1•若(X,y)是离散型随机变量,则x与y相互独立的充分必要条件 曰• 疋■ I Pij二Pi.P.j口“,2,… “•若(是连续型随机变量,则x与y相互独立的充分必要条件是; /(A-,V)=Zy(aOA(v) 掌握如下解决随机变量函数分布得解题方法: 连续型随机变量的函数的分布 I•分布函数法(一般的函数都适用重点掌握) (1)先求r=g(x)的分布函数拆心), £O)=P{Y F,I(y)=^f.^lx (2)再利用Y=的分布函数与概率密度之用的尖系求Y=g(X) 的概率密度为厶(刃二打(对 对于二维随机变量函数得概率密度,注意: 除了求随机变量 Z=X+Y得密度函数用公式: /z(z)二匚/(X,z・x)dx二匚—y,y)dy 注意: 先写出联合密度: ,根据联合密度写出A 或者5 在平面xOz或者yOz上画出被积函数不为零得区域,然后穿线通过区域确定x得上下限。 她得函数g(x,Y)得概率密度,只能使用分布函数法 其步骤如下: 第一步求联合密度「根据联合密度写出或者 第二步求见得分布函数: 难点就是画出二重积分得积分区域,然后把二重积分化为二次积分定 上下限, 画图: 先画出被积函数也就就是联合密度非零得区域,再确定区域密度非零区域得重合区域就就是二重积分得积分区域,穿线定积分限: 然后左右穿或者上下穿个积分区域定内限,求出分布函数第三步求密度函数: 分析: 一、设总体服从上得均匀分布,就是来自总体得一个样本,最大顺序统HM, 1・求随机变量得概率密度; 解: ,其分布函数为 而得分布函数为 二、(10分)设二维随机变量得概率密度为 (1)求常数得值; (2)求与得协方差。 解⑴由,得 (2)E(X)=匚匚寸(x,y)dxdy=J(: 则;xe'vdx=层W心二 E(XY)=匚匚对(x.y)dxdy=J: dy[=J|y'e^dy E(Y)=匚匸Wa,y)dxdy==J*ye^dy=2 三(16分)设二变量得概率密度为 当WO时,二0,于就是二0当〉0时,二, 所以得边缘概率密度为二 得边缘概率密度 当WO时,二0 当〉0时二 ⑶ 4分 ⑶ 三、(io分)设二维随机变s(A3y)的概率密度为 1」刃<工,0vxv1, 0,其它. 求边缘密度办(X)及条件概率P(y>0%<1/2)。 四(10分)设随机变量得概率密度为求随机变量得分布函数。 当时, 当时, 所以得分布函数为 3•中心极限定理得问题: 用正态分布近似计算共两类: 一类就是二项分布得近似计算问题 即 这个公式给出了n较大时二项分布得概率计算方法。 另一类就是除二项分布之外得其她分布得独立变量连加与得计算问题, 设独立同分布,E(XJ二“刃朮丿"〉0T2•••: • 近似有连加与服从正态分布: 一、(14分)设粮仓内老鼠得数目就是一个服从泊松分布得随机变量,且仓内无鼠得概率为。 (1)写出随机变量得分布律; ⑵试用中心极限定理讣算,在200个同类粮仓内老鼠总数超过350只得概率。 解⑴;5分 (2)表示任意老鼠个数,由中心极限定理 3分 3分 3分 二、(10分)某保险公司多年得统计资料表明.在索赔户中被盗索赔户占20%,以表示在随意抽 査得100个索赔户中因被盗而向保险公司索赔得数、 (D写出得概率分布; (2)求被盗索赔户不少于14户且不多于30戸得概率得近似值、 〔解〕⑴, ♦ ⑵, 根据棣莫佛一拉普拉斯中心极限立理 三(10分)某银行得柜台替每一位顾客得服务时间(单位: 分钟)服从参数得指数分布,且各位顾客得服务时间就是相互独立得,试用中心极限定理计算,对100位顾客得总服务时间不超过240分钟得概率。 解设分别表示每一位顾客得服务时间,则它们相互独立相同分布,且 (100 loo工X,100x2240100x? P(工X-S240)=PI_二二a0>⑵二0.9772 #100x4v100x4 点估计得问题: 矩估计与似然估计 □极大似然估计法 统计原理: 一次试验就出现的事件有最大的概率 在某次抽样中,某事件发生了,可以认为该事件发生 的概率最大。 似然函数得构造: 分布律为Pi二P(兀/),其中&未知。 n'■ =Ylpge9称为似然函数,) 9=1 5似然函数为 n 厶(&)二厶(每,…心;。 )二口/ (兀;0) 求极大值豎)二0或叫叽0 audu ad 得o.二maxZ(xp. <9eO;0) 注: 特殊的似 难点: 最大似然函数没有驻点的情况 曾"/0如"莎"初〃•剣"如"〃/夕沏夕加”//e"如"如。 〃丿”ff•切尽&Hf・"”//・/"和"//刀妙如妙的妙加〃如"如〃〃/"/〃丿片如"如片他厶 然函数通过求导得不到其最大,需要用极大似然估计的 思憩去做: 一般判断似然函数和参数的单调性,。 例题分析: -、设总体得概率密度为 就是未知参数,就是来自得样本, 1.求得矩估计虽: ; 矩估计法: ,令,二) 2.求得最大似然估计量; 3.判断,就是否为无偏估计 解: 最大似然估计法: 设为样本得观察值,则 似然函数为 按似然估计得思想,当似然函数尖于就是增函数,故。 得最大似然估计量为。 二(10分)设为样本,总体得概率密度为 求参数得最大似然估计量;问它就是否为得无偏估汁量解设就是相应得样本值,则似然函数为 无偏估计量 三、设就是总体得样本,得概率密度为 其中、求与得最大似然估计量。 设就是得样本值,则似然函数 9 当0时,,令 显然,第二个等式就是矛盾等式,所以由上述似然方程求不出与。 由于,这表明就是得严格递增函数,注意到0,因此当时最大.于就是与得最大似然估计值于就是与得最大似然估il鱼为 四、(10分)设总体”得概率密度为其中就是未知参数。 设为总体得样本。 (1)求参数得最大似然估计量; (2)判断就是否为得无偏估计量。 解 (1)设就是得观测值,则似然函数为 令,得,解得 得最大似然估计量为 (2)由于,就是得无偏估计量。 五(10分)设电池得寿命服从指数分布,其概率密度为 其中为未知参数.今随机抽取5只,测得寿命如下: 1150,1190,1310,1380,1420 求电池得平均寿命得最大似然估计值。 解似然函数,3分 3分 令得2分 2分 六、设总体X得概率密度为 其中就是未知参数、设为总体得样本。 求参数得矩估计疑 与最大似然估计量。 解矩估计 且,令 ,则 从而得矩估计量 最大似然估计 设就是得样本观测值,则似然函数为 O 取对数得, 令,得,解得, 所以,得最大似然估计量为、 七、、设总体得分布律为 >> 其中为未知参数。 现抽得一个样本”求参数得矩估计值与极大似然估计值、 解. 由,即•得参数得矩估计值为 (B)设总体X的数学期望为“,方差为它们祁设 TVAr*° (1)给出〃的一个估计呈,要求它既具有无偏性乂具有一致性,并说明理由;⑵给岀,的1个佔计量,要求它具有无徧性,并说明理由。 统计量得分布判断问题: 主要利用性质: 独立正态分布得线性组合还就是正态分布三大分布得定义: (一)尢~分布 I•定5C设*],兀2,…,兀,才目互独立,都刀艮从正态分布 2V((M),则称随机变量: 力2二荷+£+…+X, 所刀艮从白勺分布为自曲度为//的力'分布. 乍己为尢'〜才’(”) (1)设...,0相互独立,都服从 r 正态分布N则才二・T工理-“)'、才(”) ⑵设勒〜才(耳),兀〜才仏),且X曲相 互独立,贝UX]+K〜Z'O? 1+勺)这个性质叫分布的可加性。 ⑶若吠二7(斤)。 QQQ 则可以求得,E(X)=«,I)(X)=2n (二)『分布 1.定义: 设X〜N(O,1),Y-才⑺),且X与丫 X 相互独立,则称变量T=4= 所服从的分布为自由度为斤的f分布. 记为7~r(H)O (3)/分布的分位点 定义: 对于给定的正数亿0<(7<1称满足条件 /V〉止}的点0”)为/分布的上&分位点。 性质• 风M、(D”) -加) 0(") (三)尸分布 1•定义: 设X〜x与y相互独立,则称统计量尸二甲1 服从自由度为 //〕及巾2的F分布;记作F〜F(nvn2). 2•性质 1Y/n ⑴中定义可见,一二"〜/⑺2,®) (3)尸分布的分位点 对于给定的正数Q,0vavl称满足条件 P{F〉化(4宀)匸Q 的点耳(叫屮J为F(fJ分布的上a分位点. ("1屮2)= 例题分析: 一、设就是正态总体得样本, 1、试问服从什么分布(指明自由度)? 且独立, 2。 假左,求得分布、 又与相互独立,故二 二、设就是来自正态总体得样本,分别记为得样本均值与样本方差,求得分布、解,,且与相互独立,所以由于,且与相互独立,因此由分布得定义得 ⑴证明都就是得无偏估计量;⑵判断中哪一个估il鱼更有效. 利用卡方分布: 四设就是来自正态总体得样本,记“,求统汁量得分布? 五、设为X得样本,求统计量得分布、 六、、设总体,就是X得样本,统计量 0 服从分布,求参数得值与得分布得自由度。 解由,得 且相互独立,即 9且相互独立。 于就是且相互独立。 所以当时,该分布得自由度为2、 假设检验与区间估计得题目类型: 记住正态总体得抽样分布定理,弄懂上分位数得含义,在密度曲线图上用分 位数给出各个分布得大概率区域与小概率区域 能够从图上用分位数标出各种分布得双侧小概率区域与单侧小概率区域 几个常用统计量复习 (1)Z二一,代〜,V(0,1)P〃ZI>Zafb/ 也12丿 ⑵/二〜心-1)P{\t\>t.(n)}=a S/冷讥 (3)r—P({F<才,;? )2{才>Z: (H)})二” bP22 c2/2 ⑷F二•)一+〜尸(坷_1,〃2」) N(OJ) j$-])s;+(①-DS;y 其中 +—2 你⑺1也) 〃的置信水平为1•Q的置信区间为 厂f2,y/n X+-^z y/n 一$一’ [X■丁M-l),X+[ 也(7)-1)] 方差小的置信区间(均值”未知) 5—1)歹3・1)S2 力2%0? —1)'力;%(乃一1) 所以鋼的置信水平为1-a的置信区间为 (壬土乙/2(”1+“〜2)二J丄+丄) 确定原彳艮设和被择假3殳的原则: 等号必须放在原假设里 1(10分)某工厂生产铜线,根据长期枳累得数据知,铜线得折断力服从正态分布,方差为、今从某天生产得铜线中随机抽取根,测得折断力如下: 问该天生产得铜线折断力与以往比较,其波动性有无显箸变化? 检验假设, 统计量,则当为真时” 拒绝域为或。 现在, 由于,即该天生产得铜线折断力与以往比较,其波动性无显著变化。 2(8分)在某砖厂生产得一批砖中,随机地抽取6块,测量英抗断强度(单位MPa)分别为 3'3663.1063、2643。 2873'1223.205 设砖得抗断强度服从正态分布,问能否认为这批砖得平均抗断强度就是3。 250MPa? (显著性水平) 、解3分 检验统计量,拒绝域3分 算得2分 接受 3(10分)某化工厂一天中生产得化学制品产量(单位: 吨)服从正态分布,今测得5天得产量分別为785,805790.790.802。 问就是否可以认为日产量得均值显著小于800? (取) 解假设 检验统计虽: ……■—一・・・・——一5分 拒绝域 ,接受…… 4、就是来自正态总体得样本,英中参数与均未知,对于参数得置信度为得垃信区间,试问当减少时该置信区间得长度如何变化? 答: 则U得置信度为1-a得置信区间 置信区间得长度,当样本容量给泄时,减小得值会增大得值,相应地变长、 5、(10分)某灯泡生产车间为考察灯泡得寿命,从生产得一批灯泡中随机抽取25只,测得平均寿命小时,标准方差小时•假设灯泡得寿命服从正态分布, (1)求总体方差得置信水平为95%得置信区间; (2)在显著性水平条件下能否认为这批灯泡得平均寿命为2000小时? 解 (1),,,、 得置信水平为95痛置信区间为 (2)在检验水平为5%得条件下检验假设, 选取检验统计量,当原假设时,;该假设检验问题得拒绝域为 由条件得由于,因此接受原假设,即在检验水平为5痛条件下可以认为这批灯泡得平均寿命为2000小时、 六、(10分)某化工厂一天中生产的化学制品产童〔单位: 吨)朋从止态分布,? 测得5天的产量分别为785,805,790,790,802。 问是否可以认为日产虽的均值为800? (u=0.05) 6、假设某种产品来自甲.乙两个厂家,为考查产品性能得差异,现从甲乙两厂产品中分别抽 取了8件与9件产品,测其性能指标X得到两组数据,经对其作相应运算得 假设测左结果服从正态分布, 1、在显箸性水平下,能否认为? 2c求得置信度为90%得置信区间,并从置信区间与假设检验得尖系角度分析甲乙两厂生产产品得f生能指标有无显著差异。 解 (1)检验假设 5252 拒绝域为F=-A->Fa/2(nA-I,/Z2-I)或F=-A<-l,n2-1) 2a 由条件知 厲=&“2=9,F=s,2/S;=0.006/0.008=0.75,&=1—0.9=0」 査表得,显然 接受原假设.故可认为,即认为两总体方差相等,也就就是两厂生产得产品得指标X得方差无显著性差异。 (2)求得置信区间。 由 (1)知,但其值未知,故得宜信区间为计算 査表 故得90%置信区间为 =0.190-0.238±1.7531xJo.OO7ixJ-+■二(-0.120,0.024) 数字特征: 概念清楚: 均值(期望)得概念: 三、数学期望的性质 1.设c是常数,则E(C)=C; 2•若C是常数,则E(CX)=CE(X); 3•E(X+Y)=E(X)+E(Y) 推广: £・Xxi=5>(7t) 4•设X7独立,则E(XY)=E(X)E(Y); oC 工g(心)以,X离散型 £(y)二£[g(x)]= L: g(x)/(x)处珏连续型 计算方差的简便公式: Dr)=EC2)-[£(X)]2 方差描述了随机变量X的取值与其均值的偏离程度. Tm"二、方差的性质-' 1.设C是常数,则2)(6)=0; 2•若C是常数,则D(CX)=C2D(X); 3•若X与Y独立,贝UD(X±Y)=D(X)+D(Y) 4•若X与F独立,且“丄是常数,则 D(aX±bY)=aD(X)+tfD(Y) D(aX±b)=^D(X) 5.D(X)=QoP{X=C}=l其中C=E(X). 协方差和相尖系数的定义 Cov{X.Y)=E{[X—E(X)][Y—E(Y)]} cCov(X.Y) p竝〜⑪(X、 Jd(y) 2•(协方差的计算公式) Cov(X.Y)=E(XY)-£(X)E(y) 二、协方差的性质 1.Cov(X,X)=D(X) 2.(协方差的计算公式) CM(X,Y)=E(XY)-£(Jf)£(r) 3.D(X±r)=z)(x)+n(r)±2Cov(x,Y) 4.Cov(XJ)=Cov(Y.X) 5•Cov(aX.bY)=abCov(X.Y)a』为常数 6•Cov(.Xx+XyY)=Cov(X^Y)+Cov(X2,Y) Cov(afY)=(TCov^aX+b>Y)=uCov{X,Y) 三・相尖系数的性质 定理1设随机变量X和F的相尖系数存在,贝U 1)1%1<1 2)Wxy\=1的充要条件是JV和F以概率1呈线 性矢系•即P[Y=aX+h}=1 114页 1)相尖系数Pat二0,则称X与Y不相矢; 2)£(AT)=£(Jr)E(F); 3)Cov«F)=0; 4)D(X±Y)=D(X)+D(Y). 特例若(XFM艮从二维正态分布,则 X与『独立U>X与F不相尖 二、协方差矩阵 将二维随机变量(召西)的四个二阶中心矩C„=E{[Xx-E(X})]2} C12=E{[Xi・E(Xi)][X2・E(X2)]}C21=E{[X2-E(X2)][/—E(XJ]} C22=E{[X2・E(X2)F}(> /、这是一个 排成矩阵的形式: 5如”厂吐称此矩阵为(X[K)的协方差矩阵. 几种常见
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 统计 常见 题型 方法 总结