超越概率贝叶斯判别分析方法及其在中长期径流预报中的应用Word文档格式.docx
- 文档编号:20975584
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:10
- 大小:221.64KB
超越概率贝叶斯判别分析方法及其在中长期径流预报中的应用Word文档格式.docx
《超越概率贝叶斯判别分析方法及其在中长期径流预报中的应用Word文档格式.docx》由会员分享,可在线阅读,更多相关《超越概率贝叶斯判别分析方法及其在中长期径流预报中的应用Word文档格式.docx(10页珍藏版)》请在冰豆网上搜索。
ZHAOTong-tie-gang,YANGDa-wen,LIMing-liang
Abstract:
Mid-termandlong-termstreamflowpredictionisofvitalimportanceinfloodcontrol,reservoiroperationandwaterresourcesmanagement.Duetothelackofreliablemeteorologicalinputs,statisticalmethodiscommonlyusedtomid-termandlong-termstreamflowprediction.TheExceedanceProbabilityBayesianDiscriminantAnalysisMethodisaBayesianstatisticalmethodwhichreliesondiscriminantanalysistopredicttheprobabilityof“futurestreamflowgoesbeyondacertainvalue”(Exceedanceprobability)bythehistoricalpredictandandpredictorsamplesandreal-timepredictorinformation.ThismethodhasbeenusedtopredictthestreamflowofYichangandDatongGaugeStation,YangtzeRiver.Theresultsshowthattheexceedanceprobabilitymethodiseffectiveinpredictingthenon-floodseasonstreamflowandisaviableapproachforadoptinghydro-meteorologicalindexesaspredictortopromotpredictionaccuracyoffloodseasonstreamflow.
Keywords:
mid-termandlong-termstreamflowprediction;
exceedance-probabilitymethod;
BayesianDiscriminantAnalysis;
YangtzeRiverstreamflowprediction
1研究背景
径流预报是水文学的重要应用领域之一,是水库运行调度和防汛、抗旱以及水资源应急调度等的前提。
对于短期径流预报而言,以实测降雨资料作为预报因子(模型输入),采用集总式或分布式水文模型都能够达到相当高的预报精度。
对于中长期径流预报而言,由于现阶段天气预报不能提供相应预见期的可靠降雨和气温等气象资料,其主要利用统计和人工智能方法等进行[1-4]。
中长期径流预报的主要研究内容在于发掘未来径流与前期径流及海平面气温、海平面气压、大气环流指数等大尺度气象-水文变量间的关联关系,并以此为基础进行径流预报[1-2]。
其常用的模型方法有时间序列、神经网络、支持向量机和遗传规划等[3-4],这些方法首先由训练样本“拟合”预报变量与预报因子间关联关系,然后由校核样本对“拟合”关联关系的可靠性进行检验,检验合格即可使用该模型进行中长期径流预报。
相比短期径流预报中“降雨-径流”机理性预报方法,中长期径流预报的统计方法和人工智能方法,其机理性不够强,预报精度也有待进一步提高[1-6]。
超越概率贝叶斯判别分析方法(以下简称“超越概率方法”,ExceedanceProbabilityMethod)是Piechota等利用统计学中的判别分析方法(DiscriminantAnalysisMethod)提出的一种经验贝叶斯方法[1-2]。
超越概率方法采用历史样本计算“预报因子”和“预报变量”先验概率分布,然后结合“预报因子”实时信息采用判别分析方法对“径流量超过一定值”水文事件的后验概率进行定量预报。
超越概率方法与中长期径流预报的时间序列、神经网络、支持向量机和遗传规划等常用方法主要有2点不同[1-4]:
(1)数据驱动,直接由历史样本和实时信息进行径流预报,无需构建和检验关联关系模型;
(2)概率预报,同时对未来径流变化范围及其概率分布进行估计。
本文采用超越概率方法对长江宜昌站、大通站的月、季径流预报进行了研究,其结果表明,对于非汛期径流预报,超越概率方法以前期径流作为预报因子即能达到相当高的预报精度;
对于汛期径流预报,通过选取大尺度气象水文指标作为预报因子,超越概率方法能够以一定精度对极端水文事件进行概率预报。
2超越概率径流预报方法
2.1超越概率方法原理
超越概率方法是一种非参数贝叶斯统计方法,其源于经典统计理论中的判别分析方法[1-2]。
给定预报变量Q和预报因子Z,设Qi(i∈{1,2,…,N})为预报变量事件i(如流量位于一定流量区间),Qi之间互不相交且
为预报变量Q的整个分布空间;
Zj为预报因子取值为Zj的事件。
记P(Qi)为Qi发生的概率,f(Zj)|Qi为Qi发生时预报因子为Zj的条件概率分布密度。
给定足够数量的(Q,Z)样本,即能估计出P(Q)、f(Z|Q)的先验分布。
从而事件“预报变量事件i发生且预报因子Z=Zj”的概率分布密度可由下式进行
f(Qi,Zj)=P(Qi)f(Zj)|Qi
(1)
根据贝叶斯公式
如果已知预报因子Z=Zj,则预报变量事件i发生的后验概率为
由式(3)可以计算已知预报因子取值条件下,预报变量各事件发生的概率,也可以判别最可能发生的预报变量事件及其概率,即
P(Qi)|Zj,(k∈{1,…,N})(4)
Piechota等[1]指出,在径流概率预报中,已知径流-预报因子历史样本和预报因子取值,如果将历史样本分为径流偏枯、中等和偏丰的事件Q1、Q2、Q3三类,即可由式(3)计算出径流偏枯、中等和偏丰的后验概率。
如果将历史样本分为径流大于等于Q、小于Q的事件Q1、Q2两类,取i=1,则由式(3)可以计算出预报因子为Zj时流量大于等于Q的后验概率P(Q1|Zj)(ExceedanceProbability),P(Q2|Zj)(也即1-P(Q1|Zj))为流量小于Q的后验概率(non-ExceedanceProbability);
Q可以连续取值,从而计算对应各Q的超越概率[2]。
2.2超越概率方法的步骤
运用超越概率径流预报方法对径流进行概率预报的流程如图1所示,具体步骤包括[1-2]:
(1)步骤1,将“预报变量-预报因子”样本由预报变量大小分为Q1(即Q≥Q*)和Q2(即Q<
Q*)两类,分别记作分类1和分类2;
(2)步骤2,由预报变量样本分别计算Q1和Q2的先验概率P(Q1)和1-P(Q1);
(3)步骤3,结合预报因子取值信息Z=Zj,分别估计分类1和分类2中Z=Zj的先验概率密度f(Zj)|Q1和f(Zj)|Q2;
(4)步骤4,由式(3)计算径流大于等于Q*的后验概率P(Q1|Zj);
(5)步骤5,设置不同的径流Q*,重复步骤1-4即可求出对应各径流条件的后验超越概率。
Piechota等[1]提出,点绘“超越概率-径流”组合,取其外包线,即可得到超越概率径流预报结果。
极端水文事件(极端洪水、极端枯水)的超越概率可以由水文频率分析确定。
关于预报结果有效性的检验,Piechota等[1]建议直接采用气象概率预报精度评价的LEPS(LinearErrorintheProbabilisticSpace)指标。
实际应用中,运用样本估算概率和概率密度需要采用非参数统计学中的核函数方法(KernalDensityFunctionMethod)[7-8]。
从理论上选定合适的预报因子,给定足够多的观测样本,超越概率预报方法即能在相应时间尺度上进行准确的径流概率预报。
在中长期预报中,预报因子Z可以取前期径流、海平面气温和海平面气压等与流域径流密切相关的变量,从而实现中长期“水文-气象耦合”的径流概率预报[1-2,5-6]。
图1Piechota等[2]超越概率径流预报方法原理
2.3超越概率方法改进
在上述超越概率方法中,极端水文事件超越概率取为先验概率,这样难以对异常洪水和枯水给出合理的预报;
同时气象概率预报精度评价指标与传统水文预报评价指标不一致,难以在同一标准下评判预报的优劣[9-10],为此,本文提出了以下改进方法。
设Qs为预报变量历史序列,利用超越概率方法进行径流预报时,对于统计样本包含的水文事件max(Qs)≥Q≥min(Qs),可根据式(6)计算其超越概率。
对于样本不包含的极端水文事件Q(Q<
min(Q))s、Q(Q>
max(Qs)),考虑到先验样本不足以反映其后验超越概率且统计模型外插将带来较大误差,可以通过估算Q(Q<
min(Qs))和Q(Q>
max(Qs))发生概率而间接对极端流量超越概率进行整体估计。
极端枯水事件发生概率和极端洪水事件发生概率可由式(5)、式(6)分别进行估算:
P=1-Prob(min(Qs)|Zj)
(5)
=Prob(max(Qs)|Zj)(6)
图2运用超越概率径流预报方法进行极端水文事件概率预报
根据统计期望的定义,以各径流对应的后验概率对其进行加权平均即可得到其后验期望值。
在式(5)、式(6)的基础上,不考虑极端水文事件,后验径流期望E(Q)可由如下积分得到
根据预报因子序列Z可以对年内或一定时期内的径流进行预报,由径流概率预报的期望值序列E(Q)与实测径流序列Qs,即能运用常规水文预报精度评价方法,如NS效率系数/确定性系数、均方根误差、预报合格率等,对预报结果进行概率预报期望检验。
此外,也可以结合式(5)、式(6)对极端水文事件的概率预报结果,对超越概率方法及预报因子实用性进行定性评价。
3基于前期径流的预报
受流域调蓄作用及水汽条件等影响,流域内前后期径流间存在较强的关联性。
同时,年内不同时段的前后期径流间关联关系存在差异,例如,枯水期,其前、后期径流关系主要受流域调蓄作用影响,呈现出退水曲线的关系;
洪水期,径流主要取决于流域水汽条件,前、后期径流关系较为复杂。
在超越概率方法的径流预报中,采用前一期径流对后期径流进行预报时,为保证样本的均一性,历史样本均选用各年同期值。
例如,采用6月径流预报7月径流,历史样本“预报因子-预报变量”组合选定为历年的“6月径流-7月径流”;
采用春季径流预报夏季径流,历史样本选定为历年的“春季径流-夏季径流”。
图31981—2002年宜昌站径流实测值与概率预报期望值对比
利用宜昌站1882—2002共121年实测径流序列,以前一期径流作为预报因子对后期径流运用超越概率方法进行预报研究。
其中,1882—1980年共99年资料作为历史样本构建先验概率空间;
1981—2002年共22年资料用于检验超越概率方法有效性。
在月、季时间尺度上对1981—2002年径流进行预报,点绘超越概率预报期望值序列与实测值序列如图3所示。
对1981—2002年月、季径流进行预报,NS效率系数分别为0.892、0.862;
合格率(预报值在实测值±
20%内为合格)分别为79.6%和77.7%。
由图3、图4可知,对于冬季(12—2月)径流和春季(3—5月)径流,概率预报期望值与实际值基本一致;
对于夏季(6—8月)径流和秋季(9—11月)径流,概率预报期望值与实测值存在较大差异。
对于1994年秋季枯水,由于1994年夏季径流(预报因子)显著低于历史同期值,概率预报期望值与实测值较为接近(相对误差小于3%)。
类似的,超越概率模型对1986年长江秋季枯水的概率预报期望值也与实测值也较为接近。
相比之下,由于1986年和1994年的春季径流(预报因子)并未与历史同期表现出偏低,超越概率模型对1986年和1994年夏季枯水的预报结果与实测值存在较大差距。
对于1998年夏季洪水,概率预报的期望值比实测值低了近13000m3/s(相对误差大于30%),究其原因,其预报因子(1998年春季径流)并未显著高于历史同期值。
类似的,超越概率模型对1981、1984、1987、1993和1999年夏季洪水的预报结果颇不理想。
这也说明对于小概率的“洪水”事件仅用“期望值”难以反映其发生情况。
采用超越概率方法进一步对长江大通站月、季径流进行预报,以1951—1990年共40年数据为样本构建先验概率,对1991—2002年月、季径流预报,结果如图4所示。
大通站月、季径流预报结果整体上与宜昌站预报结果类似。
月、季径流预报NS系数分别为0.808和0.761,合格率分别为67.4%、66.7%,预报精度较宜昌站偏低,其原因可能在于平原区河流洪水受人类活动影响较大,变化规律比山区河流洪水更为复杂。
图41991—2002年大通站径流实测值与概率预报期望值对比
径流主要取决于降水,长江上游金沙江和四川盆地各水系降水主要集中在夏季和秋季的7—9月[11],受太阳辐射、大气环流和水汽输运等多种因素影响,流域降水变化规律较为复杂。
对于夏、秋季洪水预报,依靠“前-后期径流关系”很难达到必要精度。
例如,采用1998年春季径流作为预报因子,1998年宜昌站夏季径流大于35000m3/s的概率为0。
4基于气象水文预报因子的特大洪水概率预报
为提高洪水预报精度,同时也为考察大尺度水文气象因子与长江洪水关联关系,采用水文气象特征指标对宜昌站夏季(6—8月)径流进行预报研究。
本文共选取了16个气象水文特征指标,包括:
(1)北极涛动指数(ArcticOscillation);
(2)大洋尼诺指数(OceanicNinoIndex);
(3)太平洋十年涛动指数(PacificDecadalOscillation);
(4)西太平洋指数(WesternPacificIndex);
(5)太平洋模式(PacificPattern);
(6)东-北太平洋模式(EasternPacific-NorthernPacificPattern);
(7)太平洋暖池(PacificWarmPool);
(8)太平洋北美指数(PacificNorthAmericanIndex);
(9)斯堪的纳维亚模式(ScandinaviaPattern);
(10)北方涛动指数(NorthernOscillationIndex);
(11)南方涛动指数(SouthernOscillationIndex);
(12)多变量厄尔尼诺南方涛动指数(MutlivariateENSOIndex);
(13)尼诺1+2区海温(ExtremeEasternTropicalPacificSST);
(14)尼诺3区海温(EasternTropicalPacificSST);
(15)尼诺4区海温(CentralTropicalPacificSST);
(16)尼诺3.4区海温(EastCentralTropicalPacificSST)。
气象水文指标数据均来自美国海洋和大气局(NOAA)气候数据中心网站:
www.cdc.noaa.gov。
这16个水文气象指标于1950年左右有计算值,从NOAA数据中心能够下载到时间步长为月的数据为1951年至今。
运用超越概率方法,选取16个特征指标的上一年春季、夏季、秋季、冬季和当年春季取值作为预报因子(共80个),以1952—1997年(共46年)数据作为样本构建先验概率空间,对1998年夏季洪水进行预报。
1998年夏季宜昌站日均径流高达37810m3/s,这一流量高于1952—1997年夏季径流最大值的1954年夏季径流37210m3/s(1954年夏季洪水为1882—1997年共116年间的最大夏季洪水)。
将先验超越概率(由洪水频率分析得到)通过式(7)积分得到长江宜昌站夏季径流期望值为24800m3/s,这一取值与1998年真实值的相对误差为33%。
对于1998年夏季洪水预报,
(1)若以25%相对误差(概率预报期望值大于等于真实值的75%)作为判断预报因子的预报期望值有效性阈值,结果显示,太平洋尼诺1+2区上一年夏季、秋季、冬季和本年春季海温及太平洋尼诺3区上一年秋季、冬季海温等共6个预报因子的预报期望值合格。
若以20%相对误差作为预报期望有效性阈值,则80个预报因子均不合格;
(2)若以预报“夏季洪水37000m3/s发生超越概率大于3%”为预报因子的概率预报有效性阈值,结果显示,上一年春季太平洋尼诺区指数、上一年夏季西太平洋指数、上一年春季南方涛动指数、上一年春季尼诺1+2区海温、上一年春季尼诺3区海温、上一年春季尼诺3.4区海温等共6个因子的概率预报合格。
为对预报因子有效性进行检验,以1957—2002年(共46年)数据作为样本构建先验概率空间,对1954年夏季洪水进行预报,
(1)若以25%相对误差为预报期望值有效性阈值,80个预报因子均不合格;
(2)若以预报“夏季洪水37000m3/s发生超越概率大于3%”作为概率预报有效性阈值,结果显示上一年春季太平洋尼诺区指数、上一年夏季西太平洋指数、上一年春季南方涛动指数、上一年春季多变量厄尔尼诺南方涛动指数、上一年春季尼诺1+2区海温、上一年春季尼诺3区海温、上一年春季尼诺3.4区海温等共7个因子的概率预报合格。
对于7个“概率预报1954年夏季洪水”合格的预报因子,除“上一年春季多变量厄尔尼诺南方涛动指数”,其余均与“概率预报1998年夏季洪水”合格的预报因子相同。
对于1954和1998年夏季洪水,“上一年春季尼诺1+2区海温”均预报“夏季洪水37000m3/s发生的超越概率大于6%”,图5上半部分点绘了“上一年春季尼诺1+2区海温”与“当年夏季径流”的关系,下半部分点绘了基于“上一年春季尼诺1+2区海温”对1954和1998年的概率预报结果。
图5下侧的概率预报结果显示,“上一年春季尼诺1+2区海温”预报1954和1998年夏季洪水发生的概率较先验超越概率在大洪水事件方面明显偏大。
由图5上侧点绘关系图,“上一年春季尼诺1+2区海温”与“当年夏季径流”并不呈现明显的相互联系,此时,采用线性回归模型、非线性回归模型和神经网络模型等确定性模型进行径流预报,均不能得出1954和1998年将发生大洪水的结论。
洪水本身属于小概率事件,其在历史样本中所占比例也比较小,“通过历史样本构建确定性预报模型,再由预报模型进行径流预报”很难将洪水事件预报准确;
采用超越概率方法能够有效利用历史样本中的洪水样本对洪水进行概率预报,这体现了超越概率贝叶斯判别分析方法相对于传统方法的优势。
值得指出,在对1998年洪水进行预报时,如果在样本空间中剔除“1954年样本”,预报结果将很不理想,这说明样本代表性对于超越概率方法的实用性有重大影响。
5结语
超越概率径流预报方法基于“预报变量-预报因子”历史样本构建预报因子和预报变量的先验分布,结合“预报因子”实时信息对未来不同量级的径流发生概率进行预报。
本文采用超越概率径流预报方法,对长江宜昌站、大通站月和季径流预报进行了研究。
研究结果表明,对于非汛期径流,以前一期径流为预报因子,概率预报期望值即能以较高精度反映后期来流状况;
对于汛期径流,以大尺度气象水文指标作为预报因子能显著提高极端水文事件概率预报精度。
作为一种统计模型,超越概率方法在理论上是完备的。
实际应用中,基于超越概率方法的径流预报存在对极端水文事件(统计异常值)缺乏足够预报准确性的问题,尤其是实测径流过程与历史先验样本差别较大时,预报值可能与实测值有较大差距。
为模型选取有效的预报因子和为先验概率估计提供更多具有代表性的样本,是改进预报精度的可能途径。
图5上一年春季尼诺1+2区域海温与宜昌站当年夏季洪水的关联关系及概率预报结果
参考文献:
[1]PiechotaTC,ChiewFHS,DracupJA,etal.SeasonalstreamflowforecastingineasternAustraliaandtheElNinoSouthernOscillation[J].WaterResourcesResearch,1998,34(11):
3035-3044.
[2]PiechotaTC,ChiewFHS,DracupJA,etal.Developmentofexceedanceprobabilitystreamflowforecast[J].JournalofHydrologicEngineering,2001,6
(1):
20-28.
[3]WangW-C,Kwok-WingChau,Chun-TianCheng,etal.Acomparisonofperformanceofseveralartificialintelligencemethodsforforecastingmonthlydischargetimeseries[J].JournalofHydrology,2009,374(3-4):
294-306.
[4]林剑艺,程春田.支持向量机在中长期径流预报中的应用[J].水利学报,2006,37(6):
681-686.
[5]TootleGA,PiechotaTC.Suwanneeriverlongrangestreamflowforecastsbasedonseasonalclimatepredictors[J].JournaloftheAmericanWaterResourcesAssociation,2004,40
(2):
523-532.
[6]SoukupTL,AzizOA,etal.Longlead-timestreamflowforecastingoftheNorthPlatteRiverincorporatingocean
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 超越 概率 贝叶斯 判别分析 方法 及其 中长期 径流 预报 中的 应用