曙光气象环境解决方案Word下载.docx
- 文档编号:21769487
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:44
- 大小:1.53MB
曙光气象环境解决方案Word下载.docx
《曙光气象环境解决方案Word下载.docx》由会员分享,可在线阅读,更多相关《曙光气象环境解决方案Word下载.docx(44页珍藏版)》请在冰豆网上搜索。
曙光EP850服务器具有小规模集群难以比拟的性价优势。
低于32个CPU的小规模集群系统,其节点间的通信能力受外部总线的限制难以同EP850的基于内部总线CPU数据通信能力相比较。
并且,EP850的高度整合可成功避免因CPU增加,导致系统稳定性能的下降。
另外,由于小规模集群需要大量的外围设备,因此其总体成本将较EP850高;
曙光天演EP850服务器还是实现大规律高性能集群计算的一种理想节点。
一般的大规模集群要想获得更高的峰值运算能力,需要采用大量的节点机进行连接。
而由于EP850单机运算能力较以往的两路甚至四路节点机有了成倍的提高,所以只需要用以前的几分之一数量的节点机就能获得相同的峰值运算能力。
由于节点数量的减少,大规模高性能集群将更易搭建、更低成本,更易管理,可靠性也将更高;
曙光天演EP850服务器还提供了PCI-Ex16插槽,通过安装高性能图形卡,是高性能工作站的理想选择。
三、曙光天演EP850具体配置
EP850配置大致如下:
型号
配置
备注
EP850
8颗双核AMDOpteron8218
内存:
16GBRegisteredECCDDR,最大可扩至128GB;
硬盘:
8*300GSAS15k热插拔硬盘;
集成双通道Ultra320SCSI控制器,支持RAID0,1,5;
ATIV7350显卡(1G内存)
网络:
3个100/1000MRJ45网口;
其他接口:
2个PCI-Ex16扩展插槽,2个PCI-Ex16扩展插槽(x4速率),1个PCI32bit33MHz扩展插槽;
电源:
3+1冗余电源
支持主流windows、Linux、Solaris等32位和64位操作系统的应用
四、曙光EP850为国家防汛抗旱工作提供有力支持
目前曙光公司EP850小型机,为各流域的三维电子江河系统提供了很好的硬件环境支撑,曙光EP850小型机以高度的显示功能、快速度的数据处理能力、稳定性强等方面取得了各流域的认可,为国家防汛抗旱工作提供了很好的支持,受到用户好评。
在“5.12汶川大地震”后,全国防总迅速召开紧急会议,研究震区水库、河道、供水等受损情况,以便对指导震区灾后重建工作。
在会议中,曙光EP850再显实力,对会议的顺利进行提供有力保障,为抗震救灾作了贡献。
山西省气象局高性能计算机系统
一、用户背景
山西省气象局于2003年5月曾购买过曙光一套4000L集群,采用了9节点,共计18颗Xeon2.2GHz处理器,主要用于山西省气象局的MM5业务化运行和日常科研需要。
随着气象预报对预报分辨率的提升,已有的曙光4000L集群已经不能满足其生产需要。
所以山西省气象局于2007年底决定购买一套新的高性能计算机用来进行更加精细化的气象中尺度预报,同时兼顾对科研的需求。
二、需求分析
用户对曙光的第一套高性能计算机基本上比较满意。
所以在这次升级采购中,用户咨询了曙光的建议。
决定面向多家计算机厂商,进行公开测试,用户提供了一个MM5的测试算例:
MM5测试模式为二重嵌套模式,母域区域中心为35°
N,95°
E,第一重区域(D1)和第二重区域(D2)分辨率分别为27km/9km,格点数分别为221x221、334x334(纬向x,经向y),模式垂直层23层,D1区积分步长60秒,预报时效48h,每3小时输出一次预报结果;
D2区积分步长20秒,预报时效48h,每3小时输出一次预报结果。
需要所有厂商提供测试结果和加速比数据。
曙光第一时间提供了两个平台的测试结果:
一是基于Itanium2集群的测试结果,一是基于X64集群的测试结果,经过比较后,用户从稳定性和模块化方面考虑,决定采用Itanium2集群,并进行了公开招标。
曙光、strongULL和SGI三家进行了应标,最终曙光凭借出色的信价比和服务中标。
三、解决方案
曙光最终提供了8台I940r-F(每台配置2颗IntelItanium29030双核心处理器,可扩充至4颗),节点间采用10Gstrong/s高速Infinistrongand互联。
同时提供两台IO、管理节点。
这是曙光在国内推出的第一套用于高性能计算的IA64集群。
采用的节点机I940r-F具有非常强大的性能和可靠性、可管理性:
I940r-F最高可支持4颗安腾2双核处理器,这些处理器具有最高24MstrongL3Cache,支持超线程技术,并比上代处理器功耗降低达20%,为用户带来高性能、低能耗的最优性价比解决方案。
I940r-F对更大内存容量和高速I/O设备的支持也使系统性能大幅提升。
此外,I940r-F从硬件层支持虚拟化技术,大幅提高了系统资源利用率。
更强扩展能力:
I940r-F具备前瞻性的设计方案可支持后续更高性能的处理器,提供广阔的性能扩展空间;
最大可支持256Gstrong内存,提供卓越的内存扩展容量;
支持高速热插拔PCI-E接口,为扩展部件提供更高的带宽和可扩展性;
支持热插拔SAS硬盘,为业务扩展提供了足够的本地存储空间。
更强可靠和可用性:
I940r-F在部件故障时可自行启动冗余部件,大大提高了系统可靠性。
凭借冗余和热插拔设计,I940r-F的处理器主板、内存、I/O、风扇和电源都可在服务器运行中进行维护。
所有这些设计使得I940r-F具有最大限度的正常运行时间来支持关键业务应用。
更好的管理功能:
曙光I940r-F服务器可选配曙光最新设计的硬件监控和管理系统,可独立实时记录主机的日志信息、检测、记录和校正错误,并帮助管理员分析故障原因。
支持行业统一的管理规范,可实现完善的远程管理。
在部署集群时,还具有延时系统启动功能,避免众多系统同时开机对供电体系造成的强大冲击。
四、总结
曙光提供的基于Itanium2小型机节点I940r-F组建的集群,具有强大的计算性能和稳定性以及在线的可维护性。
调试安装完毕以后,我们对用户的业务系统进行了移植,使其可以在IA64平台上顺利运行。
在对业务系统的性能测试中,我们的新系统相比原来的曙光4000L老系统,性能提升了6倍以上,可谓提升非常大,用户非常满意。
下图为用户测试算例两重嵌套区域48小时累积降水预报图(等值线间隔20):
曙光气象专用机防汛抗洪挺身而出——64机群计算机走进长江水利委员会水文局
高性能计算应用无所不在
在灾害天气的预警和应急系统中,天气预报是最基本也是最关键的一环,随着社会现代化程度的不断加深,气象预报的反应速度已经越来越不能适应社会发展的需要。
灾害的发生常常是因气象预报的落后带来的对应急反应速度的滞后。
因此,如何加强并提高气象预报的准确性和及时性成为当前讨论的焦点,长江水利委员会水文局(以下简称长江委水文局)是具有一定水行政管理职能的完全公益类事业单位,承担组织流域主要河流水文工作、指导流域内地方水文及干流及整理主要支流水文资料等,在水文水资源监测、评价与论证、水文气象预报、水文分析计算等方面有独特优势,曾荣获国家测绘局首批颁发甲级测绘资格证书、水利部首批颁发甲级水文水资源调查评价证书单位等多项殊荣。
随着我国整个气象事业的蓬勃发展,气象预报也从传统的理论方法,发展到了今天以大气科学理论为基础、综合运用科技手段,并通过高性能计算机平台实现的现代气象数值预报,这主要缘于高性能计算机自身强大的运算处理速度、庞大的数据存储功能、精密的逻辑分析能力等特点,为高性能计算在气象行业的应用打下了坚实的基础。
长江委水文局水文气象预报中心结合当前防汛、抗洪的需求,为了更好的及时响应、精确预报,因而迫切需要通过高性能计算机来实现长江流域的中短期数值预报!
气象专用机精确预报
而在高性能气象服务领域,国内服务器厂商曙光公司自1999年以来不断的关注数值预报技术的发展以及大规模并行计算机技术的发展,在2002年的时候顺利推出了曙光气象专用系统,这套体系采用了国际流行的MMS模式,其在大幅提高机器整体性能的同时也使价格趋向合理,当年此机型就应用于西藏和贵州省的气象服务,近年又进入了山西气象局、成都高原气象研究所、国家海洋局等气象系统,受到了大量气象单位的欢迎,开辟了一条科研和市场同步走的先河。
基于此,曙光专业的工程师结合当前64位计算发展大势,着眼于投资的保护、性能的稳定等多方考虑,为长江委水文局制定了详尽的解决方案,与此同时他们也看到国内一些气象研究所均陆续选用了曙光最为先进的64位机群气象专用机,来实现天气预报平台全面部署!
便与曙光一拍即合,“这个准没错儿,用就用最先进的!
”水文局总工程师金兴平这样说到!
自1950年长江委水文局成立以来,为长江防洪减灾和三峡、南水北调、葛洲坝等大中型水利枢纽的设计、施工及流域规划、城市建设、环境保护等方面提供了准确可靠的水文情报预报、水文分析计算等资料和成果,已经取得巨大的社会效益和经济效益。
此次采购的曙光64位气象专用机将主要用于:
1、实现长江流域水文气象情报收集、处理,归口提供全流域实时水情信息服务和发布短、中、长期水文气象预报,为长江防洪抗旱及国民经济可持续发展提供水文情报预报服务;
2、实现长江防汛水文气象情报工作现代化和水文气象预报系统的业务建设与管理;
3、开展对暴雨监测和预报技术的应用研究;
开展中长期水文气象预报研究。
4、开展并承担工程前期、施工期水文气象预报相关业务工作。
全面部署预报中心
曙光64位气象专用机具有可自由伸缩、高度可管理、高可用、高性能价格比等诸多优点,并采用了在中尺度数值天气预报领域处于领先地位的NCARMM5模式。
由于MM5中尺度数值模式可考虑高分辨的地形和陆面使用状况等重要的局地迫动因子,并可使用复杂的物理参数化方案,来研究和预测高分辨的局地中尺度天气现象,其相对于大模式的灵活性、细致性,使其应用范围迅速扩大,如各种中尺度天气系统的研究;
实时预报;
中尺度集成预报;
区域气候预报;
在空气质量和大气化学研究中的应用等等。
特别指出的是,其完全实现了软硬件一体化,气象专用软件是基于曙光气象专用高性能计算机上开发完成的,同时安装了系统软硬件运行状态监控系统,使用户对机器的软硬件系统的工作状况和工作环境一目了然。
逻辑拓扑图:
在计算能力部署上,16个计算节点和1个服务节点通过两套网络连接,一套千兆网络,一套百兆以太网。
其中一套百兆网是系统管理网,用来控制和管理所有的节点,一套千兆网是系统数据网,用来传输数据信息。
管理网和数据网分离大大提高了网络可用性,同时保障了数据的传输带宽。
同时各节点通过曙光硬件监控系统构成硬件监控网。
这就是TC400L所特有的网络——管理网、数据网、监控网。
其中节点机均采用了曙光R220A——极高性价比的企业级机架式服务器:
支持双路AMDOpteron64位处理器;
有6个DIMM插槽,最大支持12GB内存;
集成双通道Ultra320SCSI控制器;
有6个热插拔SCSI硬盘槽位;
主板集成两个10/100/1000M以太网卡,支持网卡冗余和自动负载平衡;
主板集成显示控制芯片,内建8MB独立显存;
支持冗余风扇,可选曙光特有的硬件监控系统。
64位集群技术特色
曙光气象专用高性能计算机集大规模超级服务器机群技术和低端服务器软硬件设计技术于一体,形成了一批具有自主知识产权、技术先进、具有极强市场竞争力的软硬件配套产品,使之成为符合中国用户使用习惯、具有中国特色的气象专用高性能计算机机群高性能计算机产品和应用解决方案。
1、友好的用户界面
曙光公司针对MM5数值天气预报模式,专门设计了用户图形操作界面。
这款专用高性能计算机界面友好,易操作,易使用,实用性强,用户操作傻瓜化。
系统每天可以自动定时定点进行业务系统预报,从数据导入到绘出气象要素,图形的整个流程自动完成,不需要人工干预;
用户可以随时监控整个系统的运行,大大节约了用户操作的时间。
对于用户而言,几乎不需要任何计算机系统知识的培训,就可以快速掌握整个预报系统。
2、一机多用实用性强
这款专用高性能计算机,既可以作为业务预报系统,又可以作为气象研究和测试的平台,一机多用,用户可以根据自己的需要进行调试运行。
系统提供可以保存数据的功能,使得用户可以对以往一个月内不满意的预报进行重新计算和分析,最大限度地满足了用户的需求调试系统。
同时提供调试系统到业务系统的导入功能,使得用户自己刚刚研发出的产品马上可以转换为业务预报系统。
3、高速完成预报任务
曙光气象专用高性能计算机根据用户的不同需求,定制了三款不同配置的产品。
分别具有不同的计算能力和数据传输能力,可满足各方面的需要。
曙光气象专用高性能计算机具有超强的计算能力,完全能在期望的时间内完成任务,提供满足需要的气象数值产品。
4、软硬件一体化
这套服务器完全基于曙光服务器上开发的,软硬件的磨合很好,不会出现任何不适应的状况。
5、系统监控、管理技术
曙光气象专用高性能计算机系统利用简单直观的管理工具来管理整个机群,极大地提高了工作效率。
曙光气象专用高性能计算机的监控工具可以监控到整个机群的软硬件运行状态,如:
整个系统工作环境,各节点CPU和内存的使用率,网络流量,各节点主板温度、CPU温度,机箱风扇转速、CPU风扇转速,主板电压、CPU电压等等,使系统管理员对各节点的情况一目了然。
监控工具同时提供了报警功能,当出现故障点时(如温度异常、风扇停止转动等),可以及时提醒系统管理员进行处理,避免或减少系统故障和由其引起的用户损失。
系统规模越大,系统管理和监控的效率越高。
6、单一系统映象
简单地说,单一系统映象技术就是让一个服务器聚集无论对用户,还是对系统管理员使用起来像一台整体的计算机,而不是作为多台独立的计算机的管理技术。
即系统中所有分布的资源被组织成一个整体统一管理和使用,用户可以不去关心单个节点机的存在。
单一系统映象技术是曙光气象专用高性能计算机机群系统的关键技术之一。
7、系统支持动态扩展
曙光气象专用高性能计算机的机群式架构决定了其具有优异的动态扩展性。
根据用户应用需要,可以选择扩展能力很强的通用节点,节点总数可扩展到99个。
尤其需要指出的是,气象专用高性能计算机的动态伸缩性非常强。
用户如果需要减少节点数目,可以随时指定节点与整个系统隔离;
用户如果需要扩展节点,只需稍微变更配置文件即可完成;
对于LINUX通用节点,用户甚至可以使用气象专用高性能计算机提供的节点自动安装功能,气象专用高性能计算机会为用户自动安装(包括操作系统)和配置应用节点。
北京市气象局高性能集群
一、项目背景
为缓解日益严重的城市应急系统建设的急迫性,全面部署2008年北京奥运会突发性灾难天气应急保障体系。
2004年10月,北京市气象局与曙光公司实现强强联合,曙光TC4000A高性能计算机开进了北京市气象局。
二、系统总览
曙光公司为北京气象局提供了曙光TC4000A高性能计算机,整个系统采用机群架构。
共有36个节点,其中包括32个计算节点、2个IO节点、1个管理服务节点和1个登入节点。
另外,系统配有3套网络,计算网采用Myrinet2000高性能网络,数据传输网采用千兆以太网,管理网络采用百兆以太网。
同时配有1.2Tstrong的存储。
图:
北京气象局曙光TC4000A结构图
整个系统浮点运算峰值为每秒460.8GFlops,在2005年11月的中国TOP100排名中,名列第75位。
序号研制厂商单位型号安装地点安装年份应用领域处理器核Linpack值(Gflops)峰值(Gflops)效率75曙光曙光4000A/Opteron1.8GHz/Myrinet北京市气象局2004大气气象128369.8460.80.80
三、应用模式
此套系统是北京气象局的气象业务系统,运行的模式是MM5。
采用3层嵌套,预报精度为3KM。
具体为:
采用三重区域嵌套模式,分辨率分别为27公里、9公里和3公里,对应的计算网格分别为151×
151、142×
184和172×
199,垂直方向为37层,作36小时预报,积分步长为81秒。
四、系统特色
1、X86-6464位操作系统和64位MM5
北京气象局机群项目方案制定时,那时X86-64架构的AMDOpteronCPU刚推出不久,MM5还无法运行在X86-64操作系统之上。
在2004年初,曙光公司和中科院计算所一起,率先完成了MM5在X86-64平台上的移植,使得MM5性能提高了15%。
同时在北京气象局首先得到了应用。
在这以后,在国内外其它的气象部门也得到了应用。
2、三网设计
本系统共有三套网络,高速计算网、数据传输网和维护管理网。
三套网络各尽其职、相互备份。
3、采用4路服务器作为计算节点,在提高系统整体性能的同时,又提高了系统的稳定性和可靠性。
4、存储系统设计
对于存储系统来说,最重要的是可靠性。
要保证数据的安全性,以及在系统运行时的存储系统的稳定性和可靠性;
在此基础上,提高性能,保证在模式计算时,存储系统不会成为整个系统的瓶颈。
存储系统结构图
可靠性设计
∙在IO节点方面,通过曙光高可用软件DHA,采用了双机热备的方式。
平时只有一台IO节点工作,当其发生故障时,另一台IO节点自动接替其工作。
∙在磁盘阵列方面,采用曙光DS-2120磁盘阵列。
采用了模块化和无线缆(Castrongle-less)设计,避免了诸如线缆脱落、信号串扰、线缆受热老化等问题,从根本上提高了磁盘阵列系统的可靠性、可维护性。
∙网络方面采用三网设计,由管理网作为数据传输网的备份网络。
高性能设计
∙IO节点和数据传输网间,采用了双千兆网绑定的方式,是传输带宽由1Gstrong增加到2Gstrong。
∙三网设计,保证了数据传输网的性能。
中国气象局武汉暴雨研究所
中国气象局武汉暴雨研究所是经国家科技部、财政部、中央编办批准成立的国家级公益类非营利性科研机构,为中国气象局所属九个专业气象研究院所之一。
人员编制50人,下设暴雨应用基础研究室、暴雨监测技术研究室、暴雨信息应用研究室和综合办公室。
暴雨所基本定位为瞄准暴雨防灾减灾的国家目标和气象业务服务需求,开展中国暴雨的应用基础研究、应用研究和技术开发。
研究重点是我国陆地暴雨,特别是江淮梅雨锋暴雨和锋前暖区暴雨,同时开展我国北方暴雨的比较研究。
重点学科领域包括暴雨监测技术研究、暴雨形成机理和预测方法研究、暴雨预报应用研究和暴雨灾害评估与对策研究等,同时开展中尺度暴雨外场监测试验基地建设和中国暴雨(资料)数据库建设。
暴雨所开发完成了具有国际先进水平的中尺度暴雨数值预报模式系统AREMS,并荣获2005年度湖北省科技进步一等奖。
积极推动AREM模式在全国14个省(市、区)及水利部门推广应用,开展业务化评估工作。
开发完成了全国及单站多普勒天气雷达资料传输及显示软件,并在全国推广应用。
在全国率先实现了多部新一代雷达的高频度(6分钟)实时拼图,基本完成中国南方暴雨短时预警系统。
自主设计了一套雷达降水资料一维变分同化方案。
由于用户研发了AREM软件是基于某小型机而开发的,所以用户要厂商提供AREM在其所提供平台上的顺利移植。
由于暴雨所肩负着预报武汉暴雨的责任和中尺度天气预报研究的科研任务,所以需要一台较高性能的高性能计算机。
用户前期使用过IstrongM的机器,由于机器坏了以后的维护不及时且费用过高,使用户非常不爽。
所以决定选择国产高性能计算机,曙光是国内高性能计算机最专业的厂商,所以最终选择了曙光。
曙光针对用户主要用于科研的需求,提供了7台R4280AD和1台A950,以及一台2120FA半光纤存储(共计3Tstrong),组建成Cluster,为用户提供科研用高性能计算。
为了满足用户日常的管理和监控要求,在集群软件方面,采用了最新研发的曙光DCAS集群管理系统。
DCAS是一种高级群集管理软件,能够通过单点控制来管理Linux/Windows系统群集。
它简化了群集的管理,使其能够很方便地扩展,有助于提高系统管理员的效率。
本管理系统采用有strongrowser/Server分布式结构、跨平台管理等特性,提供了一整套对集群系统进行并行操作、性能监控、信息获取的工具,为整体集群计算资源的统一管理构建了一个基础平台,满足了企业级集群管理所需的扩展性(Scalastrongility)、可用性(Usastrongility)、可管理性(Manageastrongility)和实用性(Availastrongility)等方面的要求。
DCAS的主要功能包括:
管理授权—负责管理过程的授权控制,只有将管理节点的公钥部署到被管理节点,才能执行各种集群管理操作。
用户管理—负责管理集群系统中的用户与组群,允许集群系统管理员查看集群系统中用户与组的配置,并且
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 曙光 气象 环境 解决方案