当前位置: 主页 > 分析 >   正文

中国超算重回世界之巅

导读:6月23日,德国汉堡国际超算大会现场,最新一期全球超级计算机500强(TOP500)榜单揭晓。2.198EFlops——中国超算“灵晟”以每秒2.198百亿亿次浮点运算的持续双精度浮点性能高居榜首。美国El Capitan以1.809EFlops位列第二。“灵晟”是世界首台持续性能超2EFlops的超算系统,全面领先国际现有E级超算,宣告中国超算重回世界之巅。 更令业界瞩目的是,这台超算从芯片到系...

6月23日,德国汉堡国际超算大会现场,最新一期全球超级计算机500强(TOP500)榜单揭晓。2.198EFlops——中国超算“灵晟”以每秒2.198百亿亿次浮点运算的持续双精度浮点性能高居榜首。美国El Capitan以1.809EFlops位列第二。“灵晟”是世界首台持续性能超2EFlops的超算系统,全面领先国际现有E级超算,宣告中国超算重回世界之巅。

更令业界瞩目的是,这台超算从芯片到系统全部由我国自主研制。时隔9年,中国超算重回世界第一,背后是怎样的技术突破?科技日报记者进行了相关采访。

第一问:“灵晟”何以领先其他E级超算?

答案在于架构创新。“灵晟”超算系统总设计师、国家超级计算深圳中心主任卢宇彤介绍,“灵晟”系统首创在线加速的全CPU架构,打破传统CPU-GPU(中央处理器—图形处理器)异构架构壁垒,内嵌AI矩阵加速单元,回归计算加速的本质。

传统超算提升性能的主流做法是堆砌GPU加速卡。美国最强的El Capitan、Frontier两大E级超算,都是走这条路线。但“灵晟”反其道而行之,完全依托国产LX2 CPU核心跑出世界第一。

其中的关键在于芯片层。LX2 CPU创新性引入多精度与矩阵加速能力,实现片上超算算力与智能算力深度融合。它还集成了首颗国产高带宽内存,内存带宽相比传统CPU配套内存提升10倍。

事实上,把加速单元做进CPU本身,省掉了CPU与GPU之间数据搬运的开销。这不是被动选择,而是主动换道。

图灵奖得主杰克·唐加拉评价称:“中国的‘灵晟’系统让世界看到了超算通向科学智能(AI for Science)新型系统架构的希望之光。”

第二问:中国超算怎样实现全栈自主?

如果说,2017年的“神威·太湖之光”登顶,是芯片单点突破;9年后的“灵晟”已是全栈自主,从里到外全是中国造。

卢宇彤介绍,“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。

其中,在芯片层,有前文提到的国产自研LX2 CPU;在网络层,自主设计的灵启高速互连网络可支持200万端口、10万节点的超大规模组网。

“存储层采用分层架构,兼顾高性能作业区与容量型数据区,可扩展至E级。”卢宇彤介绍,“灵晟”构建大规模超智融合框架,自研全栈软件,将底层硬件能力以可用、可编程、可优化的方式释放给应用,提高各领域应用性能。

第三问:“灵晟”赋能实力如何?

超算的终极使命不是“跑分”,而是给各行各业的创新托底。

卢宇彤介绍,“灵晟”定位为面向科学、工程、智能计算的国产全栈融合基础设施。

据了解,自系统部署以来,“灵晟”已支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、大模型推理等多领域应用,支撑混合精度计算、工作流和复杂多任务并行运行,在大规模并行环境下平均扩展效率可达84.4%。

如今,面向科学、工程、产业各领域的大规模应用需求,“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。

在遥感领域,国家超级计算深圳中心副主任付昊桓介绍,其团队依托“灵晟”开展遥感模型的大规模训练与系统优化,全机端到端训练峰值性能在该领域领先,实现全球8年时序遥感影像高倍压缩与高效重建。目前,相关技术支撑遥感解译与降水预报,显著提升预报精度,助力国土监测、灾害预警。

在生物信息领域,中山大学计算机学院教授杨跃东说,基于“灵晟”,已实现单日十万亿级化合物虚拟筛选。结合AI强化学习方法,筛选效率提升千倍,将有力支撑创新药研发与精准医疗。

超算普遍存在性能越高功耗越大的难题,而“灵晟”不仅跑得快,还跑得绿色。卢宇彤介绍,“灵晟”首创100%全液冷散热计算机柜,以51GFlops/W(每秒10亿次浮点运算/瓦)能效比,在拥有全球顶尖持续运算性能的基础上,树立绿色计算新标杆。

(责任编辑:黄春棉)

免责声明:以上数据来源于天眼查等平台,相关内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。如有侵权请联系0531-85193563。

本文来源:中国经济网

内容