中国超算重回世界之巅

6月23日，德国汉堡国际超算大会现场，最新一期全球超级计算机500强（TOP500）榜单揭晓。2.198EFlops——中国超算“灵晟”以每秒2.198百亿亿次浮点运算的持续双精度浮点性能高居榜首。美国El Capitan以1.809EFlops位列第二。“灵晟”是世界首台持续性能超2EFlops的超算系统，全面领先国际现有E级超算，宣告中国超算重回世界之巅。

更令业界瞩目的是，这台超算从芯片到系统全部由我国自主研制。时隔9年，中国超算重回世界第一，背后是怎样的技术突破？科技日报记者进行了相关采访。

第一问：“灵晟”何以领先其他E级超算？

答案在于架构创新。“灵晟”超算系统总设计师、国家超级计算深圳中心主任卢宇彤介绍，“灵晟”系统首创在线加速的全CPU架构，打破传统CPU-GPU（中央处理器—图形处理器）异构架构壁垒，内嵌AI矩阵加速单元，回归计算加速的本质。

传统超算提升性能的主流做法是堆砌GPU加速卡。美国最强的El Capitan、Frontier两大E级超算，都是走这条路线。但“灵晟”反其道而行之，完全依托国产LX2 CPU核心跑出世界第一。

其中的关键在于芯片层。LX2 CPU创新性引入多精度与矩阵加速能力，实现片上超算算力与智能算力深度融合。它还集成了首颗国产高带宽内存，内存带宽相比传统CPU配套内存提升10倍。

事实上，把加速单元做进CPU本身，省掉了CPU与GPU之间数据搬运的开销。这不是被动选择，而是主动换道。

图灵奖得主杰克·唐加拉评价称：“中国的‘灵晟’系统让世界看到了超算通向科学智能（AI for Science）新型系统架构的希望之光。”

第二问：中国超算怎样实现全栈自主？

如果说，2017年的“神威·太湖之光”登顶，是芯片单点突破；9年后的“灵晟”已是全栈自主，从里到外全是中国造。

卢宇彤介绍，“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。

其中，在芯片层，有前文提到的国产自研LX2 CPU；在网络层，自主设计的灵启高速互连网络可支持200万端口、10万节点的超大规模组网。

“存储层采用分层架构，兼顾高性能作业区与容量型数据区，可扩展至E级。”卢宇彤介绍，“灵晟”构建大规模超智融合框架，自研全栈软件，将底层硬件能力以可用、可编程、可优化的方式释放给应用，提高各领域应用性能。

第三问：“灵晟”赋能实力如何？

超算的终极使命不是“跑分”，而是给各行各业的创新托底。

卢宇彤介绍，“灵晟”定位为面向科学、工程、智能计算的国产全栈融合基础设施。

据了解，自系统部署以来，“灵晟”已支撑大气海洋、工程仿真、材料科学、药物发现、脑科学、大模型推理等多领域应用，支撑混合精度计算、工作流和复杂多任务并行运行，在大规模并行环境下平均扩展效率可达84.4%。

如今，面向科学、工程、产业各领域的大规模应用需求，“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。

在遥感领域，国家超级计算深圳中心副主任付昊桓介绍，其团队依托“灵晟”开展遥感模型的大规模训练与系统优化，全机端到端训练峰值性能在该领域领先，实现全球8年时序遥感影像高倍压缩与高效重建。目前，相关技术支撑遥感解译与降水预报，显著提升预报精度，助力国土监测、灾害预警。

在生物信息领域，中山大学计算机学院教授杨跃东说，基于“灵晟”，已实现单日十万亿级化合物虚拟筛选。结合AI强化学习方法，筛选效率提升千倍，将有力支撑创新药研发与精准医疗。

超算普遍存在性能越高功耗越大的难题，而“灵晟”不仅跑得快，还跑得绿色。卢宇彤介绍，“灵晟”首创100%全液冷散热计算机柜，以51GFlops/W（每秒10亿次浮点运算/瓦）能效比，在拥有全球顶尖持续运算性能的基础上，树立绿色计算新标杆。

(责任编辑：黄春棉)