科学研究 - 日本超算 “富岳”一举摘得四项排名桂冠，超出中美多倍

日本理化学研究所（以下称“理研”）担任开发主体，联合九州大学、Fixstars公司和富士通公司共同开发的超级计算机“富岳”在全球超算排名①TOP500、②HPCG、③HPL-AI及④Graph500中均获得最高排名，并且均高出排名第二位的超算许多。一架超算在TOP500、HPCG和Graph500排名中同时斩获世界第一，也是全球首次的壮举。

还在不断开发和构筑中的超级计算机“富岳”（图片：理研）

TOP500是被称为LINPACK（密集矩阵直接解决方案）的基准测试程序的性能排名。主要侧重于科学技术计算和产业应用中使用的浮点运算能力。该评测排名始于1993年，每年评测2回。在该排名中居首的超算通常被称为“世界第一超算”。

“富岳”的TOP500得分为415.5PFLOPS（每秒40京次以上的计算），为目前排名第二位的Summit（美国，148.6PFLOPS）的2.8倍。日本的上一代超算“京”在2011年获得2连霸后便跌下第一的宝座，之后中国的超算后来居上，与美国超算轮番争夺头把交椅。

TOP500排名

第1名　富岳　理研计算科学研究中心（日本）41京5530万亿次/秒
第2名　Summit　橡树岭国家实验室（美国）14京8600万亿次/秒
第3名　Sierra　劳伦斯利弗莫尔国家实验室（美国）9京4640万亿次/秒
第4名　神威太湖之光　无锡超算中心（中国）9京3014万亿次/秒
第5名　天河2A　广州超算中心（中国）6京1444万亿次/秒

另外，“富岳”还在产业界采用的高性能共轭梯度法基准测试HPCG以及图表解析性能排名Graph500中排名第一，在人工智能的深度学习中使用的计算指标HPL-AI上也排名第一。

“富岳”的HPCG得分为13.4PFLOPS。为排名第二位的Summit（2.92PFLOPS）的4.5倍以上，遥遥领先。这表明“富岳”的实用性非常高，有望通过模拟解决社会课题等。

Graph500所代表的大规模图表解析性能在需要进行大规模和复杂数据处理的大数据解析中是重要指标，虽然“富岳”还处于开发和构筑阶段，联合研究团队利用“富岳”的一部分硬件——92,160个节点（约占整体58％），以平均0.25秒的速度成功解决了由大约1.1万亿个顶点和17.6万亿个分支构成的超大规模图表的广度优先搜索问题，其Graph500得分为70,980GTEPS，而“京”的测试结果为31,302GTEPS（截至2019年6月），可见“富岳”的性能达到了“京”的2倍以上。

在2020年6月发布的“Graph500”排行榜中位居第二的是中国的“神威·太湖之光”，其测试结果为23,756GTEPS。也就是说，“富岳”的性能比排名第二的“神威·太湖之光”超算高出约2倍。

2．关于Graph500

现实世界中的复杂现象经常使用大规模图表（利用顶点和分支来表示数据之间的关系）来表现，因此需要使用计算机高速解析图表。以社交网络服务等为例，解析“谁与谁有联系”等存在关联的数据时就使用图表解析。

另外，为实现Society 5.0，业界正在开拓把利用IoT（物联网）等技术取得的大量数据转换成图表并使用计算机高速处理，从而创造新价值的新业务。其目的是在创造新产业的同时，减少废弃物排放，有望为推进“可持续发展目标 (SDGs)”中的9（产业、技术创新、社会基础）和11（可持续发展城市建设）做出巨大贡献。

为具备多种用途的图表解析性能进行排名的就是Graph500。Graph500始于2010年，排名每年更新2次（6月和11月）。

Graph500为处理顶点超过1万亿个的大规模图表，需要将图表的数据分散配置到多个节点上。联合研究团队开发了能在超级计算机上高速解析大规模图表的软件。

联合研究团队表示，“京”的测试结果连续9期（2014年6月～2019年6月，总计10期）蝉联Graph500全球榜首。不过“京”目前已经停止运行，因此不在2019年11月以后的排名中，但此次的“富岳”的测试结果远远高于“京”。另外，除了“富岳”，“京”创下的记录还未被其他超算打破过。

在Graph500中排名第一意味着，不仅是科学技术计算中常用的规则计算，“富岳”在不规则计算占一大半的图表解析方面也具备高性能，这表明“富岳”的通用性非常高，可以广泛用于很多领域。另外也表明开发了能最大限度发挥硬件性能的软件的联合研究团队技术实力非常高。

开发费用中，日本政府投资约为1100亿日元。虽然正式投入运行为2021年度，但作为新型冠状病毒感染症（COVID-19）对策，已经开始尝试使用“富岳”来寻找候补治疗药物以及模拟飞沫传染路径等研究。

利用“富岳”模拟计算的飞沫传染路径（NHK报道截屏）

3．名词解释

（1）超级计算机“富岳”

日本超算“京”的后续机型。目标是通过解决社会和科学课题为日本的发展做贡献，创造世界领先的成果，计划作为电力性能、计算性能、用户便利性和易用性、创造划时代的成果，以及大数据和AI（人工智能）的加速功能等综合能力均达到全球最高水平的超级计算机，于2021年投入运行。

“富岳”是“富士山“的别名，其名称中借日本第一高峰富士山代表“富岳”的高性能，而富士山脚下的广阔原野代表“富岳”的用户范围之广泛。

（2）TOP500

被称为LINPACK（密集矩阵直接解决方案）的基准测试程序的性能排名。始于1993年，在该排名中居首的超算通常被称为“世界第一超算”。主要侧重于很多科学技术计算和产业应用中使用的浮点运算能力。

“富岳”的TOP500得分为415.5PFLOPS（每秒40京次以上的计算）。为排名第二位的Summit（美国，148.6PFLOPS）的2.8倍。

（3）HPCG（高性能共轭梯度算法）

采用计算由稀疏系数矩阵构成的线性方程的方法——共轭梯度法（conjugate gradient method）的新基准测试程序。

由于在TOP500中的性能与执行实际应用时的性能存在偏差，因此业界提出了利用汽车和飞机的空气动力设计及结构计算等实际应用中常用的共轭梯度法程序来评测性能。

“富岳”的HPCG得分为13.4PFLOPS。为排名第二位的Summit（2.92PFLOPS）的4.5倍以上，遥遥领先。这证明“富岳”的实用性非常高，有望用来通过模拟解决社会课题等。

（4）HPL-AI

衡量允许使用低精度计算的HPL（高性能LINPACK）性能的基准测试。

近年来，很多计算机的GPU和人工智能用专用芯片通过大量配备进行低精度运算（10进制5位数或10位数）的运算器来提高性能，被用于深度学习等AI处理，但这些性能的运算性能未体现在TOP500中，因此提出了HPL-AI。目的是通过间接评测低精度运算的运算能力，来评测深度学习等AI处理的性能。

“富岳”的HPL-AI得分为1.42EFLOPS，为排名第二位的Summit（0.55EFLOPS）的2.5倍以上，表明对AI的适应能力很高。

（5）Graph500

用于大数据解析的超大规模图表搜索能力基准测试。现实世界中的复杂现象经常使用大规模图表（利用顶点和分支来表示数据之间的关系）来表现，因此需要使用计算机高速解析图表。要想在该基准测试中得高分，不仅是运算能力，存储器性能和网络性能也很重要。

在Graph500基准测试中的执行速度得分用TEPS表示。Graph500的基准测试内容是处理给出的图表的顶点和连接顶点的分支。计算机在Graph500测试中的速度被定义为每秒处理的分支数。TEPS是Traversed Edges Per Second的首字母缩写。GTEPS的G表示10的9次方，GTEPS是每秒处理的分支数除以10的9次方得出的值。计算GTEPS的值使用64次试验的谐波平均值。“E”为“P”的1000倍。1E为100京。

“富岳”的Graph500得分为70,980GTEPS*，约为排名第二位的神威·太湖之光的23,756GTEPS的3倍。

日语发布原文

文：JST客观日本编辑部