“陈工,这又是哪路神仙塞过来的‘国货精品’?
上次那个什么所送的‘华芯’处理器,连奔腾100的性能都比不上,
功耗还高得吓人,测试都懒得测,直接退回去了。
这不会又是来浪费咱们电费和人力的吧?”
陈副主任没说话,只是仔细看着那份措辞极其谦恭、甚至有些卑微的“适用性评估申请函”,
落款是“汉芯集成电路设计有限公司”,后面还有一个让他眼皮微跳的名字——“祁同伟”,
陈副主任隐约知道这位年轻书记的一些背景,尤其是其祖父。
“手续齐全,上面打了招呼,让安排测试。”
陈副主任叹了口气,揉了揉眉心,
“老规矩,走个流程吧。
小王,你带两个人,把它们搬到3号测试间去。
按照通用标准,跑一下LINPACK和HPCG,
再试着把我们那个简化版的‘长风’demo编译一下跑跑看。
数据记录下来,写个报告,意思到了就行。
注意,测试的时候,把功耗仪接上,别像上次那样,差点把测试间的电路给烧了。”
“得嘞!”
小王答应一声,招呼两个同伴,一脸不情愿地开始搬动机箱,嘴里还嘟囔着,
“又是关系户,净耽误工夫。有这时间,我多优化两行代码不好吗?”
3号测试间是一个相对独立的区域,设备稍旧,但用于基础测试绰绰有余。
小王和同事按照标准流程,将四台“试金石”平台上架,连接网络、电源、功耗仪。开机,进入基于Linux改造的简易系统。
“咦?这系统还挺干净,驱动都打好了。”
小王稍微有些意外,但也没多想。
他开始编译LINPACK。
由于“天机”兼容MIPS,编译过程虽然需要替换交叉编译工具链,但还算顺利,没有出现太多奇怪的错误。
“开始跑吧,估计得等半天。”
小王设置好参数,启动了测试程序,然后就和同事回到工位,忙自己的事情去了,几乎忘了这边还在运行的测试。
几个小时后,LINPACK测试率先完成。
小王被终端提示音叫回测试间,漫不经心地看向屏幕,准备记录那个预料中不会好看的数字。
下一秒,他的眼睛猛地瞪圆了,身体瞬间僵硬!
屏幕上,代表双精度浮点性能的最终结果,赫然显示着一个他反复核对了三遍才敢确认的数字——1.2 TFLOP/s(每秒1.2万亿次浮点运算)!
“这……这不可能!”
小王失声叫道,声音在安静的测试间里显得格外刺耳。
他负责维护的、基于双路英特尔至强处理器(当时最先进的型号之一)的对比测试平台,
同样的LINPACK测试,最好成绩也就1.1 TFLOP/s左右!
而这套“野牌子”国产平台,竟然还超出了0.1 TFLOP/s?
虽然优势不大,但……这是超出!不是接近,更不是远低于!
“功耗!看看功耗!”旁边的同事也反应过来,急忙去看功耗仪的记录。
数据显示,在LINPACK满载运行期间,这套国产平台的整体功耗(包括CPU、GPU、内存、主板)为980瓦。
而对比的英特尔平台,同样的测试,功耗是1150瓦!
性能略高,功耗还低了近200瓦!
小王和同事对视一眼,都从对方眼中看到了巨大的震惊和一丝荒诞感。
是测试程序出错了?还是功耗仪坏了?
“快!跑HPCG!把简化版‘长风’也编译了跑起来!快!”
陈副主任不知何时也闻讯赶了过来,脸上的轻松早已消失,取而代之的是前所未有的凝重和一丝隐隐的激动。
HPCG测试对内存带宽和延迟更敏感,更能反映实际应用性能。
结果很快出来:国产平台的优势进一步扩大,性能领先达到8%,功耗优势保持在15%左右。
真正的“王炸”,出现在运行简化版“长风”CFD核心求解器时。
这款代码经过五院多年极致优化,对CPU的缓存架构、向量化能力、以及并行通信效率都极其敏感。
当小王他们将移植好的版本(由“铸剑”软件组提供)在国产平台上运行时,最初十几分钟一切正常。
然而,当计算进行到某个高度非结构化的网格区域时,国产平台的性能曲线,
不仅没有像以往测试其他非主流架构时那样暴跌,反而……逆势上扬了!
最终,在“长风”这个核心测试上,国产平台的整体计算时间,比英特尔平台快了18%!功耗数据依旧亮眼。
“这……这架构……”
陈副主任死死盯着屏幕上飞速滚动的输出日志,作为资深专家,他敏锐地察觉到了一些不寻常之处。
传统平台遇到不规则内存访问或复杂依赖时,性能会明显下降,
但眼前这个“天机”,似乎通过某种动态调度机制,极大缓解了这种下降;
而那个“神笔”在并行处理网格单元计算时,利用率高得吓人。
“快!立刻安排完整版的‘雷暴’代码测试!
调用更多的节点!
做强扩展性测试!”
陈副主任的声音因为激动而有些颤抖,
“还有,立刻封存所有测试数据和日志!
没有我的命令,任何人不得外传!
小王,你们俩签保密承诺书!快!”
超算中心的气氛骤然一变,从最初的轻视和不耐烦,变成了如临大敌般的紧张和兴奋。
更多的专家被悄悄召集过来,测试方案被不断加码、细化。
从单节点到四节点互联,从短期运行到72小时不间断满载压力测试,
从标准基准测试到更多五院内部的核心代码……
“试金石”平台,如同沉默的巨石,承受着所有狂风暴雨般的考验。
而它反馈回来的数据,一次又一次地冲击着第五研究院这些见多识广的专家们的认知底线。
综合性能平均领先8-12%。
能效比领先15-20%。
在部分高度优化、高度并行的自有代码上,优势扩大到20-25%。
72小时满载压力测试,零硬件故障,系统稳定。
……
喜欢名义:人在军阁谁敢动我孙儿同伟请大家收藏:(m.20xs.org)名义:人在军阁谁敢动我孙儿同伟20小说网更新速度全网最快。