龙芯3D5000发布,性能接近Zen2。

一直以来,国产电脑都面临着“缺芯少魂”的困难,芯指的是处理器,是一台电脑的核心,而魂则是操作系统。不过,随着近年来国家大力发展半导体产业,“缺芯少魂”的情况已经有了一定程度上的改善,作为国家半导体主力的龙芯,更是在近日发布了3D5000系列芯片,性能接近Zen2架构的处理器。


Zen2虽然是AMD在2019年发布的架构,但是依然属于国际主流处理器的行列,其性能在大多数时候都是绰绰有余的。单就性能来说,已经是站在了自研国产处理器的顶峰,这不禁让人好奇,龙芯是怎么做到的?


3D5000性能战Zen2?


此次龙芯发布的3D5000与去年发布的3C5000同属一个系列,实质上就是将两颗3C5000核心封装在一起,通过特殊的连接协议使其成为一颗单独的处理器,类似的设计思路在半导体行业中并不少见,一般会被网友称之为“胶水核”。


640.jpg

图源:龙芯


虽然这种设计方式看起来简单且粗暴,但是设计合理,那么就可以轻松提升单颗处理器的性能上限。当然,缺点也是明显的,一方面是双核封装会带来功耗的飙升,另一方面则是封装体积过大,不适用于普通民用市场。


所以,3D5000与3C5000的定位不同,将主要面向服务器市场,不会在消费级市场发售。作为基础核心的3C5000,性能并不弱,早前小雷也专门进行过一次报道,3C5000采用16核心设计,主频为2.0GHz-2.2GHz,unixbench分数达到95000分以上,双精度计算能力可达560GFlops,峰值性能与典型ARM 64核处理器相当。


微信截图_20230113204628.png

图源:龙芯


那么封装了两个3C5000的性能又如何呢?从官方给出的参数来看,3D5000采用32核设计,集成64MB L3缓存,支持最多8个DDR4-3200 DRAM,同时支持HyperTransport接口,最多可以支持四路处理器互联,单主板最高可以提供128核的运算支持。


另外,从目前的测试结果来看,单就IPC性能而言基本上是持平了同主频且核心数相同的Zen2 EPIC处理器,但是对于Zen2 EPIC处理器而言,3D5000的最高2.2GHz仅仅是勉强摸到了同核心数处理器的下限,比如EPYC 7452的基准频率就达2.35GHz,加速频率可达3.35GHz。


微信截图_20230113204746.png

图源:AMD


或许看完数据对比,大家会对龙芯的性能感到悲观,但是从产业发展角度来说,其实已经是一个很大的进步,而且3C5000与Zen2系列处理器使用的制程工艺并非一个世代的,前者为12nm工艺,后者则是7nm工艺,架构+主频的差距,使得3C5000主频表现疲弱,而这并不是无法解决的。


3D5000能否撑起国产服务器需求?


在实测性能方面,官方给出了单路和双路的SPEC CPU2006 Base测试结果,在实测中单路得分超过400,双路得分超过800,在完整的四路配置下,预计SPEC CPU2006 Base分数可以达到1600分,基本上与英特尔的至强E5 2699 V4性能持平。


从目前的性能来看,3D5000已经可以取代部分英特尔的至强处理器,活跃在一些服务器和软件部署场景之中。当然,理智上讲,两者的区别依然巨大,但是至强系列本就是世界领先的服务器处理器,E5-2699 V4作为一款2016年推出的中高端产品,其性能还是颇为可观的。


微信截图_20230113204938.png

图源:微信计算机


当然,如果对比最近两年发布的处理器,那么不管是3D5000还是E5-2699 V4都相形见绌,自从在架构上取得突破后,英特尔和AMD的新一代处理器性能就以前所未有的速度向前狂奔,几乎淘汰了2019年之前的所有处理器。


即使是在服务器领域,新架构的服务器处理器在核心数、主频和IPC性能等方面都有着恐怖的提升。以AMD在2019年针对个人服务器市场推出的线程撕裂者3960X为例,在多核性能上已经被英特尔在2022年发布的i9-13900K击败,而后者只是一颗面向个人消费市场的处理器。


迅猛发展的处理器性能正在加速甩开其他竞争对手,但就目前的发展趋势来看,国产处理器想要完全取代英特尔和AMD是不可能的,至少在超大型服务器和个人工作站领域,英特尔和AMD仍然是目前国内大多数公司和用户的最好的选择。


那么3D5000就没有意义了?当然不是,作为一颗服务器处理器,其性能已经足够应付一般的信创服务器部署需要,在一些关键场所和机要部门,可以完全杜绝海外硬件的使用,带来更高的安全性能。


此外,龙芯的产品计划中,3C6000将会达到更高的IPC性能和主频,甚至可以真正匹敌Zen2架构的AMD EPIC处理器,想要做到这点,意味着3C6000的主频至少需要提高到2.5GHz,对于龙芯来说是一个艰难的任务。


而在更久远的7000系列处理器规划中,龙芯希望可以借助7nm工艺将处理器的IPC性能推进到Zen3和12代酷睿处理器的水平。虽然从现在看来八字还没一撇,但是已经初步验证了架构的可行性,只要相关制程工艺跟上就有机会实现这个目标。


在龙芯的计划中,7000系列将会提供单个24-32核的3D7000和48-64核的3E7000,后者或将由两颗3D7000组合而成,届时性能或许将可以持平国外主流服务器处理,使得中低端服务器的搭建不再依赖于国外产品。


微信截图_20230113205054.png

图源:龙芯


不过,即使在硬件性能方面追上英特尔和AMD,对于龙芯来说还有许多问题需要解决。首先,龙芯使用的并非x86架构,而是一个全新的自研处理器架构,意味着大量的主流专业软件都将无法正常运行在龙芯的处理器环境中。


在服务器等专业领域,失去了专业软件的支持基本上就失去了主流市场,这也是ARM处理器即使在能效比等方面表现出色,依然无法抢占x86市场的原因,许多专业软件都仅仅针对x86架构做了优化,如果想通过编译等方式使其运行在新环境下,会面对性能损失、稳定性下降等问题。


如果龙芯想要进入商用服务器市场,那么在软件生态适配方面也要下功夫,单颗硬件性能是无法站稳商用市场的。当然,我知道现在谈龙芯的商用发展还为时尚早,龙芯目前更多的是服务于政府等对国产化要求高的行业和领域,对于商业公司来说没有必要也不需要采购龙芯来设计部署服务器。


而且,龙芯也在推进软件生态的发展,比如通过二进制编译器来翻译兼容x86生态中的软件,与国产系统合作,推动系统和软件的适配等,随着使用者的增加,相信在未来可以构建出属于自己的架构生态。