infowei 发表于 2021-5-15 22:14:20

Arm高性能之路:从全军覆没,到重整旗鼓

Arm近两年在低功耗之外的高性能领域,生态的高歌猛进超出所有人的意料。尽管市场还有国际贸易环境、英伟达收购、RISC-V崛起等不确定因素的掺杂,Arm触及高性能领域而且取得阶段性成果是不容置疑的。


万物互联的发展趋势,5G、新冠疫情客观上促成基础设施市场的爆发式增长,也在大环境上为Arm在这些领域的发展提供了机会。Arm早已不是5年前那个仅在低功耗领域为众人津津乐道的指令集了。


电子工程专辑近几年见证了这段跌宕起伏的历史,参与到Arm生态扩展至移动与嵌入市场之外的主要角色包括了苹果、高通、英伟达、微软、亚马逊、Ampere Computing、华为、等等。





Arm高性能时代的推进

在x86牢牢统治高性能计算市场之时,众人对Arm有着骨子里“只能做低功耗”的偏见。如果将这种偏见前期与后期做切分,则在前Arm高性能时代已经有Arm可应用于高性能的征兆了:2013年,苹果在iPhone 5s时期就宣称A7芯片的Cyclone架构是“桌面级架构”。


2014年,英伟达透露面向HPC的Arm处理器Denver相关信息,称其能效与Haswell相仿(第4代Intel酷睿)。这两件事情是颇具代表性的,虽然当时谁也没有真正在意过,只觉Arm征战高性能就是个笑话。


而在步入“后Arm高性能时代”,2018年Arm宣称旗下新推Cortex-A76核心“已媲美低压版酷睿i5”,则应当算是颇具标志性意义的分水岭事件。高通随后基于Cortex-A76推出骁龙8cx处理器,面向Surface Pro X这样的笔记本产品。直到去年苹果面向MacBook笔记本发布基于Arm指令集的自研M1芯片;同期,Arm面向基础设施覆盖从云到边缘,正式推出Neoverse系列IP,这两件事情正式向世界宣告,Arm面对高性能很认真。


本文以简略的方式回顾2017至今,Arm将影响力扩张至移动/嵌入式市场之外的那段历程。点击文中任意超链接,跳转至相应事件与评论了解电子工程专辑在全过程中留下的文字记录。





从试探到几乎“全军覆没”

“全军覆没”当然还是得打个引号的,毕竟从那个时代存活下来的Arm高性能芯片玩家也有不少。PC市场暂且不论,虽然Arm早在2014年就推出了首个Arm服务器平台标准,但除了英伟达Project Denver这种颇具代表性的前期尝试和失败,在Arm推进高性能之路的过程中,有大量具有标志性的事件都证明Arm前期在这一领域是失败的。比如说其中的一个典型代表:高通Centriq服务器处理器。


高通于2017年11月宣布Centriq 2400服务器处理器出货,有关Centriq处理器的历史最早可以追溯到2014年。那年高通就宣布正在开发一款面向数据中心、基于Armv8-A架构的CPU,核心微架构名为“Falkor”。在具体配置上,芯片配备了至多48个核心,最高主频2.6GHz。


高通当年信誓旦旦地表示,Centriq效率很高,比英特尔至强处理器的功耗明显更低,每瓦性能和价格方面都比英特尔更强。只是Centriq的寿命实在不够长久,2018年年中高通服务器芯片负责人Anand Chandraskher确认离职,短短两个月后Falkor架构设计灵魂人物Dileep Bhandarkar也宣布离职。才半年多的时间,这颗Arm服务器CPU就已经败下阵来。


与之配套,国内颇具代表性的例子是华芯通半导体。这家公司是2016年贵州省政府和高通共同投资成立的。2017年,华芯通宣布与合作伙伴共同投资建立基于Arm服务器CPU的数据中心联合实验室。次年年中即宣布要推出一款可商用的通用服务器芯片——这一年的年底,华芯通昇龙4800处理器上市。


同样的好景不长,同期伴随高通Centriq芯片的破产,高通减少在数据中心业务上的投入,华芯通宣布于2019年4月关张。事实上,从产品形态来看配套服务器与Centriq 2400和昇龙4800的兼容,这两者的相似程度还是相当之高。这些实则都表明高通在Arm服务器芯片方面的计划步入停滞。


即便不谈周边生态,同时代并不怎么成功的例子还有很多,比如首个推出Armv8服务器芯片的Cavium(后被Marvell收购)。Cavium基于Arm的ThunderX1核心是在2014年末正式发布的。ThunderX初代产品整体上都是不成功的,包括高延迟的L2缓存、高延迟的DRAM访问,都让这颗48核处理器在很多软件中的表现不怎么样,而且低负载下还存在高功耗的问题,远不及当时的Intel Xeon D。


现在在Arm服务器领域比较知名的Ampere Computing前期产品也远远谈不上成功。Ampere比较早的eMag就基于Arm服务器SBSA标准,其Skylark核心来源于Applied Micro的X-Gene IP,属于比较有年代的Arm64设计了。这段历史在电子工程专辑2018年的杂志文章中有比较详细的描述。eMag和如今的Altra是完全无法相提并论的。


Applied Micro早年也属于Arm服务器处理器的先锋了,它最终的命运总体上证明了Arm在服务器市场一时是扶不上墙的。前Arm高性能时代掀起的这波Arm欲攻打服务器市场的热潮中,连AMD都开发过Arm服务器芯片;随着主要市场玩家相继被收购,AMD、Marvell、高通等在这方面的投入一时停滞,Arm服务器军团是几近全军覆没的。





PC市场的阶段性胜利

在继续谈基础设施市场之前,喘口气来看看对性能需求同样不低的PC、工作站市场。Arm对PC市场的攻打也从来不是一蹴而就的。微软从2011年起就在不停地给Arm暗送秋波,2012年应用Arm的Windows设备就诞生了。只是时代暂时还不允许这段“感情”发生,Windows RT、Windows 10S的失败仿佛都说明Arm要用于PC还远不是时候。


在持续了10年的各种试探中,Arm始终都没能在PC这个对性能还颇有要求的市场站稳脚跟。大众对Arm的认知普遍是:用在手机上还行,PC设备?还是洗洗睡吧。这段历史在《Arm的十年PC征程,和微软的“暧昧”》一文中有着详细的解释。Windows 10 on Arm以及高通骁龙8cx的推出,标志着Arm在PC市场的阶段性胜利。


Arm在行动上有决心征战PC设备的标志性事件是发布Cortex-X1核心,这是个部分牺牲了芯片面积与功耗,更多专攻性能的核心。包括如今面向HPC市场的Neoverse V1实则也是以Cortex-X1为基础的。要知道,以往的Arm核心IP普遍是以均衡PPA为设计哲学的。


说来也巧,与Cortex-X1推出前后脚,真正标志着Arm应对PC性能需求游刃有余的,还是去年苹果正式面向MacBook推出基于Arm的M1芯片。从2017年传出苹果准备自研Mac芯片的消息,到苹果先后挖角Intel工程师,以及苹果自身起码积累了10年以上的Arm芯片设计经验,才令M1芯片以震撼全场的姿态登场。


M1不仅证明了Arm要在PC和生产力设备上施展拳脚,真的一点毛病都没有,而且还吊打了盘踞该市场二十多年的Intel,不得不说是Arm生态铺陈的一次重大胜利。其原因与苹果自身在Arm芯片设计上十多年的投入、Arm本身的发展都有相当大的关系。业界当下正观望苹果打算以何种方式扩展Arm高性能核心,打造面向Mac Pro这类工作站级别的计算机设备。


在这股力量的推动下,微软向Arm的进一步靠拢似乎也会显现出大势所趋。去年年底就有消息说,微软考虑自研Arm处理器,并将其应用于Surface设备和Azure云服务器——算是向苹果和亚马逊同时取经了。即便这则传言的可靠性无法确认,却表明旧时代的生态已经松动。





重整旗鼓的新风潮

回到基础设施侧,亚马逊云AWS先于微软Azure一步,在2018年11月宣布推出Graviton处理器,应用于AWS服务器。Graviton是采用16个Arm Cortex-A72核心的芯片。不过亚马逊自研云服务器CPU真正引人侧目是从Graviton2开始的。


同一时期华为宣布推出型号Hi1620——也就是鲲鹏920的Arm服务器芯片。华为在发布会上说,随着Arm生态逐渐发展,越来越多的应用已向Arm架构迁移;更重要的是,对于多样化的计算任务,找到合适的架构才是最重要的;对于手机普遍适用的Arm芯片,当开发者在云端进行游戏应用开发时,Arm架构比x86架构更好。华为去年还宣布要在年内投入2亿推动鲲鹏生态发展。


2019年12月,基于Arm Neoverse N1核心的Graviton2问世。也是从这个时候开始,Arm应用于服务器的第二次浪潮席卷而来。此事缘起于2018年底,Arm正式宣布面向服务器的Neoverse问世,同时发布了Neoverse N1。这是Arm特别面向基础设施第一次认真推了专门的核心IP产品线。


此后不只是亚马逊,不少面向基础设施市场的芯片设计企业开推Neoverse N1芯片,都取得了相当不错的效果。其中比较具有代表性的是前文提到的Ampere Computing。这家公司基于Neoverse N1推出的Ampere Altra处理器,真正在能效方面和部分性能表现上超越了市场主流的x86产品。


Marvell/Cavium在推基于Arm指令集的ThunderX2/X3,虽然微架构并非来自Arm,却也在性能与能效表现上愈发成熟。2020年,在包括5G、边缘、云等诸多基础设施市场上,Arm头一次做到了全面开花。甚至包括在超算领域,去年年中成为超算第一的“富岳”,其A64FX处理器就是基于Arm。单纯从这些芯片本身的性能和能效来看,都不是前一次Arm服务器芯片风潮可比的。


前不久,Arm更新了Neoverse产品线,包括偏向HPC AI的Neoverse V1与基于更新架构的Neoverse N2。发布会上,Arm特别提到目前Graviton2被亚马逊应用到了更多实例中,这些实例的增量远超x86产品;未来要让Neoverse覆盖所有基础设施。这股风潮有愈演愈烈之势。





几个变量:英伟达、RISC-V、大环境

Arm如今看起来一切都是得意的了。只是在目前这个市场环境下,规避商业风险可能会是更多企业考虑的问题。去年9月,英伟达宣布400亿收购Arm,这对Arm而言是件喜忧参半的事情。


喜的部分在于,以英伟达目前在数据中心的地位,助推Arm在基础设施市场的发展是一拍即合的。或者说传统市场参与者对此应该感觉到真正的白色恐怖。而且今年的GTC大会上,英伟达还宣布即将面向HPC AI市场,推出自家的CPU,基于Arm Neoverse。


而忧的部分则在于,更多原本的Arm合作伙伴正考虑规避因收购可能造成的风险,启用备选项方案。其中RISC-V成为Arm之外的重要竞争对手,加上国际贸易环境变化正在促成RISC-V的快速发展,RISC-V这两年正在崛起。


更多Arm生态参与者鉴于篇幅本文未曾提起,如博通、AMD、飞腾……时代在变,你方唱罢我登场的戏码总在不停上演。当年偏安于低功耗的架构,如今正经历前所未有的巨变。旧时代的市场霸主此刻正使出浑身解数奋力抵抗,战局才刚刚写到最酣畅淋漓之处……

heming2216 发表于 2021-5-16 03:34:56

huangweiqiao 发表于 2021-5-16 08:06:00

小鑫鑫 发表于 2021-5-16 08:57:16

wangy2000 发表于 2021-5-16 09:06:02

luchonghui74 发表于 2021-5-16 09:29:02

谢谢分享!

梦想舞台hdc 发表于 2021-5-17 09:08:20

windowsxp2012 发表于 2021-5-19 09:25:11

页: [1]
查看完整版本: Arm高性能之路:从全军覆没,到重整旗鼓