起底华为计算战略:十五年研发下苦功,三年连发10芯加速
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 每一次华为新动作,点赞有之,质疑亦随之。 9月18日刚在全联接大会上发布的“全球最快AI产品”就是这样。 但在现场、在华为内部来看,这只不过是“华为计算战略”艰苦奋斗的开花结果,只是这盘芯片和计算力大棋局里关键一子。 △ 华为Cloud & AI产品与服务总裁侯金龙 而且相比Atlas(古希腊神话里的“大力神”),实际不到三年时间里,华为已经发布了10款商用芯片:
按外泄的规划,接下来的两年内,至少有6款芯片发布落地。 无论是计算领域,还是半导体行业,如此阵仗,势头都异常猛烈。 所以背后原因究竟是什么?华为又究竟想做什么? 计算战略发布后,是时候对这盘大棋来次完整起底,揭秘华为在计算背后的种种规划与布局。 15年苦功夫,目前投入2万名工程师 围绕计算这个产业投资,十几年前已经开始了。 其中最具标志性的事件是2004年4月,旗下芯片公司海思半导体成立。 华为Cloud & AI产品与服务总裁侯金龙透露了这背后的投入:
基础芯片族带来的意义非常直接。华为成为了业界唯一同时拥有计算架构中“CPU,NPU,存储控制,网络互连,智能管理”5大关键芯片的厂商。 但俱往矣。 从产品发布的节奏来看,华为对芯片投资的力度还在快速加强,迭代也越来越快。 华为投资芯片的策略,此前也有曝光,总结起来就是三个关键词:量产一代、研发一代、规划一代。 以鲲鹏系列处理器为例,从2007年走到现在已历时12年,现在是第三代芯片。 现在华为释放出的最新信号是:鲲鹏+昇腾会长期演进,按照每年推出一代的节奏来提升竞争力。 这也是华为在不到3年内推出10款芯片的直接推动力量之一。 当然,上述种种努力和产品,只是果,细究“因”,则是华为对于行业变迁趋势的核心判断。 华为芯的机会:趋势变迁下的2万亿市场 在华为看来,当前的计算产业正在发生深刻的变化,尤其是整个社会向智能时代的迈进,这带来了变革与挑战,也带来了机会。 全联接大会上,胡厚崑援引了Gartner的数据——全球计算产业总空间为两万亿美元。在他看来,这是一片大蓝海,华为将坚定在计算领域的投入,并推进落地。 侯金龙进一步阐释四大趋势,也可以说是华为投资芯片进入这一蓝海的主要切入点: 首先,数据中心不够用了 对于数据中心来说,以前其承担的职能更多的是存、但未来更重要的是算,数据中心正在逐步演变为计算中心。 最直接的体现就是,大规模数据中心中服务器越来越多。就以华为云的数据中心为例,有60%都是用于计算的服务器。 可以说,计算正在成为数据中心的主体,这就是华为推动鲲鹏系列芯片的重要原因之一,也是鲲鹏芯片的使用场景。 与此同时,整个行业对AI算力需求也越来越大,而且来得更加汹涌,从2012年到2018年,AI算力消耗几乎增长了30万倍。 现在每年的增长超过10倍,到2025年,AI算力将会占据数据中心算力的80%以上。 正是在如此算力需求下,华为推出了昇腾910以及Altas 900等AI计算产品。 其次,端边芯片与中心芯片还有大差距 在华为看来,Arm在生态上的优势会逐渐向数据中心延伸。对于华为来说,这是挑战,也是机会。 现场,侯金龙也分享了一组数据:
以前基于Arm的技术,之所以不能在数据中心使用,核心的限制是性能。 但解决问题导向,华为现已找到对策。 其今年发布的鲲鹏920是兼容Arm,多核、高并发,把四颗核心并入了一颗核心,其性能超过业内通用CPU 20%的性能。 而且现在的计算,可以让简单的计算在终端进行,复杂的计算可以在云上进。 如果继续用X86架构在云上计算终端的任务,效率就会降低40%,反之如果运用Arm架构,则提升40%。 第三,计算该绿 高性能的计算虽然更有效率,但背后也有大量的碳排放。 美国马萨诸塞大学阿姆赫斯特分校做过研究,训练一个单一AI模型,会产生180吨的碳排放。 这相当于普通汽车整个服役期排放量的3倍,平均地球人30年日常生活的碳排放。 算力与效率背后,也需要对能源与环境更友好。从芯片层面上来看,要在更小的功耗下实现更高的性能。 在这方面,华为的底气很足。 侯金龙说,华为的Atlas 900 AI训练集群,算力达到256 PFLOPS只需要16个机柜。 要实现这样的算力,如果用CPU需要6195个机柜, 用GPU需要208个机柜,而NPU如昇腾只要128个机柜。 这背后,主要归功于昇腾架构对深度学习业务的优化。 此外,经过华为系统级优化,如板级液冷、柜级密闭绝热等,整个集群的功耗从4万kW降到736kW,降低50多倍。 最后,摩尔定律放缓已成事实 经过数十年的快速迭代发展,高速的摩尔定律已经难以实现。 过去5年,通用CPU的发展遇到了许多技术瓶颈,单核性能平均每年提升不足10%,摩尔定律放缓已经成为事实。 想要进一步实现提高技术能力,在晶体管上打主意太难了,需要寻找其他路径。 (编辑:ASP站长网) |