深度:32家公司决战云端AI芯片!
智东西(公众号:zhidxcom) 文| 心缘 2019年,新的云端AI芯片战场正风起云涌。 过去几年,人工智能(AI)从一个被轻视的学术冷门研究突然爆红,一路狂奔到商业化的最前沿,在安防、金融、教育、制造、家居、娱乐等各个与人们生活息息相关的领域掀起了一股智能化升级和万物互联的飓风。 这场前所未有的技术革命的直接推动者,是国外谷歌微软Facebook、国内BAT等互联网巨头以及一众新生的AI初创企业,而这些公司快速在AI领域开疆辟土的灵魂支柱,则是提供源源不断高密度计算能力的AI硬件提供商。 AI硬件应用场景通常分为云端和终端,云端主要指大规模数据中心和服务器,终端包括手机、车载、安防摄像头、机器人等丰富的场景。 无论是在线翻译、语音助手、个性化推荐还是各种降低开发者使用门槛的AI开发平台,但凡需要AI技术之处,背后都需要云端AI芯片夜以继日地为数据中心提供强大的算力支撑。 根据NVIDIA在2017年亮出的数据,到2020年,全球云端AI芯片的市场规模累计将超过200亿美元,这个体量庞大的市场已成为各路芯片巨头虎视眈眈之地。 NVIDIA通用图形处理单元(GPGPU)即是乘着深度学习的东风扶摇直上,股价在2015年还是20美元,到2018年10月飙升至292美元,市值超过肯德基和麦当劳,一跃成为AI领域第一股,市值数十亿美元,坐享无限风光。 其火箭般的涨势惊醒了一众潜在竞争对手,风暴出现在地平线上。半导体巨头英特尔、AMD等奋起直追,谷歌、亚马逊、百度、华为跨界自研,还有数十家新生芯片创企揭竿而起,意图通过自研架构等方式突破云端AI芯片性能的天花板,重塑这一市场的版图。 本文将对云端AI芯片的战事进行全景式复盘,盘点加入战局的五大半导体巨头、七大中美科技巨头和20家国内外芯片创企,看曾经缔造神话的NVIDIA,能否维系它的传奇帝国?如今已经出现或者正在开发的新计算架构,能否适配未来的算法?哪些企业更有望在强手如林的竞争环境中生存下来? 谁能主导这场云端AI芯片战事,谁就掌握了将在未来云计算和AI市场的战役中赢得更多话语权。 一、十年押注,AI核弹发射 一切始于意外,又绝非一次意外。 十几年前,英伟达(NVIDIA)在经历过和数十家对手的激烈厮杀后,和AMD成为图形显卡领域的两大霸主。那时,大多数NVIDIA员工们,并不知道人工智能(AI)是什么。 彼时,NVIDIA总营收规模约30亿美元,其创始人兼CEO黄仁勋做了一个冒险的决定——每年为CUDA项目砸5亿美元,通过一系列改动和软件开发,将GPU转化成更通用的计算工具,累计总额近100亿美元。 这是一个极具前瞻性的决定。2006年,全球首款GPU上的通用计算解决方案CUDA现世,这一技术为编程人员带来越来越方便的入门体验,逐渐为NVIDIA GPU积累了强健稳固的开发者生态。 直到2012年,NVIDIA遇到了深度学习的风口。 这一年,加拿大多伦多大学教授、机器学习领域泰斗、神经网络之父Geoffrey Hinton带领课题组用GPU训练卷积神经网络(CNN)AlexNet,一举拿下ImageNet图像识别比赛的冠军,将AI推到了学术界焦点的历史性拐点。 GPU并非为深度学习而生,其并行计算能力竟与深度学习算法的逻辑一拍即合。每个GPU有数千个内核并行,这些核心通常执行许多低级的、繁复的数学运算,非常适合运行深度学习算法。 之后,越来越强的“CUDA+GPU”组合,凭借无敌的处理速度和多任务处理能力,迅速俘获一大批研究人员们的芳心,很快就成为全球各大数据中心和云服务基础设施的必备组件。 巨头们的云端AI芯片之战,悄然拉开序幕。 二、芯片巨头鏖战云端:NVIDIA独霸,英特尔AMD奋起 起步早加上生态稳健,NVIDIA很快就成为云端AI芯片市场的领导者。 NVIDIA在通往更强的道路上一往无前,陆续展示令人惊叹的Tensor Core、NVSwitch等技术,不断打造新的性能标杆。此外,它还构建了GPU云,使得开发者随时可以下载新版的深度学习优化软件堆栈容器,极大程度上降低了AI研发与应用的门槛。 就这样,NVIDIA靠时间、人才和技术的积累,垒起了坚不可摧的城墙。想要城池者,无不需要遵循NVIDIA指定的法则。截至今日,NVIDIA的工程师军团已逾万人,其GPU+CUDA计算平台是迄今为止最为成熟的AI训练方案,吞食掉绝大多数训练市场的蛋糕。 从功能来看,云AI芯片主要在做两件事:训练(Training)和推理(Inference)。 训练是把海量数据塞给机器,通过反复调整AI算法,使其学习掌握特定的功能。这个过程需要极高的计算性能、精度和通用性。 推理则是将训练好的模型拿来应用,它的参数已经固化,也不需要海量数据,对性能、精度和通用性的要求没有训练那么高。 GPU在训练市场的是一座难以翻越的高山,但在对功耗要求更高的推理市场,它的优势相对没那么明显。 而这里,也是入局偏晚的半导体巨头们聚集的方向。 ▲芯片巨头主要云端AI芯片产品不完全统计 1、GPU:NVIDIA赢者通吃,AMD抢垒7nm 芯片是赢者通吃的市场,云端AI芯片亦不例外,NVIDIA为加速数据中心应用推出的高中低端通用GPU,一直是各路玩家参考的性能标杆。 NVIDIA在短时间内投入数十亿美元动用数千工程师,于2016年推出了第一个专为深度学习优化的Pascal GPU。2017年,它又推出了性能相比Pascal提升5倍的新GPU架构Volta,神经网络推理加速器TensorRT 3也同期亮相。 在最新季度财报中,NVIDIA数据中心收入同比增长58%至7.92亿美元,占公司总收入的近25%,在过去的四个季度中总共达到了28.6亿美元。如果它能够保持这种增长,预计2019年的数据中心将达到约45亿美元。 和NVIDIA在GPU领域长期相争的AMD,亦在积极地推进对AI加速计算的研发。2016年12月,AMD宣布主打AI与深度学习的加速卡计划——Radeon Instinct。 说起来,AMD在深度学习领域的起步离不开中国公司的支持。百度是第一家在数据中心采用AMD Radeon Instinct GPU的中国公司,后来阿里巴巴也跟AMD签了合同。 (编辑:ASP站长网) |