英伟达最大的对手出现了(图)
一周涨价30%,单片售价超十万。人工智能的火热,芯片的短缺,让英伟达A800成了市场上炙手可热的硬通货。
趁此东风,英伟达CEO黄仁勋一举成为和马斯克并肩,最受瞩目的企业家之一。英伟达的市值也飙升至1.17万亿美元,成了市场上最热门的科技公司。
然而一面是高端AI芯片的稀缺,一面则是“百模大战”,下游对算力需求高涨。面对才不过刚刚起势的市场,大大小小的竞争对手们,都在奋力追赶。它们希望打破眼下“AI芯片=英伟达”的格局,从这个万亿级的市场里分得一杯羹。
就在7月11日,英特尔在北京发布了专供中国市场的AI处理器Gaudi 2,它对标英伟达100系列,专为训练大语言模型而构建。
Gaudi 2的推出,意味着AI芯片市场里又有一位巨头下场。在英特尔之前,AMD也推出了自家的AI产品。英伟达、英特尔、AMD这三家从PC时代就鏖战不止的芯片三巨头,又在AI时代里正面交锋。
AI芯片市场里不会一家独大,随着一位位巨头入场,一场全新的竞逐,开始了。
交锋
借着推出Gaudi 2,英特尔向英伟达发起了正面进攻。
PC市场萎缩以及数据中心业务走软,让英特尔业绩承压。原本是服务器芯片市场“一哥”的英特尔的市场份额,被AMD等竞争对手蚕食。人工智能浪潮带来对算力的需求,则让英特尔看到了新的发力点。
Gaudi2由英特尔2019年斥资20亿美元收购的AI初创公司Habana Labs 设计,从推出的一开始,Gaudi平台就是为云端和数据中心提高深度学习训练效率而构建。
发布会现场,英特尔公司执行副总裁、数据中心与人工智能事业部总经理Sandra Rivera花了大量时间介绍Gaudi 2的性能,对比的对象,就是英伟达高端GPU A100和H100。
从演示的数据看,比如说Bert模型预训练,Gaudi 2 的性能是英伟达A100的1.7倍。至于更先进的英伟达H100,Habana Labs的首席运营官Eitan Medina表示,Gaudi 2 是目前为能够替代英伟达H100进行LLM训练的“唯一替代品”。在MLPerf 3.0 基准测试中,仅有Gaudi 2 与H100能够进行GPT-3训练。
从目前的数据来说,基于 GPT-3模型训练,Gaudi 2与H100尚有一定差距,单个H100的性能是Gaudi 2的3.6倍。不过Eitan Medina表示,随着9月英特尔发布对FP8的软件支持与新功能,Gaudi2的性价比预计将超越H100。
性价比,是Gaudi 2对抗英伟达100系列的一个核心优势。Eitan Medina告诉华尔街见闻,Gaudi2在运行ResNet-50时,每瓦性能约是英伟达A100的2倍,运行 1760 亿参数 BLOOMZ 模型的每瓦性能,则大概是A100 的1.6倍。
也就是说,在提供不错的性能的同时,Gaudi 2在能耗上明显优于英伟达A100,并且Gaudi 2也能从性价比层面挑战H100。英特尔也借此成为目前一众英伟达的挑战者中,最具竞争力的对手。
尽管同A100类似,Gaudi 2为了符合美国工业与安全局相关规定,与国际版存在差别。不过Eitan Medina表示,中国版Gaudi 2在整体性能上与国际版差别不大。明年计划推出的5nm Gaudi 3,也会在合规的情况下,提供给中国客户。
目前,英特尔已经与浪潮信息、新华三和超聚变等国内服务器厂商,以及百度智能云等公司展开合作。浪潮信息副总裁、浪潮AI&HPC产品线总经理刘军也表示,联合英特尔发布新一代AI服务器NF5698G7,支持8颗Gaudi2。
此外,Sandra Rivera透露,到2025年的时候,英特尔会把Gaudi的AI芯片和GPU两条产品线进行整合,届时会推出一个更完整的下一代GPU产品。通过广泛的产品线,满足各种不同的需求。
竞逐
英特尔不是首家向英伟达发起冲锋的芯片巨头。
去年6月,AMD也推出CPU+GPU架构的Instinct MI300,进军AI训练市场。随后在今年6月,AMD又通过祭出高达192 GB HBM内存的MI300X,进一步为满足大模型训练进行优化。
AMD的数据中心硬件主管Forrest Norrod称,ChatGPT引领的AI热潮让AMD也感到意外。业内还是迫切希望英伟达有一个竞争对手,能够在英伟达的芯片之外,还有一个替代的选项。
事实也是如此。日益增长的大模型训练需求,与产能受限,让英伟达充满了“幸福的烦恼”。英伟达方面透露,其订单已经排至2024年,像H100在明年一季度之前都处于售罄状态。
前不久的世界人工智能大会(WAIC)上,清华大学电子工程系主任汪玉也强调了目前算力资源的紧张。他表示,部署成本高、模型算力缺口大以及国产芯片生态需要扩张和构建,是目前大模型落地的三大挑战。
算力需求持续增长,以及大模型玩家渴望通过使用更优秀产品,以减少与OpenAI等厂商算力支持差距,都让市场里对算力的需求高企。半导体市场里的玩家也随之迎来全新的机遇。
Sandra Rivera表示,在一季度,人工智能带来的芯片需求,让英特尔包括Gaudi在内的产品需求翻了至少两倍。此外,在AI用例及市场需求爆发式增长的时候,第四代至强处理器也有很好的市场回响。
按照摩根士丹利的预计,包括英伟达和AMD的GPU、AI计算专用芯片以及这些芯片的外包生产在内,今年全球AI计算半导体市场年销售规模大概会在430亿美元。四年内,全球AI计算半导体市场销售额会达到1250亿美元。这在全球半导体受消费电子销售放缓,收入下降预期中,是一个增长的亮点。
这个万亿人民币的市场,也自然吸引了大小玩家,前赴后继地蜂拥而入。他们相信,市场里不止有一个英伟达。
英伟达确实有自己的壁垒。GPU相比CPU在并行计算能力、内存带宽等性能和浮点运算速度上具备明显优势,英伟达也借此在模型训练和推理上先行一步,领先了AMD和英特尔等玩家。英伟达统一计算设计架构CUDA也靠着封闭的生态,形成了自己的软件生态,绑定了百万计的开发者。
Sandra Rivera也承认,在目前进行人工智能、AI运算的时候,很多人都在用CUDA。然而在她的观察中,很多大模型的开发者不会做这么底层的开发,会在PyTorch、TensorFlow上做创新。
这也是英特尔等玩家的机遇。Sandra Rivera认为,软件开发或者开发者生态一直是英特尔的强项,在数据中心领域,除了CUDA,就是英特尔的X86软件生态。英特尔则希望为摆脱封闭生态系统,寻求效率与规模的的客户提供更具竞争力的选择。
除了英伟达、AMD和英特尔三个芯片巨头,市场上仍有大玩家摩拳擦掌,准备下场。马克·扎克伯格旗下的Meta Platforms在7月18日宣布,将携手高通,采用高通芯片,以在手机和个人电脑上运行Meta新大型语言模型Llama 2;马斯克也在xAI会议上表示,准备自研AI芯片。
在火热的“百模大战”之外,硬件端的战役也已打响。传统芯片巨头和不断涌现的新玩家们在AI上战得火热,如今浪潮初起,一场全新领域里的王者之争,方拉开序幕。