今年以来,全球对大型模型创业的热潮导致了对计算能力的巨大需求增加,英伟达的H100、A100等用于大型模型训练的AI芯片受到欢迎。作为AI芯片的主要竞争领域之一,中国市场备受芯片巨头关注。
7月11日,英特尔(INTC.NASDAQ)在发布会上推出面向中国市场的第二代深度学习加速器——Habana® Gaudi®2(以下简称“Gaudi 2”)。该产品是一款ASIC(专用集成电路)芯片,由英特尔的Habana团队设计,采用台积电的7纳米工艺。Habana是英特尔在2019年斥资20亿美元收购的以色列AI芯片初创企业。
Gaudi 2去年在海外发布,此次推出的是针对中国市场的定制版本。在性能和配置方面,该芯片集成了24个可编程Tensor处理器核心(TPCs),配置了21个Gbps以太网接口,内存和缓存提升至96GB HBM2e和48MB SRAM,内存带宽升至2.4TB/s等。
据英特尔提供给时代周报记者的资料显示,Gaudi 2在测试GPT-3时表现出了强劲性能,在384个加速器上训练时间达到311分钟,从256个加速器扩展到384个加速器实现了近线性95%的扩展。这使得Gaudi 2成为除了英伟达产品外,唯一能够运行MLPerf GPT 3.0模型的芯片。
英特尔还透露,Gaudi 2的首批合作伙伴将包括百度智能云、浪潮信息、美团、紫光新华三等公司。其中,浪潮信息在发布会现场展示了基于8颗Gaudi 2加速卡HL-225B和双路第四代英特尔至强可扩展处理器的浪潮信息AI服务器NF5698G7;新华三宣布将适配Gaudi 2,推出专为大型模型训练的智能算力服务器H3C UniServer R5500 G6,算力提升3倍,GPT-4训练时间缩短70%。
对于英特尔来说,推出针对中国市场的定制版AI处理器意味着英特尔也在全力争取中国客户。2022年,中国区的营收在英特尔总营收中占比约为27%。
英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,在将Gaudi 2引入中国几个月的时间里,英特尔还对其进行了针对当下大型模型热潮的软件层面迭代优化。该公司计划在2024年推出采用台积电5纳米工艺的下一代Gaudi 3产品,并将在符合美国出口限制政策的前提下继续推出针对中国市场的定制版本
英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示:“英特尔正在降低人工智能的准入门槛,并加强客户在云端通过网络和智能边缘部署关键业务技术的能力,从而帮助构建中国人工智能的未来。”
在由ChatGPT引发的大型模型热潮中,提供底层算力的AI芯片被认为是一个必争之地。目前,在这个领域,英伟达(NVDA.NASDAQ)占据着绝对的主导地位,其A100和H100是GPU同类产品中的佼佼者,受到中国主流数据中心和云服务供应商的青睐。
因此,Gaudi 2被市场视为英特尔挑战英伟达的又一力作。
在发布会现场,英特尔毫不回避地将Gaudi 2与英伟达的同类产品进行正面比较。据介绍,Gaudi 2在每瓦的ResNet-50性能方面约为英伟达A100的2倍,相比AWS云中基于英伟达解决方案的性价比提高了40%,并预计在今年9月超越英伟达最新的H100芯片的性价比。
作为一款专用的AI加速芯片,与英伟达的通用GPU A100和H100相比,Gaudi 2的服务器成本更低,价格优势更为明显。然而,Habana Labs首席运营官Eitan Medina也承认,Gaudi 2在性能上落后于英伟达目前最高端的H100芯片。
在性能表现之外,CUDA(Compute Unified Device Architecture)生态系统一直是英特尔的强项。Sandra Rivera在接受媒体采访时表示,在AI计算中,确实有很多人使用CUDA,但在最近的大型模型领域,大部分开发者并不会从事底层开发,而是在较高层面上进行创新。Eitan Medina补充说,Gaudi 2已经是第二代产品,拥有多年的软件积累,底层软件库已经完备。“我们希望让开发者能够在最上层的20%比例中进行开发,这种开发与CUDA并没有直接的关联。”他说道。
不仅英特尔,越来越多的AI芯片制造商加入GPU芯片竞争,试图挑战英伟达这个“擂主”,其中不乏燧原科技、墨芯、沐曦等国内初创企业。在此前举办的世界人工智能大会(WAIC)上,燧原科技等初创企业也展示了自己的芯片制造能力。
根据摩根士丹利分析师的估计,今年AI芯片市场的年销售额将达到约430亿美元。而在未来四年内,AI芯片收入将达到1250亿美元。对于英伟达在市场上的竞争,Sandra Rivera强调市场需要替代品。“他们(客户)非常欢迎英特尔在推动AI普及方面发挥重要的领导作用。”他说。