在最新自研TPU(张量处理单元)芯片的推动下,科技巨头谷歌向AI(人工智能)芯片龙头英伟达发起冲锋。
近日,研究机构SemiAnalysis发布报告,解释了谷歌如何成为英伟达在商用芯片领域最具威胁的竞争对手。SemiAnalysis的模型数据显示,从TCO(总体拥有成本)的角度来看,谷歌第七代TPU芯片在成本效率上对英伟达构成了碾压优势:客户采购越多谷歌TPU,能够节省的英伟达GPU资本开支就越多。
SemiAnalysis指出,以OpenAI为例,自从其于2024年5月发布大模型GPT-4o以来,OpenAI还没能完成任何“面向下一代前沿模型”的大规模预训练部署。尽管OpenAI尚未从英伟达GPU转向谷歌TPU,但在TPU带来的竞争压力下,OpenAI已经从英伟达处获得了约30%的算力集群报价折扣。
TPU(Tensor Processing Unit)是谷歌于2016年公开的自研AI专用集成芯片(ASIC),主要用于加速机器学习模型的训练和推理。与英伟达的GPU相比,TPU的通用性较差、功能更专一,但功耗也更低。此前,谷歌并不会直接出售TPU,而是允许其他企业通过谷歌云来进行租用。
SemiAnalysis强调,谷歌的AI基础设施优势不是在于芯片参数,而是来自其系统级工程能力,也就是说“系统比微架构更重要”:“依靠系统设计、互联、编译器和整体软硬件协同,谷歌能够让TPU在实际性能和成本效率方面与英伟达相当。”
今年11月,谷歌宣布,公司第七代自研TPU芯片Ironwood即将正式发布。据介绍,Ironwood在训练和推理方面的性能比上一代芯片提升了4倍多,采用了先进的互联架构,单个POD(AI超级计算机单元)可连接多达9216颗Ironwood芯片,并通过每秒9.6 Tb(太比特)的突破性ICI(芯片间互联网络)连接成一个“超级pod”,访问高达1.77 PB的共享高带宽内存(HBM)。
根据SemiAnalysis统计的数据,从技术角度来看,Ironwood芯片在每秒浮点运算(FLOPs)和内存带宽方面几乎追上了英伟达的Blackwell GPU系列。如果谷歌自用该芯片,每颗芯片的TCO比同等配置的英伟达GB200系统低约44%。
SemiAnalysis认为,谷歌正在努力成为“真正差异化的云服务供应商”。今年10月,AI初创公司Anthropic宣布与谷歌达成合作,将部署多达100万个谷歌的TPU芯片以训练旗下AI大模型。在约定部署的100万颗芯片中,首批约40万颗最新TPU芯片将由与谷歌共同设计芯片的博通直接出售给Anthropic,价值约100亿美元;剩余的60万颗芯片则通过谷歌云进行租赁。
目前,英伟达也感受到了来自谷歌的压力。当地时间11月25日,有消息称Meta正在考虑从2027年起在其数据中心部署谷歌的TPU(张量处理单元),价值达到数十亿美元,还可能在明年通过谷歌云租借TPU,令英伟达当天股价盘中一度跌超7%。
对此,英伟达当天公开回应称,公司的GPU“仍领先行业一代”:“与专为特定AI框架或功能设计的ASIC(专用集成芯片)相比,英伟达提供更高的性能、更强的通用性以及更好的可替代性。”


还没有评论,来说两句吧...