英伟达与 Groq 达成推理技术授权协议芯片解密
芯片解密英伟达与 AI 芯片初创公司 Groq 达成非独家推理技术授权协议,英伟达支付约 200 亿美元现金获取 Groq 核心推理技术授权并吸纳其创始团队,Groq 保持独立运营与云端业务完整,旨在补强英伟达 AI 推理超低延迟与高能效短板,巩固 AI 计算主导地位。
一、核心协议内容
- 技术授权:芯片解密Groq 向英伟达提供其核心推理技术(含 LPU 架构、编译器与片上 SRAM 内存设计等)的非独家授权,英伟达计划将其整合至 NVIDIA AI Factory 架构,服务低延迟实时推理与大规模工作负载。
- 人才与团队:Groq 创始人兼前 CEO Jonathan Ross(谷歌 TPU 核心开发者)、总裁 Sunny Madra 及部分关键研发成员加入英伟达,负责技术融合与规模化落地。
- 公司独立与业务分割:Groq 继续独立运营,由原 CFO Simon Edwards 接任 CEO;GroqCloud 云端推理服务不受影响,维持正常运行。
- 交易性质与金额:非全面收购,为技术与人才的非排他性授权合作,交易金额约 200 亿美元(未获双方官方确认)。
二、Groq 技术核心价值
Groq LPU(Language Processing Unit)专为推理场景深度优化,采用编译器优先与确定性数据流架构,以片上大容量 SRAM 替代传统 HBM,实现超低延迟、高吞吐与高能效:
- 推理速度:在大模型场景下,部分负载推理速度据称可达英伟达 H100 GPU 的 5–10 倍,文本生成约 500 token/s,远高于主流 GPU 的实时响应能力。
- 能效比:功耗显著低于同类 GPU,能效约为其 10 倍,适配实时交互、自动驾驶、工业控制等低延迟高并发场景。
三、战略意图与行业影响
- 英伟达侧:
- 补齐推理短板,强化 AI 训练 + 推理全栈布局,应对亚马逊、谷歌等客户自研芯片的 “去依赖” 压力。
- 以非独家授权降低反垄断风险,快速吸纳核心技术与人才,避免全面收购的整合成本与业务干扰。
- 将 Groq 技术融入 “AI 工厂”,拓展实时工作负载与边缘推理市场,巩固数据中心与终端 AI 计算的主导权。
- Groq 侧:
- 获得大额授权收入,提升市场认可度,同时保留独立运营与云端业务,依托英伟达背书拓展客户与生态。
- 行业侧:
- 加速 AI 推理从通用 GPU 向专用架构分流,推动 “训练 GPU + 推理专用芯片” 的混合部署成为主流。
- 非独家授权 + 核心人才吸纳的合作模式,或成为巨头应对反垄断与快速补强技术的常用路径。

芯片解密