一、Vera CPU首批交付英伟达的新十亿美元级业务英伟达近日宣布首款面向智能体Agentic AI的专用CPU Vera正式投产交付首批设备已发送至Anthropic、OpenAI、SpaceX AI及甲骨文云等头部AI公司。Vera搭载88颗英伟达自研Olympus核心内存带宽达1.2 TB/s单核性能较上一代x86服务器CPU提升50%。英伟达已将Vera定位为新的数十亿美元级业务。Vera的核心创新在于统一内存架构通过NVLink-C2C与GPU实现芯片级互联数据传输延迟比传统PCIe连接低10倍能效提升2倍。这意味着在Agentic AI场景中Vera可以与Rubin GPU实现无缝协同——CPU负责控制逻辑、状态管理和API编排GPU负责矩阵运算加速两者通过统一内存共享数据避免了跨PCIe的数据搬运开销。Vera的定位不是替代Intel/AMD的通用服务器CPU而是为AI推理场景专门优化的AI Native CPU。在Agentic AI工作负载中约30%的计算任务如LLM推理的键值缓存管理、多Agent的状态同步天然适合CPU执行。Vera通过硬件级优化将这些任务的执行效率提升至传统CPU的2-3倍。二、为什么Anthropic和OpenAI需要VeraAnthropic和OpenAI率先部署Vera背后是Agentic AI对算力架构的根本性重塑。传统LLM推理只需要GPU但Agent系统需要同时运行多个模型实例、记忆管理、外部工具调用、实时反馈——这些任务对CPU的单核性能和内存带宽要求极高传统的霄龙/至强CPU已无法满足需求。以Anthropic的Claude Agent为例一个复杂的Agent任务可能同时调用5-10个外部工具每个工具调用都涉及HTTP请求/响应、状态更新、错误重试等CPU密集型操作。在万级并发的Agent场景下传统CPU成为瓶颈导致GPU利用率不足30%。Vera通过超高内存带宽1.2 TB/s和低延迟互联将Agent调度效率提升至新水平释放GPU算力。SpaceX AI部署Vera则反映了一个不同场景太空算力。SpaceX在星链卫星上部署AI推理芯片需要在功耗和性能之间找到最优平衡。Vera的能效比优势相同性能下功耗降低40%使其成为太空AI推理的首选CPU。三、Vera搅局x86服务器CPU市场格局重塑Vera的交付对Intel和AMD构成直接冲击。Intel Xeon和AMD EPYC长期垄断服务器CPU市场但两者都是通用处理器缺乏针对AI工作负载的专门优化。Vera的出现将加速服务器CPU市场的AI化——未来服务器CPU的选购标准将从核心数×频率转向AI推理吞吐量×能效比。AMD的反应值得关注。苏姿丰在Computex前夕访台有消息称AMD正在加速代号Turin的下一代EPYC处理器的AI优化功能以应对Vera的竞争。Intel则选择强化Gaudi加速器路线通过CPU加速器的组合对抗英伟达的全栈方案。对于国内服务器市场Vera的架构创新同样具有借鉴意义。平头哥含光800阿里自研AI推理芯片与倚天710Arm服务器CPU的组合已在国内云厂商中验证了自研AI CPU自研AI加速器的协同路径。随着Vera在全球市场的示范效应更多国内厂商将探索类似的AI全栈整合方案。
英伟达Vera CPU正式交付:单核性能提升50%,Anthropic和OpenAI已率先部署
一、Vera CPU首批交付英伟达的新十亿美元级业务英伟达近日宣布首款面向智能体Agentic AI的专用CPU Vera正式投产交付首批设备已发送至Anthropic、OpenAI、SpaceX AI及甲骨文云等头部AI公司。Vera搭载88颗英伟达自研Olympus核心内存带宽达1.2 TB/s单核性能较上一代x86服务器CPU提升50%。英伟达已将Vera定位为新的数十亿美元级业务。Vera的核心创新在于统一内存架构通过NVLink-C2C与GPU实现芯片级互联数据传输延迟比传统PCIe连接低10倍能效提升2倍。这意味着在Agentic AI场景中Vera可以与Rubin GPU实现无缝协同——CPU负责控制逻辑、状态管理和API编排GPU负责矩阵运算加速两者通过统一内存共享数据避免了跨PCIe的数据搬运开销。Vera的定位不是替代Intel/AMD的通用服务器CPU而是为AI推理场景专门优化的AI Native CPU。在Agentic AI工作负载中约30%的计算任务如LLM推理的键值缓存管理、多Agent的状态同步天然适合CPU执行。Vera通过硬件级优化将这些任务的执行效率提升至传统CPU的2-3倍。二、为什么Anthropic和OpenAI需要VeraAnthropic和OpenAI率先部署Vera背后是Agentic AI对算力架构的根本性重塑。传统LLM推理只需要GPU但Agent系统需要同时运行多个模型实例、记忆管理、外部工具调用、实时反馈——这些任务对CPU的单核性能和内存带宽要求极高传统的霄龙/至强CPU已无法满足需求。以Anthropic的Claude Agent为例一个复杂的Agent任务可能同时调用5-10个外部工具每个工具调用都涉及HTTP请求/响应、状态更新、错误重试等CPU密集型操作。在万级并发的Agent场景下传统CPU成为瓶颈导致GPU利用率不足30%。Vera通过超高内存带宽1.2 TB/s和低延迟互联将Agent调度效率提升至新水平释放GPU算力。SpaceX AI部署Vera则反映了一个不同场景太空算力。SpaceX在星链卫星上部署AI推理芯片需要在功耗和性能之间找到最优平衡。Vera的能效比优势相同性能下功耗降低40%使其成为太空AI推理的首选CPU。三、Vera搅局x86服务器CPU市场格局重塑Vera的交付对Intel和AMD构成直接冲击。Intel Xeon和AMD EPYC长期垄断服务器CPU市场但两者都是通用处理器缺乏针对AI工作负载的专门优化。Vera的出现将加速服务器CPU市场的AI化——未来服务器CPU的选购标准将从核心数×频率转向AI推理吞吐量×能效比。AMD的反应值得关注。苏姿丰在Computex前夕访台有消息称AMD正在加速代号Turin的下一代EPYC处理器的AI优化功能以应对Vera的竞争。Intel则选择强化Gaudi加速器路线通过CPU加速器的组合对抗英伟达的全栈方案。对于国内服务器市场Vera的架构创新同样具有借鉴意义。平头哥含光800阿里自研AI推理芯片与倚天710Arm服务器CPU的组合已在国内云厂商中验证了自研AI CPU自研AI加速器的协同路径。随着Vera在全球市场的示范效应更多国内厂商将探索类似的AI全栈整合方案。