英伟达Vera CPU正式交付：单核性能提升50%，Anthropic和OpenAI已率先部署-尧图企业网站定制

一、Vera CPU首批交付英伟达的新十亿美元级业务英伟达近日宣布首款面向智能体Agentic AI的专用CPU Vera正式投产交付首批设备已发送至Anthropic、OpenAI、SpaceX AI及甲骨文云等头部AI公司。Vera搭载88颗英伟达自研Olympus核心内存带宽达1.2 TB/s单核性能较上一代x86服务器CPU提升50%。英伟达已将Vera定位为新的数十亿美元级业务。Vera的核心创新在于统一内存架构通过NVLink-C2C与GPU实现芯片级互联数据传输延迟比传统PCIe连接低10倍能效提升2倍。这意味着在Agentic AI场景中Vera可以与Rubin GPU实现无缝协同——CPU负责控制逻辑、状态管理和API编排GPU负责矩阵运算加速两者通过统一内存共享数据避免了跨PCIe的数据搬运开销。Vera的定位不是替代Intel/AMD的通用服务器CPU而是为AI推理场景专门优化的AI Native CPU。在Agentic AI工作负载中约30%的计算任务如LLM推理的键值缓存管理、多Agent的状态同步天然适合CPU执行。Vera通过硬件级优化将这些任务的执行效率提升至传统CPU的2-3倍。二、为什么Anthropic和OpenAI需要VeraAnthropic和OpenAI率先部署Vera背后是Agentic AI对算力架构的根本性重塑。传统LLM推理只需要GPU但Agent系统需要同时运行多个模型实例、记忆管理、外部工具调用、实时反馈——这些任务对CPU的单核性能和内存带宽要求极高传统的霄龙/至强CPU已无法满足需求。以Anthropic的Claude Agent为例一个复杂的Agent任务可能同时调用5-10个外部工具每个工具调用都涉及HTTP请求/响应、状态更新、错误重试等CPU密集型操作。在万级并发的Agent场景下传统CPU成为瓶颈导致GPU利用率不足30%。Vera通过超高内存带宽1.2 TB/s和低延迟互联将Agent调度效率提升至新水平释放GPU算力。SpaceX AI部署Vera则反映了一个不同场景太空算力。SpaceX在星链卫星上部署AI推理芯片需要在功耗和性能之间找到最优平衡。Vera的能效比优势相同性能下功耗降低40%使其成为太空AI推理的首选CPU。三、Vera搅局x86服务器CPU市场格局重塑Vera的交付对Intel和AMD构成直接冲击。Intel Xeon和AMD EPYC长期垄断服务器CPU市场但两者都是通用处理器缺乏针对AI工作负载的专门优化。Vera的出现将加速服务器CPU市场的AI化——未来服务器CPU的选购标准将从核心数×频率转向AI推理吞吐量×能效比。AMD的反应值得关注。苏姿丰在Computex前夕访台有消息称AMD正在加速代号Turin的下一代EPYC处理器的AI优化功能以应对Vera的竞争。Intel则选择强化Gaudi加速器路线通过CPU加速器的组合对抗英伟达的全栈方案。对于国内服务器市场Vera的架构创新同样具有借鉴意义。平头哥含光800阿里自研AI推理芯片与倚天710Arm服务器CPU的组合已在国内云厂商中验证了自研AI CPU自研AI加速器的协同路径。随着Vera在全球市场的示范效应更多国内厂商将探索类似的AI全栈整合方案。

相关新闻

量子计算中qutrit电路优化与Steiner-Gauss算法

基于RAG与向量数据库构建有记忆的AI运维智能体

ASTRI-Horn望远镜Variance数据技术解析与应用

FPGA硬件加速流数据异常检测：TEDA算法三级流水线架构实战

别再手动解析HTTP头了！用fastapi-cloudevents库5分钟搞定事件驱动API

网络安全七课程开始

闪电演讲：激活团队创新与协作的低成本高效实践

强化学习与正则化Dropout优化中文任务型对话系统

联邦学习梯度泄漏难题：基于区块链的群智学习如何破局？

容器化Nextcloud离线部署协作应用实战：以Collabora为例

草莓成熟度检测数据集VOC+YOLO格式1487张3类别有增强

为什么android原生的不直接在开机的时候，直接启动usb调试模式呢，还需要用户去点击呢？

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势