黄仁勋聚焦 AI 产业发展方向刚刚在中国台北英伟达 GTC 大会上英伟达 CEO 黄仁勋再次将话题聚焦于 AI 产业的发展方向。与两年前重点讨论生成式 AI 浪潮不同这一次黄仁勋给出了一个新的判断 “生成式 AI 已经到来实用 AI 已经到来。”实用 AI 时代已至在他看来过去几年 AI 行业最大的变化不是模型参数规模继续增长而是 AI 已经开始成为真正的生产工具并直接影响经济活动。为说明这一变化黄仁勋展示了一组来自代码托管平台 GitHub 的数据。软件开发是生成式 AI 最早落地的领域之一也是全球最庞大的知识工作者群体之一。目前全球约有 3000 万至 400 万名专业软件工程师依靠编程工作此外还有数亿学生和业余开发者参与其中。在他的演讲中GitHub 代码提交量被作为衡量 AI 生产力变化的重要指标2023 年代码提交量约为 3 亿次2024 年增长至 4 亿次2025 年达到 5 亿次而 2026 年前几个月的数据已经接近此前水平的数倍增长。黄仁勋认为这些数字反映出 AI 辅助编程工具正在显著提升软件开发效率。“全世界的软件工程师创造着大约 3 万亿美元的薪酬价值。”他说“而这些软件又进一步支撑着全球接近 100 万亿美元规模的经济活动。”按照他的推算如果 AI 能够将软件开发者的生产效率提升数倍那么由此释放出的经济价值也将远远超出软件行业本身。回应程序员是否被取代争议近年来“程序员是否会被 AI 取代”一直是行业争论的焦点。对此黄仁勋在演讲中给出了明确回应。他认为AI 的发展并不会减少软件工程师数量反而会刺激企业招聘更多开发者。逻辑很简单如果一名工程师在 AI 辅助下能够创造更高的产出那么企业更倾向于扩大研发投入而不是削减研发团队规模。 “有人说 AI 会减少就业那完全是胡说八道。”黄仁勋表示。在他看来真正决定就业规模的不是单位劳动力成本而是单位劳动力创造价值的能力。当软件工程师能够借助 AI 完成更多工作时市场对软件和数字化能力的需求也会进一步扩大。AI 基础设施新关注点黄仁勋随后把话题转向 AI 基础设施。他指出随着 AI 从实验室走向实际生产环境行业关注点已经从模型能力转向 Token 产出能力。过去Token 只是模型运行过程中的技术指标而现在Token 已经成为能够直接创造收入的单位。换句话说AI 公司生产的不是传统意义上的软件产品而是持续生成的 Token。谁能够以更低成本、更高效率生成更多 Token谁就拥有更强的商业竞争力。“因为 Token 现在已成为盈利单位——Token 现在是能够带来收入的盈利单位。正因为现在可以盈利AI 公司想要建造更多的 Token生成更多的 Token建设更多的 AI 工厂这就是为什么中国台湾的算力需求猛增的原因。也正因如此你们所有人都如此忙碌你们的业务都做得这么好。事实上看看你们的一些股价就知道了。”黄仁勋说。这也是为什么全球范围内的数据中心建设持续升温以及中国台湾地区 AI 算力需求快速增长的重要原因。在他的描述中AI 工厂AI Factory正逐渐取代传统数据中心成为新一轮计算基础设施建设的核心。从应用程序时代进入智能体时代不过在黄仁勋看来更大的变化并不只是模型性能提升而是计算范式本身正在发生改变。过去几十年里计算机遵循的是应用程序 → 代码 → 操作系统用户通过点击界面、输入命令完成任务。而在 AI 时代新的架构正在形成智能体Agent → 大语言模型 → 工具系统。黄仁勋展示了一张典型 Agent 系统架构图。在这一架构中大语言模型负责理解问题、推理和规划外围框架则负责管理上下文、调用工具、协调任务执行并管理长期和短期记忆。为了完成任务智能体可以调用浏览器、数据库、表格工具、数据分析引擎、CAD 设计软件以及各类企业系统。整个过程更像是一个数字员工而非传统软件。“过去我们启动应用程序、点击按钮、输入内容。”黄仁勋说“未来我们只需要向 AI 解释自己的意图。”然后由 AI 自动编写代码、调用工具并完成任务。智能体的兴起也引发了另一个争议如果 AI 能够完成工作软件公司是否会被淘汰黄仁勋的答案恰恰相反。他认为Agent 时代将催生数量远超今天的软件系统。原因在于数字智能体的数量不再受人口规模限制。未来每一个企业流程、每一个业务环节、甚至每一个个人任务都可能拥有专属智能体。而这些智能体需要大量调用外部工具和服务才能完成工作。因此软件不会消失而是需要以“AI 可调用”的形式重新存在。 “这是软件行业最好的时代之一。”黄仁勋表示。在这一背景下NVIDIA 长期积累的 CUDA 生态也将迎来新的机会。过去CUDA 库主要面向开发者如今这些能力可以直接被智能体调用成为 Agent 执行任务时的工具集。从某种意义上说黄仁勋试图传递的信息十分明确生成式 AI 时代讨论的是模型会什么而实用 AI 时代讨论的是模型能完成什么工作。当 AI 开始创造收入、推动 GDP 增长并能够通过智能体调用工具执行复杂任务时它就不再只是一个聊天机器人而正在成为新的计算平台。“NVIDIA 首先是一家软件公司”在谈完 Agent 带来的计算范式变革后黄仁勋再次强调了一个他近年来反复提及的观点 NVIDIA 本质上是一家软件公司。随后黄仁勋阐释了 AI 智能体的核心架构与运行逻辑。他表示智能体是终极的解耦与分布式计算模型需要调动海量不同算力单元协同运行。完整的 AI 智能体由模型、框架、工具、技能及运行时五大核心部分构成各组件分散运行在数据中心不同节点。他将其形象类比为工作个体模型是智能体的“大脑”负责思考决策框架是“身体”承载整体运行运行时则如同专属工作室支撑各类工具落地运作整套体系以超大规模模式完成算力调度与任务执行。据其介绍智能体的每一项工作流程均拆分至计算机不同模块分步完成。其中大型语言模型承担思考、上下文处理、环境感知、逻辑推理、方案规划与行动执行等核心智能任务该过程会批量激活 Grace Blackwell NVLink 72 算力集群。而在智能体调用工具的环节则由 CPU 承接运算工作可适配 C 编译器、Python、JavaScript 及各类加速计算工具。黄仁勋认为当前 AI 智能体的工具应用能力仍处于初级阶段未来将实现专业化、熟练化升级。为此英伟达 CUDA X 库迎来重要升级全系库产品将配套专属 AI 技能手册可供 AI 智能体自主学习、掌握工具使用方法大幅提升智能体解决各类核心行业难题的能力未来智能体调用 CUDA X 工具的算力价值与应用潜力将得到极大释放。在整套智能体算力体系中各类硬件与功能模块分工明确。工具运算任务依托 CPU、GPU、大模型协同完成安全防护框架部署在 CPU 与英伟达 BlueField DPU 安全处理器之上全方位保障运行安全整体任务的调度编排工作则统一由 CPU 主导落地形成层级清晰、分工明确的异构计算体系。演讲中黄仁勋重点提及 AI 计算的核心痛点——内存系统。他表示智能体的工作记忆依托 KV 缓存实现涵盖记忆留存、数据压缩、信息检索、结构化与非结构化数据匹配以及各类数据的逻辑关系梳理、本体关联分析等复杂操作整体处理流程难度极高、复杂度空前。他预判AI 专属内存系统的迭代升级将推动全球存储体系迎来颠覆性革命。对比传统软件运行模式黄仁勋强调AI 智能体代表的全新计算范式具备本质差异。过往软件多为单一二进制文件适配单一操作系统的集中式运行模式而智能体采用解耦、分布式、异构的全新计算逻辑这也是英伟达倾力研发下一代 Vera Rubin 平台的核心动因。针对全新的 Vera Rubin 平台黄仁勋着重澄清其绝非单一芯片或普通 GPU 产品而是一套端到端的完整革命性系统。该平台以 GPU 为核心起点整合 GPU、Vera、NVLink 72 核心硬件依托多颗 CPU 完成全局任务编排搭配迭代升级的革命性存储系统构建全链路算力底座。同时平台集成 CX - 9 硬件、DOCA 软件栈及内置安全处理器可实现数据静态、传输、使用全流程加密依托机密计算架构全方位保护高价值 AI 模型数据安全。黄仁勋直言Vera Rubin 是英伟达发展史上野心最大的研发项目公司全体四万名工程师全员参与项目攻坚同时汇聚行业合作伙伴力量共同落地是一套经过全方位打磨、从零重构的极致复杂系统。他坦言英伟达早已完成从单一 GPU 厂商向全栈系统厂商的战略转型当前推出的 Vera Rubin 系统是行业迄今为止设计最复杂、体系最完整的 AI 算力系统。谈及产业终极需求与企业转型方向黄仁勋表示客户与合作伙伴的核心诉求并非单纯获取计算机硬件而是搭建成熟高效的 AI 工厂。基于这一行业趋势英伟达正在开启新一轮战略转型。目前英伟达核心技术已全面落地基础设施级应用场景同时联动发电厂、冷却系统、电网供应商等各类工业生态伙伴构建完整 AI 产业生态。未来英伟达将持续打造全栈式算力系统为全球客户搭建规模化、高性能的 AI 基础设施提供核心支撑。值得注意的是在此次演讲中黄仁勋详细地阐释了英伟达全新的产业定位正式提出“AI 工厂生态新范式”明确英伟达的发展重心已从传统计算生态全面升级为服务千亿级 AI 基建的工厂化生态体系。黄仁勋区分了英伟达新旧两大生态形态。过往英伟达以计算生态为核心将自身计算层、软件及计算栈深度集成至各类企业平台与第三方库中广泛赋能各行各业的数字化算力需求。而当下全新打造的 AI 工厂生态形成了清晰的上下游产业闭环行业合作伙伴是英伟达的上游基础支撑英伟达则依托自身全栈技术能力向下游输出完整 AI 工厂生态体系核心目标不再是单纯输出 GPU 芯片或算力系统而是助力客户搭建超复杂、超大规模的 AI 工厂基础设施。他直言AI 工厂已进入超高投入、超高门槛的规模化落地阶段。当前单座 1 吉瓦GW级别的 AI 工厂建设成本持续攀升从最初的 200 亿至 400 亿美元现已上涨至 500 亿至 600 亿美元未来很快将突破 800 亿甚至 1000 亿美元。千亿级别的单项目投入意味着 AI 工厂对落地稳定性、运行可靠性有着极致要求必须实现一次建成、即刻正常投产其资本投入成本与系统构建复杂度均达到行业前所未有的水平。针对超高复杂度的 AI 工厂建设难题英伟达依托 Omniverse 数字仿真能力实现全流程革新。不同于传统计算机研发模式——先设计芯片、再在设备内模拟系统运行如今英伟达所有 AI 工厂基础设施均可在 Omniverse 数字平台中提前完成搭建、仿真、测试与优化。通过数字模拟器与数字架构赋能行业可在破土动工、投入巨额资金前完成超大规模 AI 系统的全流程推演彻底规避落地风险实现行业多年以来的技术落地愿景。黄仁勋重点介绍了支撑 AI 工厂生态落地的核心体系 DSX形成与英伟达现有产品矩阵对应的完整基础设施布局。其中RTX 系列对应 GPU 硬件、DGX 对应一体化算力系统而全新的 DSX 平台则精准对标 AI 基础设施全场景。依托覆盖系统、软件、全技术栈的核心能力英伟达能够赋能中小型企业快速搭建世界级 AI 云服务能力。他以行业案例佐证 DSX 生态的赋能价值不少曾经的中小型科技企业在接入英伟达 AI 工厂生态、依托 DSX 体系升级后实现跨越式增长典型代表 CoreWeave 估值已攀升至 500 亿至 700 亿美元区间且依旧保持高速增长态势充分印证英伟达 AI 工厂新范式的产业赋能潜力。最近英伟达与 Nebius 合作它们的增长也同样惊人。这些云中的每一家都拥有令人难以置信的客户Cursor软件编码公司、Black Mountain Labs图像生成、World Labs世界基础模型、Revolut领先的金融服务 AI 公司以及 Shopify。这里还有另一个例子Nscale他们的客户是英国电信British Telecom和谷歌Google。谷歌正在使用其中一个人工智能云——Thinking Machines这是一家前沿实验室公司。这里是韩国的 Naver Cloud客户包括韩国银行Bank of Korea、Hyundai 等众多优秀公司。在中国台湾还有 GMI。然而以上所有的公司它们都需要计算栈。黄仁勋表示下面的这整个技术栈正是让 NVIDIA 闻名的原因。他介绍道“所有的硬件、软件和库以及我们连接全球第三方开发者生态系统的能力使得任何人都能建立起一个 AI 云。然而现在的 AI 云极其复杂。这个是软件版本这个是计算机科学版本。而资金版本、资产版本就是我之前展示的——它是一个巨大的工厂。仅拥有这种能力是不够的这正是 NVIDIA 成为一家 AI 基础设施公司的原因。”Vera Rubin 架构全面投产在谈及下一代 AI 基础设施建设时英伟达 CEO 黄仁勋宣布基于新一代 GPU 平台的 Vera Rubin 架构已经进入全面量产阶段。黄仁勋表示当前全球对 AI 算力的需求正以前所未有的速度增长。从数据中心运营商到云服务提供商再到各类企业客户整个产业链都在全力提升产能以满足市场需求。“实用 AI 已经到来可盈利的 AI 已经到来。”黄仁勋说。他认为越来越多企业已经认识到人工智能不再只是技术展示而是能够创造实际商业价值的生产工具。在这一背景下算力正成为限制 AI 发展的关键瓶颈。为了满足全球激增的需求英伟达正在推动新一代 AI 基础设施的大规模部署并协同合作伙伴在世界各地建设 AI 工厂。黄仁勋表示这也是当前整个产业生态最重要的任务之一。在供应链建设方面黄仁勋透露Vera Rubin 平台所对应的供应链规模已经达到上一代 Grace Blackwell 平台的两倍。与此同时生产效率也获得显著提升。过去组装一套 Grace Blackwell 机架需要约两个小时而如今这一过程已经缩短至五分钟。“这不仅意味着更高的产能也意味着更快的交付速度。”黄仁勋表示面对持续增长的市场需求供应链各环节都在不断扩大生产规模、提高制造效率。他介绍为支持 Grace Blackwell 平台量产产业链此前已经投入数百万平方英尺的生产设施。而目前这些合作伙伴正在进一步扩充产能为 Vera Rubin 的大规模部署做好准备。演讲最后黄仁勋特别向供应链合作伙伴表达感谢。他表示Vera Rubin 能够顺利进入全面量产阶段离不开整个产业生态系统的共同努力。 “我要感谢你们所有人。”黄仁勋说“Vera Rubin 现已全面投产。”在介绍 Vera Rubin 架构时黄仁勋将其定义为一套面向智能体Agent时代打造的计算系统而不仅仅是一台运行 AI 模型的超级计算机。他表示随着 AI 从模型训练、推理逐步迈向智能体阶段计算需求正在发生根本变化。智能体需要频繁调用工具、访问数据库、与外部系统实时交互因此对延迟、带宽和系统协同能力提出了更高要求。为此Vera Rubin 采用了全新的系统设计将 CPU、GPU、网络、存储和安全模块深度整合形成面向智能体工作负载的完整基础设施平台。黄仁勋特别展示了 Vera Rubin NVLink 72 系统。他介绍相比上一代产品主要面向预训练和推理场景Vera Rubin 进一步针对智能体推理进行了优化。通过 NVLink 72 互连架构以及全新的系统设计设备内部不再需要大量线缆和复杂连接结构不仅提升了可靠性也显著降低了部署和维护成本。Vera CPU 重磅登场除了 GPU 系统外英伟达还同步推出了专为 AI 时代设计的 Vera CPU。黄仁勋认为传统 CPU 主要服务于人类用户而未来将出现数十亿个智能体它们对响应速度几乎没有容忍空间。因此新的 CPU 架构必须在单线程性能、带宽、数据传输效率以及能效方面进行全面优化。按照英伟达的规划Vera CPU 将承担智能体编排、模型调度、工具调用、数据库访问以及存储管理等任务与 GPU 共同构成未来 AI 工厂的核心基础设施。黄仁勋表示随着智能体成为下一阶段 AI 发展的重要方向计算系统也正在从“为模型设计”转向“为智能体设计”。在谈到新一代 Vera CPU 时黄仁勋表示英伟达已经顺利完成了从传统 x86 CPU 架构向 Grace 架构的过渡这为 Vera 的推广奠定了基础。他指出目前全球主要数据中心、云服务商以及与英伟达合作的 AI 企业都已经完成了对 Grace 平台的认证相关软件栈、安全体系和开发环境也已完成适配。在此基础上Vera 的部署门槛将大幅降低。黄仁勋认为Vera 有望成为针对智能体Agent工作负载优化程度最高的 CPU 之一。原因在于它从设计之初便与 Vera Rubin 系统协同开发面向智能体推理、工具调用、数据库访问和实时交互等新型 AI 任务进行了针对性优化。为了展示性能提升黄仁勋公布了多个实际工作负载测试结果。其中在企业广泛使用的 SQL 数据库处理场景中Vera CPU 的性能达到现有平台的约 3 倍。在实时流处理场景下例如金融交易系统、工业遥测监控等需要持续处理海量数据流的应用中性能提升最高可达 6 倍。黄仁勋表示CPU 领域通常以个位数百分比的性能提升作为重要突破而在真实业务负载中实现数倍级增长并不常见。这些提升主要来自更高的单线程性能、更大的内存和 I/O 带宽以及更快的核心间数据传输能力。在他看来智能体正在成为继云计算、移动互联网之后的新一代计算负载而现有 CPU 大多是围绕人类用户设计的。未来随着智能体数量持续增长对低延迟和高响应速度的需求也将进一步提升。 “过去我们为人类构建 CPU现在我们开始为智能体构建 CPU。”黄仁勋表示。围绕 Vera 展开的新生态正在形成包括 ODM 厂商、服务器制造商和企业客户在内的产业链伙伴已经开始布局这一市场。英伟达希望借此推动一个全新的计算平台时代——面向智能体的 CPU 市场。开源 Nemotron 3 Ultra全球首个 SSM 与 MoE 相结合的混合架构在介绍企业级智能体生态时黄仁勋宣布英伟达正式推出新一代开源大模型 Nemotron 3 Ultra并将其定位为企业构建专属智能体的重要基础模型。黄仁勋表示未来企业将雇用大量智能体协助完成研发、验证、仿真和运营等工作。以 EDA 软件厂商 Cadence Design Systems 为例其正在利用英伟达技术打造面向芯片设计流程的专属超级智能体通过调用仿真器、验证器和形式验证工具加速芯片开发周期。作为这一生态的底座Nemotron 3 Ultra 采用了全球首个 SSM状态空间模型与 MoE混合专家相结合的混合架构。黄仁勋透露相比现有主流开源模型Nemotron 3 Ultra 推理速度提升 5 倍同时总体运行成本降低 30%。除了模型本身英伟达还同步开放训练数据、训练脚本以及相关工具链。黄仁勋表示Nemotron 系列基于大规模长程推理、复杂任务求解和工具调用数据集训练而成开发者不仅可以使用模型还能够在此基础上继续训练、微调并构建专属智能体系统。目前英伟达已经与 CrowdStrike、Salesforce、Palantir Technologies、SAP、ServiceNow 等企业展开合作推动智能体在企业软件、网络安全、数据分析和业务流程管理等场景中的落地应用。黄仁勋同时透露Nemotron 3 Ultra 已经发布而下一代 Nemotron 4 模型也正在研发之中。与微软联手重新定义 PC在演讲的后半程黄仁勋宣布英伟达正与 Microsoft 联手重新定义个人电脑PC。黄仁勋回顾了过去 40 年的 PC 发展历程。他表示从 Windows 3.1 到 Windows 95微软建立起了现代 PC 产业的基础架构通过开放硬件生态、驱动程序体系以及统一的软件接口让 PC 从企业设备走向大众消费市场并成为全球最普及的计算平台之一。如今随着 AI 时代到来英伟达和微软希望推动新一轮 PC 架构变革。黄仁勋透露双方已经为此合作了三年对 PC 的底层工作方式进行了重新设计以适应智能体Agent时代的计算需求。按照他的设想未来的 PC 不再只是运行应用程序的终端设备而将内置能够理解用户、与用户对话并自主完成任务的 AI 智能体。例如智能体可以帮助用户整理文件、检索资料、完成研究工作甚至根据用户需求主动执行复杂任务。黄仁勋认为这种变化将带来 PC 软件架构的重构。过去由应用程序承担的大量功能未来将逐步由智能体完成。与此同时大语言模型将成为新一代 PC 的重要基础组件承担语言理解、视觉识别、音视频生成以及任务执行等能力成为连接用户与计算资源的核心入口。他透露自己将与 Satya Nadella 共同介绍双方过去三年的合作成果并进一步展示面向智能体时代的新一代 PC 平台。
英伟达 GTC 大会:黄仁勋畅谈 AI 新趋势,多领域创新成果亮相!
黄仁勋聚焦 AI 产业发展方向刚刚在中国台北英伟达 GTC 大会上英伟达 CEO 黄仁勋再次将话题聚焦于 AI 产业的发展方向。与两年前重点讨论生成式 AI 浪潮不同这一次黄仁勋给出了一个新的判断 “生成式 AI 已经到来实用 AI 已经到来。”实用 AI 时代已至在他看来过去几年 AI 行业最大的变化不是模型参数规模继续增长而是 AI 已经开始成为真正的生产工具并直接影响经济活动。为说明这一变化黄仁勋展示了一组来自代码托管平台 GitHub 的数据。软件开发是生成式 AI 最早落地的领域之一也是全球最庞大的知识工作者群体之一。目前全球约有 3000 万至 400 万名专业软件工程师依靠编程工作此外还有数亿学生和业余开发者参与其中。在他的演讲中GitHub 代码提交量被作为衡量 AI 生产力变化的重要指标2023 年代码提交量约为 3 亿次2024 年增长至 4 亿次2025 年达到 5 亿次而 2026 年前几个月的数据已经接近此前水平的数倍增长。黄仁勋认为这些数字反映出 AI 辅助编程工具正在显著提升软件开发效率。“全世界的软件工程师创造着大约 3 万亿美元的薪酬价值。”他说“而这些软件又进一步支撑着全球接近 100 万亿美元规模的经济活动。”按照他的推算如果 AI 能够将软件开发者的生产效率提升数倍那么由此释放出的经济价值也将远远超出软件行业本身。回应程序员是否被取代争议近年来“程序员是否会被 AI 取代”一直是行业争论的焦点。对此黄仁勋在演讲中给出了明确回应。他认为AI 的发展并不会减少软件工程师数量反而会刺激企业招聘更多开发者。逻辑很简单如果一名工程师在 AI 辅助下能够创造更高的产出那么企业更倾向于扩大研发投入而不是削减研发团队规模。 “有人说 AI 会减少就业那完全是胡说八道。”黄仁勋表示。在他看来真正决定就业规模的不是单位劳动力成本而是单位劳动力创造价值的能力。当软件工程师能够借助 AI 完成更多工作时市场对软件和数字化能力的需求也会进一步扩大。AI 基础设施新关注点黄仁勋随后把话题转向 AI 基础设施。他指出随着 AI 从实验室走向实际生产环境行业关注点已经从模型能力转向 Token 产出能力。过去Token 只是模型运行过程中的技术指标而现在Token 已经成为能够直接创造收入的单位。换句话说AI 公司生产的不是传统意义上的软件产品而是持续生成的 Token。谁能够以更低成本、更高效率生成更多 Token谁就拥有更强的商业竞争力。“因为 Token 现在已成为盈利单位——Token 现在是能够带来收入的盈利单位。正因为现在可以盈利AI 公司想要建造更多的 Token生成更多的 Token建设更多的 AI 工厂这就是为什么中国台湾的算力需求猛增的原因。也正因如此你们所有人都如此忙碌你们的业务都做得这么好。事实上看看你们的一些股价就知道了。”黄仁勋说。这也是为什么全球范围内的数据中心建设持续升温以及中国台湾地区 AI 算力需求快速增长的重要原因。在他的描述中AI 工厂AI Factory正逐渐取代传统数据中心成为新一轮计算基础设施建设的核心。从应用程序时代进入智能体时代不过在黄仁勋看来更大的变化并不只是模型性能提升而是计算范式本身正在发生改变。过去几十年里计算机遵循的是应用程序 → 代码 → 操作系统用户通过点击界面、输入命令完成任务。而在 AI 时代新的架构正在形成智能体Agent → 大语言模型 → 工具系统。黄仁勋展示了一张典型 Agent 系统架构图。在这一架构中大语言模型负责理解问题、推理和规划外围框架则负责管理上下文、调用工具、协调任务执行并管理长期和短期记忆。为了完成任务智能体可以调用浏览器、数据库、表格工具、数据分析引擎、CAD 设计软件以及各类企业系统。整个过程更像是一个数字员工而非传统软件。“过去我们启动应用程序、点击按钮、输入内容。”黄仁勋说“未来我们只需要向 AI 解释自己的意图。”然后由 AI 自动编写代码、调用工具并完成任务。智能体的兴起也引发了另一个争议如果 AI 能够完成工作软件公司是否会被淘汰黄仁勋的答案恰恰相反。他认为Agent 时代将催生数量远超今天的软件系统。原因在于数字智能体的数量不再受人口规模限制。未来每一个企业流程、每一个业务环节、甚至每一个个人任务都可能拥有专属智能体。而这些智能体需要大量调用外部工具和服务才能完成工作。因此软件不会消失而是需要以“AI 可调用”的形式重新存在。 “这是软件行业最好的时代之一。”黄仁勋表示。在这一背景下NVIDIA 长期积累的 CUDA 生态也将迎来新的机会。过去CUDA 库主要面向开发者如今这些能力可以直接被智能体调用成为 Agent 执行任务时的工具集。从某种意义上说黄仁勋试图传递的信息十分明确生成式 AI 时代讨论的是模型会什么而实用 AI 时代讨论的是模型能完成什么工作。当 AI 开始创造收入、推动 GDP 增长并能够通过智能体调用工具执行复杂任务时它就不再只是一个聊天机器人而正在成为新的计算平台。“NVIDIA 首先是一家软件公司”在谈完 Agent 带来的计算范式变革后黄仁勋再次强调了一个他近年来反复提及的观点 NVIDIA 本质上是一家软件公司。随后黄仁勋阐释了 AI 智能体的核心架构与运行逻辑。他表示智能体是终极的解耦与分布式计算模型需要调动海量不同算力单元协同运行。完整的 AI 智能体由模型、框架、工具、技能及运行时五大核心部分构成各组件分散运行在数据中心不同节点。他将其形象类比为工作个体模型是智能体的“大脑”负责思考决策框架是“身体”承载整体运行运行时则如同专属工作室支撑各类工具落地运作整套体系以超大规模模式完成算力调度与任务执行。据其介绍智能体的每一项工作流程均拆分至计算机不同模块分步完成。其中大型语言模型承担思考、上下文处理、环境感知、逻辑推理、方案规划与行动执行等核心智能任务该过程会批量激活 Grace Blackwell NVLink 72 算力集群。而在智能体调用工具的环节则由 CPU 承接运算工作可适配 C 编译器、Python、JavaScript 及各类加速计算工具。黄仁勋认为当前 AI 智能体的工具应用能力仍处于初级阶段未来将实现专业化、熟练化升级。为此英伟达 CUDA X 库迎来重要升级全系库产品将配套专属 AI 技能手册可供 AI 智能体自主学习、掌握工具使用方法大幅提升智能体解决各类核心行业难题的能力未来智能体调用 CUDA X 工具的算力价值与应用潜力将得到极大释放。在整套智能体算力体系中各类硬件与功能模块分工明确。工具运算任务依托 CPU、GPU、大模型协同完成安全防护框架部署在 CPU 与英伟达 BlueField DPU 安全处理器之上全方位保障运行安全整体任务的调度编排工作则统一由 CPU 主导落地形成层级清晰、分工明确的异构计算体系。演讲中黄仁勋重点提及 AI 计算的核心痛点——内存系统。他表示智能体的工作记忆依托 KV 缓存实现涵盖记忆留存、数据压缩、信息检索、结构化与非结构化数据匹配以及各类数据的逻辑关系梳理、本体关联分析等复杂操作整体处理流程难度极高、复杂度空前。他预判AI 专属内存系统的迭代升级将推动全球存储体系迎来颠覆性革命。对比传统软件运行模式黄仁勋强调AI 智能体代表的全新计算范式具备本质差异。过往软件多为单一二进制文件适配单一操作系统的集中式运行模式而智能体采用解耦、分布式、异构的全新计算逻辑这也是英伟达倾力研发下一代 Vera Rubin 平台的核心动因。针对全新的 Vera Rubin 平台黄仁勋着重澄清其绝非单一芯片或普通 GPU 产品而是一套端到端的完整革命性系统。该平台以 GPU 为核心起点整合 GPU、Vera、NVLink 72 核心硬件依托多颗 CPU 完成全局任务编排搭配迭代升级的革命性存储系统构建全链路算力底座。同时平台集成 CX - 9 硬件、DOCA 软件栈及内置安全处理器可实现数据静态、传输、使用全流程加密依托机密计算架构全方位保护高价值 AI 模型数据安全。黄仁勋直言Vera Rubin 是英伟达发展史上野心最大的研发项目公司全体四万名工程师全员参与项目攻坚同时汇聚行业合作伙伴力量共同落地是一套经过全方位打磨、从零重构的极致复杂系统。他坦言英伟达早已完成从单一 GPU 厂商向全栈系统厂商的战略转型当前推出的 Vera Rubin 系统是行业迄今为止设计最复杂、体系最完整的 AI 算力系统。谈及产业终极需求与企业转型方向黄仁勋表示客户与合作伙伴的核心诉求并非单纯获取计算机硬件而是搭建成熟高效的 AI 工厂。基于这一行业趋势英伟达正在开启新一轮战略转型。目前英伟达核心技术已全面落地基础设施级应用场景同时联动发电厂、冷却系统、电网供应商等各类工业生态伙伴构建完整 AI 产业生态。未来英伟达将持续打造全栈式算力系统为全球客户搭建规模化、高性能的 AI 基础设施提供核心支撑。值得注意的是在此次演讲中黄仁勋详细地阐释了英伟达全新的产业定位正式提出“AI 工厂生态新范式”明确英伟达的发展重心已从传统计算生态全面升级为服务千亿级 AI 基建的工厂化生态体系。黄仁勋区分了英伟达新旧两大生态形态。过往英伟达以计算生态为核心将自身计算层、软件及计算栈深度集成至各类企业平台与第三方库中广泛赋能各行各业的数字化算力需求。而当下全新打造的 AI 工厂生态形成了清晰的上下游产业闭环行业合作伙伴是英伟达的上游基础支撑英伟达则依托自身全栈技术能力向下游输出完整 AI 工厂生态体系核心目标不再是单纯输出 GPU 芯片或算力系统而是助力客户搭建超复杂、超大规模的 AI 工厂基础设施。他直言AI 工厂已进入超高投入、超高门槛的规模化落地阶段。当前单座 1 吉瓦GW级别的 AI 工厂建设成本持续攀升从最初的 200 亿至 400 亿美元现已上涨至 500 亿至 600 亿美元未来很快将突破 800 亿甚至 1000 亿美元。千亿级别的单项目投入意味着 AI 工厂对落地稳定性、运行可靠性有着极致要求必须实现一次建成、即刻正常投产其资本投入成本与系统构建复杂度均达到行业前所未有的水平。针对超高复杂度的 AI 工厂建设难题英伟达依托 Omniverse 数字仿真能力实现全流程革新。不同于传统计算机研发模式——先设计芯片、再在设备内模拟系统运行如今英伟达所有 AI 工厂基础设施均可在 Omniverse 数字平台中提前完成搭建、仿真、测试与优化。通过数字模拟器与数字架构赋能行业可在破土动工、投入巨额资金前完成超大规模 AI 系统的全流程推演彻底规避落地风险实现行业多年以来的技术落地愿景。黄仁勋重点介绍了支撑 AI 工厂生态落地的核心体系 DSX形成与英伟达现有产品矩阵对应的完整基础设施布局。其中RTX 系列对应 GPU 硬件、DGX 对应一体化算力系统而全新的 DSX 平台则精准对标 AI 基础设施全场景。依托覆盖系统、软件、全技术栈的核心能力英伟达能够赋能中小型企业快速搭建世界级 AI 云服务能力。他以行业案例佐证 DSX 生态的赋能价值不少曾经的中小型科技企业在接入英伟达 AI 工厂生态、依托 DSX 体系升级后实现跨越式增长典型代表 CoreWeave 估值已攀升至 500 亿至 700 亿美元区间且依旧保持高速增长态势充分印证英伟达 AI 工厂新范式的产业赋能潜力。最近英伟达与 Nebius 合作它们的增长也同样惊人。这些云中的每一家都拥有令人难以置信的客户Cursor软件编码公司、Black Mountain Labs图像生成、World Labs世界基础模型、Revolut领先的金融服务 AI 公司以及 Shopify。这里还有另一个例子Nscale他们的客户是英国电信British Telecom和谷歌Google。谷歌正在使用其中一个人工智能云——Thinking Machines这是一家前沿实验室公司。这里是韩国的 Naver Cloud客户包括韩国银行Bank of Korea、Hyundai 等众多优秀公司。在中国台湾还有 GMI。然而以上所有的公司它们都需要计算栈。黄仁勋表示下面的这整个技术栈正是让 NVIDIA 闻名的原因。他介绍道“所有的硬件、软件和库以及我们连接全球第三方开发者生态系统的能力使得任何人都能建立起一个 AI 云。然而现在的 AI 云极其复杂。这个是软件版本这个是计算机科学版本。而资金版本、资产版本就是我之前展示的——它是一个巨大的工厂。仅拥有这种能力是不够的这正是 NVIDIA 成为一家 AI 基础设施公司的原因。”Vera Rubin 架构全面投产在谈及下一代 AI 基础设施建设时英伟达 CEO 黄仁勋宣布基于新一代 GPU 平台的 Vera Rubin 架构已经进入全面量产阶段。黄仁勋表示当前全球对 AI 算力的需求正以前所未有的速度增长。从数据中心运营商到云服务提供商再到各类企业客户整个产业链都在全力提升产能以满足市场需求。“实用 AI 已经到来可盈利的 AI 已经到来。”黄仁勋说。他认为越来越多企业已经认识到人工智能不再只是技术展示而是能够创造实际商业价值的生产工具。在这一背景下算力正成为限制 AI 发展的关键瓶颈。为了满足全球激增的需求英伟达正在推动新一代 AI 基础设施的大规模部署并协同合作伙伴在世界各地建设 AI 工厂。黄仁勋表示这也是当前整个产业生态最重要的任务之一。在供应链建设方面黄仁勋透露Vera Rubin 平台所对应的供应链规模已经达到上一代 Grace Blackwell 平台的两倍。与此同时生产效率也获得显著提升。过去组装一套 Grace Blackwell 机架需要约两个小时而如今这一过程已经缩短至五分钟。“这不仅意味着更高的产能也意味着更快的交付速度。”黄仁勋表示面对持续增长的市场需求供应链各环节都在不断扩大生产规模、提高制造效率。他介绍为支持 Grace Blackwell 平台量产产业链此前已经投入数百万平方英尺的生产设施。而目前这些合作伙伴正在进一步扩充产能为 Vera Rubin 的大规模部署做好准备。演讲最后黄仁勋特别向供应链合作伙伴表达感谢。他表示Vera Rubin 能够顺利进入全面量产阶段离不开整个产业生态系统的共同努力。 “我要感谢你们所有人。”黄仁勋说“Vera Rubin 现已全面投产。”在介绍 Vera Rubin 架构时黄仁勋将其定义为一套面向智能体Agent时代打造的计算系统而不仅仅是一台运行 AI 模型的超级计算机。他表示随着 AI 从模型训练、推理逐步迈向智能体阶段计算需求正在发生根本变化。智能体需要频繁调用工具、访问数据库、与外部系统实时交互因此对延迟、带宽和系统协同能力提出了更高要求。为此Vera Rubin 采用了全新的系统设计将 CPU、GPU、网络、存储和安全模块深度整合形成面向智能体工作负载的完整基础设施平台。黄仁勋特别展示了 Vera Rubin NVLink 72 系统。他介绍相比上一代产品主要面向预训练和推理场景Vera Rubin 进一步针对智能体推理进行了优化。通过 NVLink 72 互连架构以及全新的系统设计设备内部不再需要大量线缆和复杂连接结构不仅提升了可靠性也显著降低了部署和维护成本。Vera CPU 重磅登场除了 GPU 系统外英伟达还同步推出了专为 AI 时代设计的 Vera CPU。黄仁勋认为传统 CPU 主要服务于人类用户而未来将出现数十亿个智能体它们对响应速度几乎没有容忍空间。因此新的 CPU 架构必须在单线程性能、带宽、数据传输效率以及能效方面进行全面优化。按照英伟达的规划Vera CPU 将承担智能体编排、模型调度、工具调用、数据库访问以及存储管理等任务与 GPU 共同构成未来 AI 工厂的核心基础设施。黄仁勋表示随着智能体成为下一阶段 AI 发展的重要方向计算系统也正在从“为模型设计”转向“为智能体设计”。在谈到新一代 Vera CPU 时黄仁勋表示英伟达已经顺利完成了从传统 x86 CPU 架构向 Grace 架构的过渡这为 Vera 的推广奠定了基础。他指出目前全球主要数据中心、云服务商以及与英伟达合作的 AI 企业都已经完成了对 Grace 平台的认证相关软件栈、安全体系和开发环境也已完成适配。在此基础上Vera 的部署门槛将大幅降低。黄仁勋认为Vera 有望成为针对智能体Agent工作负载优化程度最高的 CPU 之一。原因在于它从设计之初便与 Vera Rubin 系统协同开发面向智能体推理、工具调用、数据库访问和实时交互等新型 AI 任务进行了针对性优化。为了展示性能提升黄仁勋公布了多个实际工作负载测试结果。其中在企业广泛使用的 SQL 数据库处理场景中Vera CPU 的性能达到现有平台的约 3 倍。在实时流处理场景下例如金融交易系统、工业遥测监控等需要持续处理海量数据流的应用中性能提升最高可达 6 倍。黄仁勋表示CPU 领域通常以个位数百分比的性能提升作为重要突破而在真实业务负载中实现数倍级增长并不常见。这些提升主要来自更高的单线程性能、更大的内存和 I/O 带宽以及更快的核心间数据传输能力。在他看来智能体正在成为继云计算、移动互联网之后的新一代计算负载而现有 CPU 大多是围绕人类用户设计的。未来随着智能体数量持续增长对低延迟和高响应速度的需求也将进一步提升。 “过去我们为人类构建 CPU现在我们开始为智能体构建 CPU。”黄仁勋表示。围绕 Vera 展开的新生态正在形成包括 ODM 厂商、服务器制造商和企业客户在内的产业链伙伴已经开始布局这一市场。英伟达希望借此推动一个全新的计算平台时代——面向智能体的 CPU 市场。开源 Nemotron 3 Ultra全球首个 SSM 与 MoE 相结合的混合架构在介绍企业级智能体生态时黄仁勋宣布英伟达正式推出新一代开源大模型 Nemotron 3 Ultra并将其定位为企业构建专属智能体的重要基础模型。黄仁勋表示未来企业将雇用大量智能体协助完成研发、验证、仿真和运营等工作。以 EDA 软件厂商 Cadence Design Systems 为例其正在利用英伟达技术打造面向芯片设计流程的专属超级智能体通过调用仿真器、验证器和形式验证工具加速芯片开发周期。作为这一生态的底座Nemotron 3 Ultra 采用了全球首个 SSM状态空间模型与 MoE混合专家相结合的混合架构。黄仁勋透露相比现有主流开源模型Nemotron 3 Ultra 推理速度提升 5 倍同时总体运行成本降低 30%。除了模型本身英伟达还同步开放训练数据、训练脚本以及相关工具链。黄仁勋表示Nemotron 系列基于大规模长程推理、复杂任务求解和工具调用数据集训练而成开发者不仅可以使用模型还能够在此基础上继续训练、微调并构建专属智能体系统。目前英伟达已经与 CrowdStrike、Salesforce、Palantir Technologies、SAP、ServiceNow 等企业展开合作推动智能体在企业软件、网络安全、数据分析和业务流程管理等场景中的落地应用。黄仁勋同时透露Nemotron 3 Ultra 已经发布而下一代 Nemotron 4 模型也正在研发之中。与微软联手重新定义 PC在演讲的后半程黄仁勋宣布英伟达正与 Microsoft 联手重新定义个人电脑PC。黄仁勋回顾了过去 40 年的 PC 发展历程。他表示从 Windows 3.1 到 Windows 95微软建立起了现代 PC 产业的基础架构通过开放硬件生态、驱动程序体系以及统一的软件接口让 PC 从企业设备走向大众消费市场并成为全球最普及的计算平台之一。如今随着 AI 时代到来英伟达和微软希望推动新一轮 PC 架构变革。黄仁勋透露双方已经为此合作了三年对 PC 的底层工作方式进行了重新设计以适应智能体Agent时代的计算需求。按照他的设想未来的 PC 不再只是运行应用程序的终端设备而将内置能够理解用户、与用户对话并自主完成任务的 AI 智能体。例如智能体可以帮助用户整理文件、检索资料、完成研究工作甚至根据用户需求主动执行复杂任务。黄仁勋认为这种变化将带来 PC 软件架构的重构。过去由应用程序承担的大量功能未来将逐步由智能体完成。与此同时大语言模型将成为新一代 PC 的重要基础组件承担语言理解、视觉识别、音视频生成以及任务执行等能力成为连接用户与计算资源的核心入口。他透露自己将与 Satya Nadella 共同介绍双方过去三年的合作成果并进一步展示面向智能体时代的新一代 PC 平台。