穿越AI的演进周期,联想千亿目标背后的三张“底牌”

穿越AI的演进周期,联想千亿目标背后的三张“底牌” 作者毛烁大模型技术突破到产业落地中国AI产业的底层逻辑正在进入新一轮变革周期。过去AI基础设施更多承担的是资源支撑角色为模型训练和应用运行提供算力、存储和网络但随着AI训练、推理和Agent应用快速增长AI产业开始越来越重视算力最终能够转化出多少Token以及如何持续提升Token的生产效率。于是Token逐渐成为衡量AI价值创造的重要单位基础设施的角色也在发生变化。其正在演变为一套围绕Token生产效率运行的生产系统。这种变化的背后本质上是中国AI产业对基础设施提出了新的要求从资源供给走向价值生产从能力支撑走向效率驱动。率先感受到这一变化的正是身处产业链核心位置的基础设施提供商。联想正是其中的先驱者过去几年联想持续推进AI基础设施战略升级。从异构智算平台、AI算力基础设施到词元工厂Token Factory其价值锚点已经不再局限于服务器产品本身而是通过打通从算力、数据到模型和应用的完整链路将分散的AI能力转化为可规模化复制的生产能力。而联想对于自身的定位也从基础设施提供商转变为AI算力基础设施与Token生产体系的构建者。也正是在这样的背景下联想问天近期完成品牌焕新并提出新的发展目标。联想集团副总裁、中国基础设施业务群总经理陈振宽透露到2027年联想中国基础设施业务群将锚定1000亿元人民币目标并向中国服务器市场第一发起冲击。联想集团副总裁、中国基础设施业务群总经理陈振宽目标之外当AI产业的价值导向开始从消耗算力走向生产Token时联想又是如何完成这场换新升级的01 研发范式迁徙从“稳态”规划到“敏态”创新联想给出的第一个答案来自研发体系的重构。今天回头看AI带来的变革并不仅仅是算力需求的爆发更重要的是打破了基础设施产业长期形成的研发节奏。过去适用于通用计算时代的方法论越来越难以适应AI技术快速迭代的现实。三年前联想问天品牌刚刚发布时服务器行业的运作逻辑依然呈现出显著的‘稳态’特征。在当时通用计算与超算HPC占据着算力市场的主导地位。在这样的产业环境下产品规划的核心锚点是上游芯片厂商相对清晰的三到五年技术路线图。服务器厂商则围绕这些长期规划制定产品迭代节奏并投入近18个月甚至更长时间完成庞大的交叉验证矩阵以确保产品能够满足大规模、普适化部署的需求。但是这种模式建立在一个重要前提之上。联想中国基础设施业务群服务器事业部总经理周韬指出彼时产业链各环节的发展节奏相对稳定且可预测。无论是处理器更新周期还是企业客户的采购需求整体都遵循着较长周期的演进规律。因此研发工作的核心任务是保证产品稳定性、兼容性和规模化交付能力。联想中国基础设施业务群服务器事业部总经理 周韬但AI的出现改变了这一切。大模型快速发展尤其是GPU技术进入高频迭代周期基础设施产业开始面对前所未有的变化速度。周韬表示过去可以提前数年规划的技术路线如今往往在数月时间内就会迎来新的变量。与此同时模型架构、训练框架以及推理场景也在持续演进使得市场需求变得更加复杂且难以预测。而对于基础设施厂商而言挑战已经不仅来自底层芯片的快速迭代更来自上层模型与应用需求的持续变化。过去动辄数年的研发周期开始难以跟上AI技术演进的速度。换句话说过去强调“做对产品”如今更重要的是“更快的做对产品”。这意味着传统以长期规划和全覆盖验证为核心的研发模式已经难以满足AI时代的需求。面对这种变化联想选择主动调整研发范式。在深入客户需求调研的过程中联想发现了一个重要现象。周韬坦言虽然AI产业整体变化迅速但真正进入训练与推理场景后客户对于基础设施配置的需求并非是无限发散的而是逐渐向少数高频组合集中。例如在GPU服务器部署中客户实际采用的往往是三到四种主流配置方案内存规格、网络配置以及加速卡组合也呈现出明显的集中趋势。这一发现改变了联想对于研发资源配置的思路。往往服务器厂商需要针对海量软硬件组合进行全面验证以确保覆盖尽可能广泛的市场需求而现在更高效的方式则是聚焦最具代表性的主流场景将研发资源集中投入到客户最关注的配置组合之中。基于这一思路联想开始精简传统的大规模交叉验证流程并与产业链头部合作伙伴建立更紧密的协同机制。通过聚焦核心场景和主流配置研发团队能够在更短时间内完成产品定义、原型开发和客户验证。周韬透露过去需要一年甚至更长时间才能完成验证并推向市场的产品如今往往可以在几个月内完成样机开发并直接进入客户真实业务环境进行测试和迭代。研发逻辑也由此发生变化。从以往的“验证充分后再上市”到如今的“快速验证、快速迭代、快速交付”。这种“敏态”创新所带来的直接结果是创新效率的显著提升。周韬透露目前联想已经能够同时推进10至15个前沿产品项目的探索与开发相比传统研发模式新技术从验证到落地的周期被大幅缩短产品迭代速度也显著提升。这种变化除了发生在研发体系内部也进一步影响了联想的生态合作策略。联想中国基础设施业务群战略总监黄山表示随着国内AI产业快速发展越来越多GPU及相关技术创新企业涌现出来。面对不断扩大的技术生态企业不可能对所有方向投入同等资源因此如何选择合作伙伴本身也成为基础设施厂商的重要能力。联想中国基础设施业务群战略总监 黄山而联想的选择是聚焦关键方向与最具技术潜力和产业价值的伙伴建立更深层次协同。不难理解相比广泛布局联想更倾向于围绕客户实际需求构建联合创新能力共同完成产品验证、方案优化以及场景落地从而让新技术能够更快转化为可规模化部署的生产力。从稳态到敏态从长周期规划到快速迭代从追求全面覆盖到聚焦核心场景这场研发范式的转变也反映出联想对于AI时代基础设施创新逻辑的重新理解。对于联想而言研发体系的重构是这场转型的起点。02 价值体系升维构建高能效“Token工厂”研发体系完成敏捷化改造后联想开始进一步思考如何让这些不断迭代的技术最终转化为更高效的价值产出。黄山的答案是把基础设施的优化目标从硬件能力延伸到生产效率本身。在他看来当产业开始以Token衡量价值时决定竞争力的不再是单一设备性能而是整个系统的综合效率。这一判断也被系统性地写进联想近期首发的产业专著《词元工厂词元经济的财富生产范式》中该专著由黄山等主创撰写、中国科学院院士领衔推荐围绕“词元工厂”“智能产能”“有效算力”“安全可控”四大核心概念解构了AI基础设施从算力支撑走向智能生产系统的底层逻辑在这一导向指引下联想内部也提出了极具挑战性的目标通过软硬协同优化持续降低Token生产成本推动每百万Token的硬件成本降低到1元人民币以内。目标背后考验的是一整套系统工程能力。为此联想也发布了万全异构智算平台V5.0和超节点解决方案并构建了覆盖计算、缓存、容错、供电、通信和散热六大环节的优化体系。首先是计算效率。为了进一步释放算力性能联想将优化深入到算子、计算框架以及算子编译系统等底层软件栈。黄山透露联想团队近期在芯模编译优化方向的研究成果获得IEEE论坛优秀论文奖也从侧面反映出其在底层工程优化上的持续投入仅有算力并不意味着高效率。对于大模型推理而言缓存系统同样决定着整体吞吐能力。围绕KV Cache键值缓存联想重点优化缓存命中率和缓存量化技术以提升推理效率。而当训练和推理规模持续扩大系统稳定性开始成为影响产出的另一项关键因素。为此联想构建了相应的容错机制以保障模型训练过程中的MFU模型算力利用率并确保96卡级推理池能够长期稳定运行。除了计算系统本身基础设施底层同样存在大量优化空间。随着单机柜功率不断攀升供电效率的重要性日益凸显而联想则引入了800V高压直流垂直供电技术通过提升电压、降低电流的方式减少能量损耗和发热为高密度计算提供更高效的电力支撑。与此同时由于GPU集群规模越大通信效率的重要性也越突出。黄山透露联想计划在未来一年进一步推进光互联技术应用并在软件层面研发自主计算通信库以实现不同GPU平台之间更高效的协同通信。而在散热系统上依托联想“海神”全冷板液冷技术让高功耗AI设备能够获得更加稳定的散热保障从而支撑更高密度部署需求。六大环节的优化体系看似分布在不同层面实则共同构成了一条完整的效率优化链条也为联想的“Token工厂”打下了基础。03 从资源调度到产业交付让“Token工厂”的飞轮转起来六大环节的优化能解决通用训练与推理场景下的效率问题那么把这套体系推向极限的是今年以来快速规模化崛起的Agent应用。与前两年以问答式交互为主的大模型应用相比Agent承担的是真实任务的执行工作。其不仅需要理解用户意图还要自主完成任务拆解、工具调用、多轮推理以及结果反馈。这种变化带来的是计算链路的显著拉长。系统需要同时管理更多并发任务、更复杂的上下文以及更长周期的资源占用。换句话说同样一套底层优化能力在Agent场景下面临的是全新的压力计算资源如何分配、任务如何调度、缓存如何复用成为影响整体吞吐量和响应效率的核心要素。针对这些新的运行压力联想在优化体系之上给出了三个更具针对性的解法。在安全治理方面针对企业私有化部署场景联想与火山引擎等合作伙伴共同打造安全能力体系将公有云环境积累的大规模安全经验引入企业侧部署环境相关产品预计于7月正式推出。对于并发管理问题联想引入了开源测试工具PinchBench对办公、编程等典型Agent场景进行模拟测试通过持续优化系统调度策略提高复杂任务环境下的并发处理能力。在缓存资源管理方面针对多Agent同时运行带来的KV Cache占用问题联想在Harness层之上增加了独立监控与调度机制实现了缓存资源的动态分配和释放从而提升整体资源利用率。而当底层能力逐渐成熟联想的下一步“落子”便是如何让不同类型的客户真正用起来。对此联想构建了三种差异化的交付模式。第一类是面向地方政府和产业园区的城域级公共Token中心。通过建设区域性AI基础设施平台为产业提供统一的算力服务能力。第二类是面向大型企业的私有化“Token工厂”。针对数据安全、行业模型以及业务定制化需求较高的客户联想能够将算力系统与企业现有数据中心基础设施进行联动实现更精细化的资源与能耗管理。第三类是面向中小企业的订阅制服务。依托联想百应等平台中小企业无需大规模的前期投入即可获得算力、存储、网络以及PaaS能力且还能根据业务发展逐步扩展使用规模。“对于算力服务而言我们在底层提供的技术栈与核心能力是一致的改变的只是为契合不同客户需求而设计的交付形式。”黄山如是说。04 写在最后在AI技术普惠的时代交汇点联想的这次“换新升级”的深层含义是对底层范式的一次重新定义。从敏态研发的流程重构到六大环节的系统工程优化再到面向千行百业的多元交付联想的每一步都在印证其对AI产业逻辑变迁的精准洞察。面对日益庞大的算力需求与复杂多变的Agent场景联想依托生态协同与前沿创新能力正在重塑行业价值标尺推动算力基础设施从传统“资源支撑载体”向高效能的“Token生产系统”跃迁。穿越AI的演进周期以Token生产效率为核心的新纪元已经到来。而联想倾力打造的这座千亿级“Token工厂”是对自身业务增长的重新锚定更是在新一轮算力变革浪潮中为中国AI产业的规模化落地筑牢坚实底座