AI进入算账阶段过去一年模型厂商不断降价DeepSeek、通义千问、智谱、MiniMax等国产模型把大模型调用价格拉到了新的区间。表面看Token价格是模型厂商竞争结果实则每个Token背后都有一条从电力、土地、机柜、制冷、网络、存储、GPU调度到企业内部使用方式的长链条。优刻得董事长兼CEO季昕华接受InfoQ采访时谈到如今企业老板关心三件事一是让员工用上、用好AI二是降低使用AI的成本三是真正提高效率。这意味着AI开始进入算账阶段。Token成本不只是API标价问题而是贯穿“电力—算力—模型—应用—组织”的系统工程。优刻得选址乌兰察布的缘由优刻得到乌兰察布最初并非因为AI。据优刻得副总裁刘杰回忆2017年筹划建设乌兰察布数据中心时AI还未兴起当时主要考虑CPU业务第一栋楼也是按CPU计划建设后才转向GPU。优刻得设想把乌兰察布作为服务北京的“前店后厂”北京是用户和业务前台乌兰察布提供低成本、低时延的数据中心支撑。选择乌兰察布并非随意之举。季昕华提到当时苹果选数据中心因认可优刻得技术水平让其参与选址。团队考察多地后发现乌兰察布适合建数据中心原因有四一是电便宜二是苹果要求100%绿电内蒙古有机会做到三是天气冷PUE更好做四是离北京近网络时延和人员往来方便。这些因素在云计算时代重要在AI时代更关键因为AI最终会把成本打穿到电力上Token的终局是电力电便宜Token就便宜内蒙古正有此优势。数据中心成本竞争的转变刘杰表示算过一笔账以一台某国外顶级服务器为例其功耗约6.5千瓦一台服务器通常有8张GPU卡一个千卡集群约需125台服务器仅服务器一年耗电就很多再乘上PUE系数才是数据中心真正承担的总用电。这就是数据中心选址、电价、PUE、高功率机柜影响Token成本的原因。过去IDC行业关注机柜数量但AI时代传统机柜和AI算力所需的高功率机柜不同。优刻得青浦数据中心约42亩地设计容量约5000个机柜乌兰察布园区约212亩地设计容量约12000个机柜。大模型训练和推理需要更高功率密度普通机柜放不下多台高功耗GPU服务器单机柜供电、散热、网络布线、液冷能力都会重新定义数据中心价值液冷单机柜可做到35千瓦背后需要电路和散热系统专门改造。正因如此一些传统低功率数据中心空置高功率数据中心供不应求。季昕华提到国内部分低功率数据中心空闲率高而优刻得这类高功率数据中心未建就有订单。新建数据中心满载率预计很高已有签约订单。数据中心的成本竞争正从“有没有楼”转向“能不能承载AI”。乌兰察布的其他优势乌兰察布海拔高、年均温度低有利于制冷。PUE是数据中心关键指标数据中心总用电中用于服务器计算的比例越高PUE越低能源利用效率越好。气温低使制冷能耗下降PUE更易降低。此外乌兰察布所在区域能源结构稳定有风电、光电和煤电供电结构更稳。对于AI数据中心稳定电力和便宜电同样重要GPU集群怕中断和不稳定训练任务中断会损失电费、时间、算力窗口和客户信任。所以Token降本的第一步是选对地方降低电力成本和PUE建设高功率机柜。降低Token成本的方向季昕华谈到降低Token成本有几个方向一是使用国内模型DeepSeek等国内模型价格有优势智谱、MiniMax等客户和模型厂商也在提升能力很多企业应用并非都需调用最贵、最强的模型80分模型若能完成任务且成本低会是更现实的选择。二是从技术上提高“每度电产生Token的数量”这将AI成本问题拉回到基础设施效率上。过去讨论每百万Token价格而长期成本取决于每度电转化的有效Token数量GPU利用率、推理框架、模型部署、网络通信、存储读写都会影响这一指标。三是选择合适的数据中心位置内蒙古电力和气候条件好可形成底层成本优势。乌兰察布适合训练和北方大部分推理需求上海青浦适合华东地区对时延敏感的业务如金融、汽车等场景也适合部分推理业务这对应“东数西算”的分工逻辑。四是模型组合不同模型能力边界不同企业不应只用一个模型解决所有问题未来应把任务拆分让不同模型处理擅长部分甚至由平台自动选模型。AI降本不是一味调用便宜模型而是在“效果”和“成本”间动态路由复杂任务中20%可能需顶级模型其他部分可交给便宜、快速的模型。五是Prompt管理和Prompt Engineering很多企业喊AI成本高却未建立内部使用规则员工提问、调用模型、复用模板、重复调用等都会影响Token消耗让员工按规则使用Token也是降本手段这将问题从基础设施推进到组织管理。企业面临的问题与挑战企业真正的问题不是“有没有AI”而是“AI花出去的钱有没有产生价值”。优刻得内部每天看AI使用报告Coding、查询、PPT等场景用量在增长但目前最大问题是衡量投入产出。AI工具铺开后有三种情况一是员工摸索使用效果不稳定二是部分调用为个人使用三是用于公司工作的部分提效多少需评估。优刻得正在做产品帮助企业分析员工使用AI是否用于公司工作及使用效率。Token时代企业管理面临新命题。SaaS时代企业买软件按账号、席位、模块付费员工活跃说明软件价值高但AI不同用得越多成本越高。企业若没有治理体系老板推动AI后会面临尴尬局面感觉没提效但账单增加。所以便宜Token的另一面是Token治理季昕华把“如何让老板或管理干部评估Token产生的效益”视为当前最大挑战之一。AI进入企业会倒逼生产关系调整。未来组织里高层回答“做什么”和“为什么做”AI解决“怎么做”中间需要懂业务、懂架构的人驾驭AI。AI时代人才观也会变化过去招聘看重经验有了AI后主动性、好奇心、自我反思能力、业务理解可能更重要因为AI每天在变稀缺的是判断问题、拆解任务、驾驭工具并将AI产出落到业务结果上的能力。Token需求的长期趋势对于算力需求是否长期持续季昕华判断Token增长是长期趋势。年初现象级智能体应用带动普通用户体验AI热点退去后Token量仍快速增长。原因在于AI能力提升Coding能力让AI进入“干活”阶段视频、图片模型释放内容生产需求企业内部岗位开始使用AIAI硬件持续消耗Token。这些需求不是单次尝鲜而是工作流、内容流和硬件入口的持续消耗。Coding是明确的增长场景AI写代码能力提高后企业内部研发效率和工作方式会改变后端工程师可借助AI写前端测试和运维边界会打通非研发人员也能用AI完成部分工作。图像、视频、漫画、短剧是消耗大户生成式内容计算密集、调用频繁、结果需反复调整会产生大量Token和算力需求。AI硬件把调用入口扩展到多种终端硬件入口铺开后算力需求会更碎片化、常态化这也是优刻得判断高功率数据中心持续供不应求的原因。AI发展的瓶颈季昕华区分国内外瓶颈国内缺卡海外缺数据中心。国内GPU供应受限需先找卡有卡后还需高功率数据中心承载。海外很多区域算力基础设施落后于中国除美国外不少国家有大量存储需求。国内基础设施瓶颈有三个卡的瓶颈数据中心审批和统一管控的挑战旧基础设施上电和水的挑战。中国不缺电但电力配套要跟上产业发展数字需求增长快物理供给有现实约束即数字需求跑得太快物理供给跟不上。国产算力也是重要话题。季昕华认为国产GPU在国家支持和市场需求引导下性能提升快已到“可用状态”但整体性能和海外高端产品有差距。美国限制推动国内大模型公司和硬件厂商加快适配未来效率会提高。优刻得提到客户希望国产算力与模型加速适配国产算力要形成模型、框架、工具链和应用端的生态闭环国产算力降本是模型和硬件共同适配后的系统优化。AI基础设施的瓶颈在移动。Token生产由很多组件完成开始可能觉得GPU不够提升后内存成瓶颈内存做大后网络连接成瓶颈网络解决后CPU调度跟不上不同机器、机房连接又会成新挑战。整个系统要不断找到并突破瓶颈主要矛盾解决后次要矛盾会变成新的主要矛盾这是AI基础设施行业的真实一面是连续的系统调优。例如跨数据中心推理一些算法尝试实现跨数据中心推理调度可利用分散算力但新瓶颈是不同机房之间的带宽和网络延迟训练不太适合推理有机会。分布式推理目前最大瓶颈是算力资源不足分散算力可能导致资源浪费当前主流是集中式未来可能在边缘侧做缓存类似CDN通过“以存代算”减少重复计算但这套模式还未完全收敛说明AI推理不会简单复制互联网时代的边缘计算路径要考虑时延和算力利用率当前算力稀缺集中资源更经济。优刻得的定位与挑战优刻得定位是做中立的算力和模型服务平台。季昕华说优刻得已从传统云计算公司扩展成数字化公司云、大数据和算力是技术手段目标是发挥中立性帮助大家用好AI也帮助AI公司发展。中立性过去是优刻得面向游戏、电商等行业客户的标签游戏公司可能不用腾讯云电商公司可能顾虑阿里云因为存在业务竞争。到了AI时代这种中立性更重要阿里有通义千问腾讯有混元字节有豆包创业型大模型公司选择中立第三方云厂商更容易获得资源支持减少潜在竞争顾虑。优刻得在Token层面也可保持中立接入多个Token来源为客户选择合适的Token。优刻得面向的算力需求主要来自五类基础模型公司如智谱、MiniMax、DeepSeek等行业模型公司如金融、证券等有自己数据的公司手机、汽车等智能终端各种应用场景科学计算。这些客户未必有能力自建大规模数据中心也未必能从巨头获得足够资源和技术支持。优刻得的差异化在于提供从数据中心、高功率机柜、GPU算力、模型部署、Token计费到企业AI使用治理的一揽子能力。这条路并不轻松。AI基础设施是重资产数据中心建设需要多种资源GPU和AI服务器价格波动客户希望成本下降但上游设备不便宜云厂商和算力服务商需消化中间压力。同时现有数据中心标准落后于AI行业发展未来不同业务需要更精细化的数据中心标准AI基础设施降本包括重新定义业务所需的基础设施等级。任务分层、资源分层、模型分层都会成为未来Token降本的一部分。Token价格战背后的真实战场已转移到电力、数据中心和算力系统深处。当企业把AI用于各项业务Token会变成企业账本上的真实支出。谁能提高电力转化为有效算力的比例让GPU跑出更多有效Token组合模型成低成本工作流将员工的AI使用转化为可衡量的业务产出谁就能在下一轮AI基础设施竞争中留下来。Token便宜的尽头不只是模型降价还包括电力、算力、工程能力以及企业重新学会使用AI。那么企业能否在这场竞争中找到适合自己的降本之路呢
AI进入算账阶段:Token降本挑战与优刻得的中立破局之路
AI进入算账阶段过去一年模型厂商不断降价DeepSeek、通义千问、智谱、MiniMax等国产模型把大模型调用价格拉到了新的区间。表面看Token价格是模型厂商竞争结果实则每个Token背后都有一条从电力、土地、机柜、制冷、网络、存储、GPU调度到企业内部使用方式的长链条。优刻得董事长兼CEO季昕华接受InfoQ采访时谈到如今企业老板关心三件事一是让员工用上、用好AI二是降低使用AI的成本三是真正提高效率。这意味着AI开始进入算账阶段。Token成本不只是API标价问题而是贯穿“电力—算力—模型—应用—组织”的系统工程。优刻得选址乌兰察布的缘由优刻得到乌兰察布最初并非因为AI。据优刻得副总裁刘杰回忆2017年筹划建设乌兰察布数据中心时AI还未兴起当时主要考虑CPU业务第一栋楼也是按CPU计划建设后才转向GPU。优刻得设想把乌兰察布作为服务北京的“前店后厂”北京是用户和业务前台乌兰察布提供低成本、低时延的数据中心支撑。选择乌兰察布并非随意之举。季昕华提到当时苹果选数据中心因认可优刻得技术水平让其参与选址。团队考察多地后发现乌兰察布适合建数据中心原因有四一是电便宜二是苹果要求100%绿电内蒙古有机会做到三是天气冷PUE更好做四是离北京近网络时延和人员往来方便。这些因素在云计算时代重要在AI时代更关键因为AI最终会把成本打穿到电力上Token的终局是电力电便宜Token就便宜内蒙古正有此优势。数据中心成本竞争的转变刘杰表示算过一笔账以一台某国外顶级服务器为例其功耗约6.5千瓦一台服务器通常有8张GPU卡一个千卡集群约需125台服务器仅服务器一年耗电就很多再乘上PUE系数才是数据中心真正承担的总用电。这就是数据中心选址、电价、PUE、高功率机柜影响Token成本的原因。过去IDC行业关注机柜数量但AI时代传统机柜和AI算力所需的高功率机柜不同。优刻得青浦数据中心约42亩地设计容量约5000个机柜乌兰察布园区约212亩地设计容量约12000个机柜。大模型训练和推理需要更高功率密度普通机柜放不下多台高功耗GPU服务器单机柜供电、散热、网络布线、液冷能力都会重新定义数据中心价值液冷单机柜可做到35千瓦背后需要电路和散热系统专门改造。正因如此一些传统低功率数据中心空置高功率数据中心供不应求。季昕华提到国内部分低功率数据中心空闲率高而优刻得这类高功率数据中心未建就有订单。新建数据中心满载率预计很高已有签约订单。数据中心的成本竞争正从“有没有楼”转向“能不能承载AI”。乌兰察布的其他优势乌兰察布海拔高、年均温度低有利于制冷。PUE是数据中心关键指标数据中心总用电中用于服务器计算的比例越高PUE越低能源利用效率越好。气温低使制冷能耗下降PUE更易降低。此外乌兰察布所在区域能源结构稳定有风电、光电和煤电供电结构更稳。对于AI数据中心稳定电力和便宜电同样重要GPU集群怕中断和不稳定训练任务中断会损失电费、时间、算力窗口和客户信任。所以Token降本的第一步是选对地方降低电力成本和PUE建设高功率机柜。降低Token成本的方向季昕华谈到降低Token成本有几个方向一是使用国内模型DeepSeek等国内模型价格有优势智谱、MiniMax等客户和模型厂商也在提升能力很多企业应用并非都需调用最贵、最强的模型80分模型若能完成任务且成本低会是更现实的选择。二是从技术上提高“每度电产生Token的数量”这将AI成本问题拉回到基础设施效率上。过去讨论每百万Token价格而长期成本取决于每度电转化的有效Token数量GPU利用率、推理框架、模型部署、网络通信、存储读写都会影响这一指标。三是选择合适的数据中心位置内蒙古电力和气候条件好可形成底层成本优势。乌兰察布适合训练和北方大部分推理需求上海青浦适合华东地区对时延敏感的业务如金融、汽车等场景也适合部分推理业务这对应“东数西算”的分工逻辑。四是模型组合不同模型能力边界不同企业不应只用一个模型解决所有问题未来应把任务拆分让不同模型处理擅长部分甚至由平台自动选模型。AI降本不是一味调用便宜模型而是在“效果”和“成本”间动态路由复杂任务中20%可能需顶级模型其他部分可交给便宜、快速的模型。五是Prompt管理和Prompt Engineering很多企业喊AI成本高却未建立内部使用规则员工提问、调用模型、复用模板、重复调用等都会影响Token消耗让员工按规则使用Token也是降本手段这将问题从基础设施推进到组织管理。企业面临的问题与挑战企业真正的问题不是“有没有AI”而是“AI花出去的钱有没有产生价值”。优刻得内部每天看AI使用报告Coding、查询、PPT等场景用量在增长但目前最大问题是衡量投入产出。AI工具铺开后有三种情况一是员工摸索使用效果不稳定二是部分调用为个人使用三是用于公司工作的部分提效多少需评估。优刻得正在做产品帮助企业分析员工使用AI是否用于公司工作及使用效率。Token时代企业管理面临新命题。SaaS时代企业买软件按账号、席位、模块付费员工活跃说明软件价值高但AI不同用得越多成本越高。企业若没有治理体系老板推动AI后会面临尴尬局面感觉没提效但账单增加。所以便宜Token的另一面是Token治理季昕华把“如何让老板或管理干部评估Token产生的效益”视为当前最大挑战之一。AI进入企业会倒逼生产关系调整。未来组织里高层回答“做什么”和“为什么做”AI解决“怎么做”中间需要懂业务、懂架构的人驾驭AI。AI时代人才观也会变化过去招聘看重经验有了AI后主动性、好奇心、自我反思能力、业务理解可能更重要因为AI每天在变稀缺的是判断问题、拆解任务、驾驭工具并将AI产出落到业务结果上的能力。Token需求的长期趋势对于算力需求是否长期持续季昕华判断Token增长是长期趋势。年初现象级智能体应用带动普通用户体验AI热点退去后Token量仍快速增长。原因在于AI能力提升Coding能力让AI进入“干活”阶段视频、图片模型释放内容生产需求企业内部岗位开始使用AIAI硬件持续消耗Token。这些需求不是单次尝鲜而是工作流、内容流和硬件入口的持续消耗。Coding是明确的增长场景AI写代码能力提高后企业内部研发效率和工作方式会改变后端工程师可借助AI写前端测试和运维边界会打通非研发人员也能用AI完成部分工作。图像、视频、漫画、短剧是消耗大户生成式内容计算密集、调用频繁、结果需反复调整会产生大量Token和算力需求。AI硬件把调用入口扩展到多种终端硬件入口铺开后算力需求会更碎片化、常态化这也是优刻得判断高功率数据中心持续供不应求的原因。AI发展的瓶颈季昕华区分国内外瓶颈国内缺卡海外缺数据中心。国内GPU供应受限需先找卡有卡后还需高功率数据中心承载。海外很多区域算力基础设施落后于中国除美国外不少国家有大量存储需求。国内基础设施瓶颈有三个卡的瓶颈数据中心审批和统一管控的挑战旧基础设施上电和水的挑战。中国不缺电但电力配套要跟上产业发展数字需求增长快物理供给有现实约束即数字需求跑得太快物理供给跟不上。国产算力也是重要话题。季昕华认为国产GPU在国家支持和市场需求引导下性能提升快已到“可用状态”但整体性能和海外高端产品有差距。美国限制推动国内大模型公司和硬件厂商加快适配未来效率会提高。优刻得提到客户希望国产算力与模型加速适配国产算力要形成模型、框架、工具链和应用端的生态闭环国产算力降本是模型和硬件共同适配后的系统优化。AI基础设施的瓶颈在移动。Token生产由很多组件完成开始可能觉得GPU不够提升后内存成瓶颈内存做大后网络连接成瓶颈网络解决后CPU调度跟不上不同机器、机房连接又会成新挑战。整个系统要不断找到并突破瓶颈主要矛盾解决后次要矛盾会变成新的主要矛盾这是AI基础设施行业的真实一面是连续的系统调优。例如跨数据中心推理一些算法尝试实现跨数据中心推理调度可利用分散算力但新瓶颈是不同机房之间的带宽和网络延迟训练不太适合推理有机会。分布式推理目前最大瓶颈是算力资源不足分散算力可能导致资源浪费当前主流是集中式未来可能在边缘侧做缓存类似CDN通过“以存代算”减少重复计算但这套模式还未完全收敛说明AI推理不会简单复制互联网时代的边缘计算路径要考虑时延和算力利用率当前算力稀缺集中资源更经济。优刻得的定位与挑战优刻得定位是做中立的算力和模型服务平台。季昕华说优刻得已从传统云计算公司扩展成数字化公司云、大数据和算力是技术手段目标是发挥中立性帮助大家用好AI也帮助AI公司发展。中立性过去是优刻得面向游戏、电商等行业客户的标签游戏公司可能不用腾讯云电商公司可能顾虑阿里云因为存在业务竞争。到了AI时代这种中立性更重要阿里有通义千问腾讯有混元字节有豆包创业型大模型公司选择中立第三方云厂商更容易获得资源支持减少潜在竞争顾虑。优刻得在Token层面也可保持中立接入多个Token来源为客户选择合适的Token。优刻得面向的算力需求主要来自五类基础模型公司如智谱、MiniMax、DeepSeek等行业模型公司如金融、证券等有自己数据的公司手机、汽车等智能终端各种应用场景科学计算。这些客户未必有能力自建大规模数据中心也未必能从巨头获得足够资源和技术支持。优刻得的差异化在于提供从数据中心、高功率机柜、GPU算力、模型部署、Token计费到企业AI使用治理的一揽子能力。这条路并不轻松。AI基础设施是重资产数据中心建设需要多种资源GPU和AI服务器价格波动客户希望成本下降但上游设备不便宜云厂商和算力服务商需消化中间压力。同时现有数据中心标准落后于AI行业发展未来不同业务需要更精细化的数据中心标准AI基础设施降本包括重新定义业务所需的基础设施等级。任务分层、资源分层、模型分层都会成为未来Token降本的一部分。Token价格战背后的真实战场已转移到电力、数据中心和算力系统深处。当企业把AI用于各项业务Token会变成企业账本上的真实支出。谁能提高电力转化为有效算力的比例让GPU跑出更多有效Token组合模型成低成本工作流将员工的AI使用转化为可衡量的业务产出谁就能在下一轮AI基础设施竞争中留下来。Token便宜的尽头不只是模型降价还包括电力、算力、工程能力以及企业重新学会使用AI。那么企业能否在这场竞争中找到适合自己的降本之路呢