摘要 当前全球AI算力供需结构持续失衡HBM芯片价格暴涨供不应求多家出海科技厂商正在调整资源配置应对冲击。单家出海AI厂商的算力成本台账拆解上周我在深圳南山跟进一家主打跨境电商AI生成工具的出海客户翻他们刚更新的Q3运营台账时发现算力采购项的单月支出环比涨幅超过60%负责人正在把原本准备投北美渠道投放的200万预算临时挪移到芯片采购池里当前行业内HBM芯片价格暴涨供不应求的传导效应已经沿着供应链渗透到出海赛道的每一个环节。 这家厂商做的是面向欧美独立站卖家的AI商品图生成工具去年同期他们的算力支出占总营收比例还稳定在22%到今年Q2已经升到35%Q3单月的算力支出占比直接冲到47%。台账里原本单独列在“办公设备采购”下的显存升级专项预算现在已经被移动到核心成本的第一顺位原本预留的30万季度预算根本覆盖不了实际支出团队只能临时砍掉两个非核心市场的本地化运营项目把省下来的资金补进算力采购池。我翻完他们的台账的时候桌面上还放着云服务商刚发的调价通知邮件里面标注着搭载高带宽显存的实例配额新用户几乎申请不到长期包年折扣。HBM供需波动带来的显性成本位移出海AI赛道过去三年的成本结构非常稳定70%的算力相关支出流向公有云资源订阅20%流向定制化硬件采购剩余10%覆盖运维和带宽成本大部分厂商都不需要在算力层面设置额外的浮动预算。从今年Q1开始这套稳定的成本结构已经出现明显位移。云服务商的溢价传导链路北美主流云厂商今年陆续调整了高带宽显存实例的定价策略原本针对100台以上批量订单的长期订阅折扣从40%收窄到15%相当于单实例的采购成本直接上浮近30%。原本7天就能完成的批量算力资源交付现在普遍拉长到35天以上不少中小出海厂商提交的包年申请直接被云服务商告知没有配额只能去二级市场找流通渠道拿现货资源部分紧俏型号的现货流通价已经比去年同期高出70%。 我接触到的一家做AI跨境呼叫中心的厂商原本计划今年Q3扩容200台推理节点最后只拿到了70台的云资源配额剩下的130台只能从第三方算力租赁平台采购单小时的使用成本比云厂商的原价高出42%。原本预留的扩容预算直接花超了近50万团队只能临时推迟新功能的迭代节奏。容易被忽略的隐形成本新增项大部分出海厂商做成本核算的时候只会统计硬件采购和云资源订阅的显性支出很少把供需波动带来的隐性风险纳入计算这部分成本今年已经吃掉了不少厂商近10%的毛利。 之前我对接的一家做多模态AI短视频生成的出海团队今年6月签下了北美流媒体平台的年度内容服务商订单合约里明确写了月均生成1200条4K视频的交付要求当时他们按2024年Q1的算力成本报价签完等到8月算力配额不够的时候临时找第三方算力租赁平台补资源不仅单小时算力成本翻了1.8倍还因为跨平台调度不当出现过2次总时长3小时的服务中断赔了平台方总计12万美元的违约金这笔钱在他们最初的年度预算里根本没有设置对应的科目。隐形成本的核心来源不是价格上涨本身而是供需不稳定带来的合约履约风险溢价。出海厂商面向海外客户的SLA协议普遍要求99.9%以上的服务可用性之前大家默认云厂商的算力供给能兜底现在供给缺口出来之后很多厂商不得不额外设置算力冗余池单这部分冗余的闲置成本就吃掉了近8%的毛利。还有部分厂商为了锁定产能提前和上游供应商签长单付出的锁单定金占全年算力预算的比例从之前的5%升到了22%这笔资金的机会成本很少被计入常规的成本核算体系里。不同体量出海厂商的成本适配路径对比我近三个月访谈了近20家不同规模的出海AI厂商他们针对当前的供给环境已经摸索出完全不同的成本调整策略没有统一的标准答案只和各自的业务体量、客户结构高度匹配。哪怕在HBM芯片价格暴涨供不应求的背景下中小厂商的灵活调整反而拿到了比头部厂商更高的投入产出比。三类厂商的资源配置调整差异第一类是年营收10亿以上的头部出海AI厂商他们已经跳过了公有云的资源采购逻辑直接和上游芯片厂商签年度框架协议虽然锁单价格比去年同期高40%但拿到了稳定的配额甚至可以把闲置的算力资源对外租售对冲部分成本上涨压力。这类厂商的核心诉求不是压低算力单价而是拿到排他性的供给优先级避免核心业务的算力供给被突发情况打断。第二类是年营收1-10亿的腰部厂商他们没有足够的体量直接对接上游现在普遍在做模型轻量化改造把原本需要高带宽显存支持的70B大模型蒸馏到13B参数规模在保证核心推理精度不下降3%的前提下单算力单元的显存占用直接下降72%能把单月算力支出压回营收占比的25%以内。不少腰部厂商专门划出了10人以内的优化团队专门针对自己的垂直场景做显存调度优化投入产出比非常可观。 第三类是年营收低于1亿的中小出海厂商他们现在很少碰重算力的训练需求转而对接已经完成模型训练的行业头部厂商的推理API按调用量付费完全跳过硬件采购的环节把算力相关的固定成本全部转化为可变成本避免被产能波动波及。这类厂商的核心优势是业务足够灵活不需要绑定重资产反而能在供给波动的周期里拿到更稳定的成本控制效果。年度算力预算的重构逻辑参考过往出海厂商做下一年度算力预算的时候普遍直接用当年的算力使用量乘以每年10%的技术迭代降价预期给出下一年的总预算这套基于供需宽松环境的测算逻辑在当前的市场环境下已经完全失效。新的预算体系不能再按单算力的单价做线性测算要把供给稳定性权重放到和价格权重同等的位置。很多出海厂商之前的成本核算里完全没有把模型轻量化、显存优化的研发投入算进算力相关的预算里实际上每年拿出算力总预算的8%投入到模型推理优化的技术迭代中能在未来12个月里把整体算力支出压减30%左右模型轻量化的研发投入ROI远高于在现货市场竞价抢硬件的回报。三维度拆分预算池的实操方法现在更合理的测算方式是把整个算力预算池拆成三个独立部分第一部分占60%用来签长期稳定的算力合约哪怕单价比散单高20%也要锁定交付周期和配额上限用来覆盖80%的常规业务需求保证核心业务的稳定性第二部分占25%用来对接多个第三方算力调度平台的浮动资源用来应对临时的业务峰值比如黑五、网一期间跨境电商的内容生成高峰调用量会是平时的5倍以上这部分资源按需结算不用承担闲置成本第三部分占15%作为风险预备金不预先划定使用范围专门用来应对突发的供给缺口或者海外客户的临时订单调整避免出现之前那种违约赔款的状况。 这套拆分逻辑我已经给近10家出海厂商做过参考目前落地的厂商都没有在Q3出现算力预算花超20%以上的状况整体的成本稳定性比之前提升了近60%。出海赛道成本端传导的后续观察方向接下来半年全球不同区域的算力供给缺口会出现明显的分化北美市场的云厂商优先保障本土科技企业的配额东南亚、中东的出海厂商能拿到的算力配额反而会比欧美厂商更充裕。不少出海团队已经开始把部分推理业务的节点部署到新加坡、阿联酋的云可用区反而拿到了比部署在美西区域更低的算力成本这个跨区域调度的套利空间还没有被大部分出海厂商注意到。部分海外的本土芯片厂商正在推出适配中小参数大模型的低显存优化方案明年Q2之后非HBM的显存替代方案的市场占比会提升到15%左右供给端的缺口会得到部分缓解但完全回到2023年的供需宽松状态至少要等到2025年下半年新的产能完全落地之后。我接下来还会跟进不同区域出海厂商的算力调度样本记录更多成本优化的实操案例帮出海厂商在波动周期里找到更适配自身业务的成本控制路径。
全球AI出海产业链应对HBM芯片价格暴涨供不应求的动态观察
摘要 当前全球AI算力供需结构持续失衡HBM芯片价格暴涨供不应求多家出海科技厂商正在调整资源配置应对冲击。单家出海AI厂商的算力成本台账拆解上周我在深圳南山跟进一家主打跨境电商AI生成工具的出海客户翻他们刚更新的Q3运营台账时发现算力采购项的单月支出环比涨幅超过60%负责人正在把原本准备投北美渠道投放的200万预算临时挪移到芯片采购池里当前行业内HBM芯片价格暴涨供不应求的传导效应已经沿着供应链渗透到出海赛道的每一个环节。 这家厂商做的是面向欧美独立站卖家的AI商品图生成工具去年同期他们的算力支出占总营收比例还稳定在22%到今年Q2已经升到35%Q3单月的算力支出占比直接冲到47%。台账里原本单独列在“办公设备采购”下的显存升级专项预算现在已经被移动到核心成本的第一顺位原本预留的30万季度预算根本覆盖不了实际支出团队只能临时砍掉两个非核心市场的本地化运营项目把省下来的资金补进算力采购池。我翻完他们的台账的时候桌面上还放着云服务商刚发的调价通知邮件里面标注着搭载高带宽显存的实例配额新用户几乎申请不到长期包年折扣。HBM供需波动带来的显性成本位移出海AI赛道过去三年的成本结构非常稳定70%的算力相关支出流向公有云资源订阅20%流向定制化硬件采购剩余10%覆盖运维和带宽成本大部分厂商都不需要在算力层面设置额外的浮动预算。从今年Q1开始这套稳定的成本结构已经出现明显位移。云服务商的溢价传导链路北美主流云厂商今年陆续调整了高带宽显存实例的定价策略原本针对100台以上批量订单的长期订阅折扣从40%收窄到15%相当于单实例的采购成本直接上浮近30%。原本7天就能完成的批量算力资源交付现在普遍拉长到35天以上不少中小出海厂商提交的包年申请直接被云服务商告知没有配额只能去二级市场找流通渠道拿现货资源部分紧俏型号的现货流通价已经比去年同期高出70%。 我接触到的一家做AI跨境呼叫中心的厂商原本计划今年Q3扩容200台推理节点最后只拿到了70台的云资源配额剩下的130台只能从第三方算力租赁平台采购单小时的使用成本比云厂商的原价高出42%。原本预留的扩容预算直接花超了近50万团队只能临时推迟新功能的迭代节奏。容易被忽略的隐形成本新增项大部分出海厂商做成本核算的时候只会统计硬件采购和云资源订阅的显性支出很少把供需波动带来的隐性风险纳入计算这部分成本今年已经吃掉了不少厂商近10%的毛利。 之前我对接的一家做多模态AI短视频生成的出海团队今年6月签下了北美流媒体平台的年度内容服务商订单合约里明确写了月均生成1200条4K视频的交付要求当时他们按2024年Q1的算力成本报价签完等到8月算力配额不够的时候临时找第三方算力租赁平台补资源不仅单小时算力成本翻了1.8倍还因为跨平台调度不当出现过2次总时长3小时的服务中断赔了平台方总计12万美元的违约金这笔钱在他们最初的年度预算里根本没有设置对应的科目。隐形成本的核心来源不是价格上涨本身而是供需不稳定带来的合约履约风险溢价。出海厂商面向海外客户的SLA协议普遍要求99.9%以上的服务可用性之前大家默认云厂商的算力供给能兜底现在供给缺口出来之后很多厂商不得不额外设置算力冗余池单这部分冗余的闲置成本就吃掉了近8%的毛利。还有部分厂商为了锁定产能提前和上游供应商签长单付出的锁单定金占全年算力预算的比例从之前的5%升到了22%这笔资金的机会成本很少被计入常规的成本核算体系里。不同体量出海厂商的成本适配路径对比我近三个月访谈了近20家不同规模的出海AI厂商他们针对当前的供给环境已经摸索出完全不同的成本调整策略没有统一的标准答案只和各自的业务体量、客户结构高度匹配。哪怕在HBM芯片价格暴涨供不应求的背景下中小厂商的灵活调整反而拿到了比头部厂商更高的投入产出比。三类厂商的资源配置调整差异第一类是年营收10亿以上的头部出海AI厂商他们已经跳过了公有云的资源采购逻辑直接和上游芯片厂商签年度框架协议虽然锁单价格比去年同期高40%但拿到了稳定的配额甚至可以把闲置的算力资源对外租售对冲部分成本上涨压力。这类厂商的核心诉求不是压低算力单价而是拿到排他性的供给优先级避免核心业务的算力供给被突发情况打断。第二类是年营收1-10亿的腰部厂商他们没有足够的体量直接对接上游现在普遍在做模型轻量化改造把原本需要高带宽显存支持的70B大模型蒸馏到13B参数规模在保证核心推理精度不下降3%的前提下单算力单元的显存占用直接下降72%能把单月算力支出压回营收占比的25%以内。不少腰部厂商专门划出了10人以内的优化团队专门针对自己的垂直场景做显存调度优化投入产出比非常可观。 第三类是年营收低于1亿的中小出海厂商他们现在很少碰重算力的训练需求转而对接已经完成模型训练的行业头部厂商的推理API按调用量付费完全跳过硬件采购的环节把算力相关的固定成本全部转化为可变成本避免被产能波动波及。这类厂商的核心优势是业务足够灵活不需要绑定重资产反而能在供给波动的周期里拿到更稳定的成本控制效果。年度算力预算的重构逻辑参考过往出海厂商做下一年度算力预算的时候普遍直接用当年的算力使用量乘以每年10%的技术迭代降价预期给出下一年的总预算这套基于供需宽松环境的测算逻辑在当前的市场环境下已经完全失效。新的预算体系不能再按单算力的单价做线性测算要把供给稳定性权重放到和价格权重同等的位置。很多出海厂商之前的成本核算里完全没有把模型轻量化、显存优化的研发投入算进算力相关的预算里实际上每年拿出算力总预算的8%投入到模型推理优化的技术迭代中能在未来12个月里把整体算力支出压减30%左右模型轻量化的研发投入ROI远高于在现货市场竞价抢硬件的回报。三维度拆分预算池的实操方法现在更合理的测算方式是把整个算力预算池拆成三个独立部分第一部分占60%用来签长期稳定的算力合约哪怕单价比散单高20%也要锁定交付周期和配额上限用来覆盖80%的常规业务需求保证核心业务的稳定性第二部分占25%用来对接多个第三方算力调度平台的浮动资源用来应对临时的业务峰值比如黑五、网一期间跨境电商的内容生成高峰调用量会是平时的5倍以上这部分资源按需结算不用承担闲置成本第三部分占15%作为风险预备金不预先划定使用范围专门用来应对突发的供给缺口或者海外客户的临时订单调整避免出现之前那种违约赔款的状况。 这套拆分逻辑我已经给近10家出海厂商做过参考目前落地的厂商都没有在Q3出现算力预算花超20%以上的状况整体的成本稳定性比之前提升了近60%。出海赛道成本端传导的后续观察方向接下来半年全球不同区域的算力供给缺口会出现明显的分化北美市场的云厂商优先保障本土科技企业的配额东南亚、中东的出海厂商能拿到的算力配额反而会比欧美厂商更充裕。不少出海团队已经开始把部分推理业务的节点部署到新加坡、阿联酋的云可用区反而拿到了比部署在美西区域更低的算力成本这个跨区域调度的套利空间还没有被大部分出海厂商注意到。部分海外的本土芯片厂商正在推出适配中小参数大模型的低显存优化方案明年Q2之后非HBM的显存替代方案的市场占比会提升到15%左右供给端的缺口会得到部分缓解但完全回到2023年的供需宽松状态至少要等到2025年下半年新的产能完全落地之后。我接下来还会跟进不同区域出海厂商的算力调度样本记录更多成本优化的实操案例帮出海厂商在波动周期里找到更适配自身业务的成本控制路径。