账单上的隐藏成本关于AI烧钱业内流传着各种惊人数字如xAI花超10亿美元建Colossus超算集群OpenAI月度算力账单达数亿美元等。大家多谈算力GPU成衡量AI公司实力的通用货币。Latent Space播客中xAI前研究员Ethan He透露训练视频大模型成本巨大。假设爬取10亿条平均5MB的视频需5PB存储空间按AWS S3定价每月约10万美元。训练前用VAE压缩视频成特征向量压缩后数据体积与原始视频相当两项叠加每月存储费超20万美元。还有数据进出费下载视频带宽费用比存储还贵每次训练都要搬运全量数据实验越多费用越高仅数据每月就要几百万美元还未算GPU费用。扛不住的带宽费自建Colossus数据中心的xAI在存储和带宽上省了很多钱。大语言模型训练数据是文本体积轻量训练后原始数据基本完成使命而视频数据体积大每次训练都要完整过一遍全量数据。迭代速度越快数据搬运成本越高而迭代速度是视频模型研发关键变量。Ethan在NVIDIA构建Cosmos世界模型时意识到视频模型有提升空间因需要不用按AWS账单算钱的地方存放和搬运数据所以去了xAI。对于无自建基础设施的团队每月几百万美元的数据成本叠加GPU算力成本用公有云就像用无底洞账单与对手自建机房赛跑难以靠技术取胜。视频模型的护城河不是模型大语言模型领域“开源vs闭源”竞争激烈Llama系列让小团队有竞争力还逼OpenAI和Anthropic压低API价格。但视频生成领域格局不同能做出顶尖视频模型的基本是背靠巨量资源的团队。很多人认为是数据和算力差距实则视频AI基础设施成本从一开始就锁死了竞争门槛。这和半导体行业类似台积电难撼动是因新晶圆厂前期投入高。视频AI的护城河是数据基础设施和带宽账单。Ethan还指出视频模型的“智能”大多来自背后的语言模型视频扩散模型较“愚钝”真正理解用户意图的是做“提示词重写”的大型语言模型。决定公司在视频AI领域发展的是能否同时撑起语言和视频模型两套基础设施并有效协同。下一个战场早就被划好了行业在摸索出路如提示词重写的Agent化、语言模型调度视频生成工具、用FFmpeg处理中间环节目的是分层计算成本减少无效计算和数据搬运。Ethan预测今年年底“视频Agent”将出现拐点当生成视频质量达“可投放商业广告”水准企业才会买单成本结构也会演变。但谁掌握数据存储和流转谁就掌握游戏起点。在AI赛道“真正的壁垒”不断轮换现在视频AI揭示的壁垒是基础设施账单不是算法突破。
AI烧钱惊人!视频模型数据成本高昂,基础设施成竞争关键壁垒
账单上的隐藏成本关于AI烧钱业内流传着各种惊人数字如xAI花超10亿美元建Colossus超算集群OpenAI月度算力账单达数亿美元等。大家多谈算力GPU成衡量AI公司实力的通用货币。Latent Space播客中xAI前研究员Ethan He透露训练视频大模型成本巨大。假设爬取10亿条平均5MB的视频需5PB存储空间按AWS S3定价每月约10万美元。训练前用VAE压缩视频成特征向量压缩后数据体积与原始视频相当两项叠加每月存储费超20万美元。还有数据进出费下载视频带宽费用比存储还贵每次训练都要搬运全量数据实验越多费用越高仅数据每月就要几百万美元还未算GPU费用。扛不住的带宽费自建Colossus数据中心的xAI在存储和带宽上省了很多钱。大语言模型训练数据是文本体积轻量训练后原始数据基本完成使命而视频数据体积大每次训练都要完整过一遍全量数据。迭代速度越快数据搬运成本越高而迭代速度是视频模型研发关键变量。Ethan在NVIDIA构建Cosmos世界模型时意识到视频模型有提升空间因需要不用按AWS账单算钱的地方存放和搬运数据所以去了xAI。对于无自建基础设施的团队每月几百万美元的数据成本叠加GPU算力成本用公有云就像用无底洞账单与对手自建机房赛跑难以靠技术取胜。视频模型的护城河不是模型大语言模型领域“开源vs闭源”竞争激烈Llama系列让小团队有竞争力还逼OpenAI和Anthropic压低API价格。但视频生成领域格局不同能做出顶尖视频模型的基本是背靠巨量资源的团队。很多人认为是数据和算力差距实则视频AI基础设施成本从一开始就锁死了竞争门槛。这和半导体行业类似台积电难撼动是因新晶圆厂前期投入高。视频AI的护城河是数据基础设施和带宽账单。Ethan还指出视频模型的“智能”大多来自背后的语言模型视频扩散模型较“愚钝”真正理解用户意图的是做“提示词重写”的大型语言模型。决定公司在视频AI领域发展的是能否同时撑起语言和视频模型两套基础设施并有效协同。下一个战场早就被划好了行业在摸索出路如提示词重写的Agent化、语言模型调度视频生成工具、用FFmpeg处理中间环节目的是分层计算成本减少无效计算和数据搬运。Ethan预测今年年底“视频Agent”将出现拐点当生成视频质量达“可投放商业广告”水准企业才会买单成本结构也会演变。但谁掌握数据存储和流转谁就掌握游戏起点。在AI赛道“真正的壁垒”不断轮换现在视频AI揭示的壁垒是基础设施账单不是算法突破。