火山引擎张鑫:企业Agent落地,我们之前忽视了经营问题

火山引擎张鑫:企业Agent落地,我们之前忽视了经营问题 作者 | 高 飞我们已经习惯了用类比来描述眼下这场新工业革命。比如把AI比作蒸汽机或发电机。这个类比自然恰当但我感觉并不完整。因为蒸汽机进入工厂之后改变的不只是机器的转速还有工厂的组织方式和生产方式。于是泰勒在1911年出版的《科学管理原理》成了现代管理学的奠基之作。这本书的主旨就是用科学化、标准化的管理方法代替传统的经验管理以实现劳动生产率的最大化。这套体系被认为是第二次工业革命的必然产物。今年春节过后一波Agent热潮之后Agent落地越来越多“数字员工”在企业中的占比也越来越高这也就意味着同一类管理科学问题正在回归。记得黄仁勋在CES 2025上有过一个判断“技术部门将成为数字劳动力的人力资源部门以后我们会有生物劳动力和数字劳动力。”这个新人力资源部门显然需要新的体系和工具。FORCE原动力大会期间我专访了火山引擎副总裁张鑫。他的团队这次发布了一系列Agent产品升级贯穿其中的理念正是把Agent当员工来经营。张鑫称之为数字员工的经营体系。管理领域有一句话叫你衡量什么你得到什么。所以我们先从衡量谈起。张鑫提到一个调研中的发现“有企业Agent做得很多但看token调用量微乎其微好多属于日抛型AgentDAU甚至小于等于1。”日抛型Agent是问题的一面建了但没人用。另一面同样棘手有些Agent确实在大量运行token预算越来越高但CEO同样说不清这笔投入带来了多少回报。两种情况背后是同一种缺失企业缺乏衡量Agent价值的手段进一步投入AI预算也就有了顾虑。要补上这个缺失需要先理解企业Agent为什么比个人Agent难这么多。这也是我最先问张鑫的问题。一套系统如何匹配全球业务的复杂度日抛型Agent是一个行业性现象其中有一个客观背景OpenClaw龙虾一波热潮之后过去一年Agent的构建门槛急剧降低。以OpenClaw为标志vibe coding让零代码配置Agent成为现实。但是为个人造Agent和为企业造Agent是两码事。深层的原因在于企业场景本身的复杂度。个人使用AI工具提效路径很清晰一个人、一个清晰目标、一堆自己完全有权限的上下文。张鑫说个人场景下的Agent之所以好用“本质上就是因为从生产到验证流程中只有一个人”。但企业就完全不同了。“企业中的Agent面对的是一群人还往往叠加着一个不那么清晰、甚至需要跨团队去协同制定的目标一堆陈旧的系统甚至是从来没有被写出来的隐性规则和知识。”他举了个例子你去问销售团队“把你Top Sales的最佳卖点告诉我你是怎么一步一步做的”这个东西没有人讲清楚过更不会有人沉淀到文档里。这引出了张鑫提出的一对关键区分AI驱动的超级个体和企业的数字员工。超级个体的优势是敏捷个人拿着工具就能跑。但问题也明显“员工的流动和流失也就带走了业务的上下文。”知识跟着人走不跟着组织走。这也让我想起微软CEO纳德拉前几天的一场播客他也把这件事上升到了企业竞争力的高度。他提出“人力资本”和“Token资本”两个概念核心观点是 “你可以外包一项任务甚至一份工作但永远不能外包你的知识学习。”把超级个体的知识转化成组织可沉淀的资产这是数字员工区别于个人助手的核心要求。但采集知识的方式如果出了偏差后果同样严重。这个月有一个刷屏级的AI事件今年4月起Meta在美国员工的电脑上安装追踪软件记录键盘敲击、鼠标移动和屏幕截图来训练AI超过1500名员工签署了抗议请愿书Meta CTO Andrew Bosworth承认员工士气“接近20年来最差”。我想其实这是一个非常简单的心理学机制对于员工来说“我把知识贡献出来会不会被取代”彼得·德鲁克1959年提出“知识工人”概念时就观察到知识工人和体力劳动者需要完全不同的管理方式。体力劳动者可以通过计件和监控来管理知识工人只能通过设定目标和赋予自主性来激发。监控一个知识工人的键盘敲击和在流水线上计件是同一种思维。张鑫在落地实践中的心得和德鲁克方向一致首先不要上来就向业务人员索取“先用当前Agent能达到的程度帮他解决重复繁琐的工作让他先尝到甜头”。其次要让知识贡献和个人回报可见可衡量“你孵化出四个数字员工它们产出越多归因到你身上的也越多”。关键词是归因人贡献经验形成skillsAgent基于skills产出价值价值可追溯归因到人。人从执行者升级为Agent的优化者和管理者。我在采访中做了一个总结“企业主和员工之间要互相给安全感老板要给员工安全感员工要给老板安全感。”CEO的真实痛点企业Agent落地的卡点之前我们讲的是知识和人的问题这是心理学机制问题。但是还有经济学机制问题。对CEO来说有一个更直接的痛点是钱Agent的token预算占企业IT支出越来越高CEO不一定怕花钱但希望投入和回报能被计算。“我今年投了100万做Agent项目到底给我带来了多少收益你们号称用AI效率到底提升了多少”张鑫也说这是管理者问得最多的问题。过去的Agent平台更多停留在技术管理层面管权限、管接入、看日志。但既然Agent成了一种员工CEO需要的就不仅是技术指标还有经营指标产出了多少、节省了多少人效、投入产出比是多少。张鑫称之为“从Agent管理上升到数字员工经营”。“数字员工”这个概念并不新鲜Copilot时代就在讲。张鑫自己也意识到这层包袱“一些企业一说数字员工就‘这事你们说了多少年了’。” 他的回答是“之所以会有‘说了多少年了’的感觉就是因为数字员工没有真正在企业内部被量化、被度量、被看见。”只有在产品上建立了经营体系能看到招聘、上岗、绩效产出能做PIP和调优数字员工才能从一个漂浮的概念变成可被操作的组织单元。绩效数据还有一层更深的价值。Agent运行中产生的轨迹、日志、指标和人类反馈可以回流进Learning Loop驱动Agent持续自我优化。张鑫用生物学做类比如果把上下文Context比作大脑、Harness比作躯干和四肢那Learning Loop就是新陈代谢系统。绩效度量不只是给CEO看的报表它同时也是Agent进化的燃料。丰田生产方式在1970年代提出“改善”kaizen的核心理念不追求一步到位的完美设计而是通过持续的小幅改进和现场反馈形成闭环。Agent的Learning Loop本质上就是一种数字化的kaizen。不过Learning Loop中最具想象力的强化学习方向目前也最难落地。难点在于奖励函数有标准答案的客观题好打分但企业里大量任务是主观的、模糊的。“你在这个场景训好了它能判断下一个场景怎么办”张鑫说“我们自己的强化学习还在路上大家都在路上。”从构建到经营四个产品两层逻辑无论是心理学机制还是经济学机制有了体系还需要工具。从知识沉淀到绩效度量再到持续迭代这套经营体系都需要一整套产品来承载。火山引擎这次在Agent开发和运营上带来了几个重要产品的全新升级其中。TRAE大家可能相对熟悉。TRAE最初面向程序员是一个coding IDE理论上非研发人员也能用。但实际上非研发人员一打开满屏代码“反而不符合他的taste”张鑫说。所以TRAE WORK作为独立端发布主界面是自然语言交互面向更广泛的日常工作场景。HiAgent和AgentSphere则构成另一层逻辑更和我们今天的主旨有关。当企业自有Agent数量达到数百上千IT部门需要一套底座来统一管理这些Agent的开发、运行和持续迭代这是HiAgent的角色它管的是Agent的技术生命周期。而AgentSphere就是HiAgent之上的经营视角统一调度、绩效看板、价值度量。AgentSphere的定位是“数字员工派遣站”。AgentSphere作为“数字员工派遣站”将数字员工的生命周期拆解为招聘、上岗、进化、退岗四个阶段配套全局概览、业务产出、产物评分、投入成本四张看板。“如果绩效好像人类员工一样可能有promotion在Agent世界里可能是分配更多的tokens。如果绩效不好人可能要走PIPAgent里面可能就是通过数据回流去迭代。”张鑫说。对比Anthropic只有Claude Code加CoworkOpenAI言必称CodeX火山引擎的构建工具选择显得稍显复杂。张鑫的解释是不同角色面对同一个能力时需要完全不同的界面。他还用编程语言的多产品并存演进来做类比“最早有了C语言为什么后来还有C、Python、Go我们大概能讲清楚每个语言更擅长什么但Python就真不能用来写其他的应用吗也未必。”他也承认多产品带来了解释成本“在go-to-market层面我们还需要把定位讲得更清楚”。但他个人的信条是“AI时代技术演化太快了我不敢太早下定义。希望给用户一定的选择权让用户投票。”多产品策略的背后还有一个技术层面的原因Agent和模型在现阶段无法完全解耦。“OpenClaw之所以能成功是因为模型达到了一定的tipping point。把OpenClaw去适配一个弱模型是不奏效的。”但当模型趋于商品化、能力趋于稳定以后解耦有可能实现“它可能会变成今天的容器能够更好地做标准化接口”。总之从构建到绩效火山引擎提供的是一整套工具。Agent的组织方式可能和人不同在访谈中我和张鑫还聊到Agent的组织行为学问题。大家知道在人类世界专业分工是一切经济行为的基础。人在组织内的分工方式已经很成熟了Agent会沿用人类体系吗结论是不一定。我们先说比较类似的。张鑫认为Agent至少可以从两个维度来细分一种是稳态Agent处理规则明确、准确性要求高的流程性任务另一种是敏态Agent应对开放性、探索性的场景。正所谓“不要用Agent战略的勤奋掩盖战术的懒惰”好像一个企业说“我在落地Agent”就万事大吉实际上稳态和敏态需要完全不同的建设路径。说类似是因为在波士顿矩阵中现金牛、明星和问号业务就需要不同的团队类型。再说区别比较大的这里我们还是要回到知识这个话题。人的知识边界是窄的所以人类组织需要按专业分工。但模型对知识的吸取能力远超个人未必需要照搬横向BU制。我们走访企业的观察是企业本能地按职能给Agent分岗营销Agent、客服Agent、HR Agent但这样做的实质是在用提示词约束模型能力客观上拆出了大量功能重叠的Agent。张鑫也用了一个比喻来描述这个状况这是“每个萝卜都拆一个坑。”他认为真正要做的是“组织去适配新的AI能力而不是AI适配现有组织”。他用自己团队的变化做例证原来研发按前端、后端、SRE、QA、架构师、产品经理划分岗位“现在围绕你要做的产品用一个不大的团队借助Agent端到端完成从产品设计到coding各个环节。” TRAE团队94%的代码已经由AI生成。横向职能在收敛纵向深度在增加。这意味着在一个Agent充分参与的组织里IT部门和业务部门的关系也会重构。IT负责保证Agent基础设施的稳定运行和安全围栏业务部门基于这些脚手架自行构建和迭代面向场景的Agent。两者从原来需求-排期-交付的串行关系转向基础设施与应用的纵向协同。管理科学用了一个世纪从泰勒走到丰田但科学就意味着没有最终的标准答案。每一次生产力工具的代际更替都催生出上一代管理框架回答不了的新问题。张鑫说强化学习“还在路上大家都在路上”组织适配也才刚有雏形。Agent的经营体系不会有一个终极形态它会和Agent的能力一起演化和使用它的组织一起变形。