PriLLM: 为LLM服务实时定价的 Stackelberg Game 建模【School of CS and Eng，Southeast University】-尧图企业网站定制

原论文Pricing Online LLM Services with Data-Calibrated Stackelberg Routing Gamehttps://arxiv.org/pdf/2511.09062#NashEquilibrium #routing #ProfitCurve #KKT #MPECPriLLM是一个为LLM服务商设计的实时定价模型。作为一个经济模型PriLLM有一个比较宏大的世界观不但包含Nash Equilibrium的推演更有对 profit curve 的智能简化功能。当服务商定好价格用户根据自己的偏好决定购买量模型把这个过程对比实际数据调整参数。根据新的市场态势是个NE服务商对友商进行排序并虚拟所有尾部友商为一整体用这个简化的市场模型快速给出价格。而后台会进一步对比简化前后的模型打磨参数。从数学角度上讲这个模型的很多部分都是NP-hard的MPEC问题。这个模型的底层逻辑是一个Stackelberg routing game leader是服务商先定下价格follower是用户把消费值分配给市场上多个服务商。很直观性的用户会通过决定在不同APP上的消费fij来最小化自己的cost包括的因素有p价格d延迟b品牌价值还有Q也就是服务商当前订单量比上他的服务上限α。本文的每个“用户”实际上都是按照APP使用偏好集合出的群体另外作者还简单证明了所有的 cost functions 集合在一起可以求出一个 Nash Equilibrium把这个解叫做F*。而服务商在定价的时候Qjifij/αj然后他最大化他的盈利。把这个底层设定总结成公式就是PriLLM在计算用户端 Nash Equilibrium 时会和真实市场数据拟合。这一步就是最小化模型求出的F*和实际数据间的距离。而在求导NE时作者们用了与 (1)(2) 同解的 potential function 包含带有用户偏好因素的ΦFixedF以及和拥塞有关的ΦCongestionF。这里的解F*符合 Karush-Kuhn-Tucker (KKT) conditions 。具体Φ的公式如下而在商家定价这个环节作者们把友商信息简化出一个集成度更高的模型定价时只用这个简化的模型然后后台会进行一系列拟合去更新 profit curve 。这里用到了 deep aggregation network 简略地给当前每个友商打个分再把排到第K位和之后的友商放在一起看作是一整个友商。每个友商表示成一个矢量并根据这些数据给出总和性与平均性的打分而对于本商家s则是估算他的 profit curve。根据模型参数算出不同价位的利润值预期再把用整个模型和简化模型得到的两条 profit curves 进行拟合以减小这个简化过程的失真性。在试验数据中PriLLM展现出了在数据量较少情况下的学习能力。而模型对b参数和Q参数的利用也明显提升了预测准确性。Profit curve 的简化功能提升了模型效率。在 K1 时模型已经可以模拟出90%以上的利润而当K2时运算时间还是成倍增长而作者也提到多市场参与者前提是他们下一步的一个方向。

相关新闻

Lua 协程：从 API 到底层原理再到 Skynet 架构的完整学习路径

10427条密码产品证书全部收集到，我发现几个数据跟认知完全对不上

Vue-Codemirror 进阶配置：从代码提示框不显示到优雅折叠，我的踩坑实录

网络安全零基础完整学习路线+避坑注意事项（详细讲解）

如何永久保存微信聊天记录：三步实现数据自由与AI训练

从if-else地狱到智能系统：软件架构的演进与实践

Oracle数据清洗实战：用正则表达式搞定脏数据（附常用函数详解）

智慧教育平台电子课本解析工具：让教材获取变得前所未有的简单

DW02A/DW02B 高精度内置 MOSFET 锂电池保护电路

Linux 组调度核心原理：task_group 的层次化公平调度

从关键词到语义网络：生成式引擎优化（GEO）的技术原理解析与工程实践

从命令行到采购单：手把手教你用Linux命令(dmidecode)生成服务器内存升级报告

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势