AI会算命了？一个开源项目在命理测试中准确率达到93%-尧图企业网站定制

它不是神棍是 40 条推理规则驱动的 Agent。上周在 GitHub 上看到一个项目名字叫MingLiSkill。简介只有一句话“命理学八字/紫微斗数推理 Skill为 LLM Agent 提供命理分析工具和系统化推理框架。”我点进去看了两个小时。看完只有一个感受——这可能是目前最严谨的开源命理推理系统。不是那种输入生日告诉你今天运势的玩具而是一个给大模型 Agent 用的系统化推理引擎。它把八字、紫微斗数、六爻、梅花易数、奇门遁甲、大六壬、面相、风水——八套术数体系——全部封装成了 Python 工具包然后让 DeepSeek 等 LLM 按照 40 条推理规则自主推理出答案。最新的 Benchmark 测试随机 15 题对了 14 题准确率 93.3%。一、这项目到底是干什么的简单说让 AI 能做命理推断而且做得比很多大师靠谱。传统的命理推断靠人——师傅根据你的出生年月日时排出八字四柱和紫微斗数十二宫然后结合经验判断你的性格、事业、婚姻、财运等。MingLiSkill 把这个过程完全自动化了fromtoolsimportHybridMingliToolkitimportjson htkHybridMingliToolkit()resulthtk.analyze_question(year1990,month6,day15,hour12,gender男,category事业,question此命最适合从事什么行业,options_jsonjson.dumps([{letter:A,text:公务员},{letter:B,text:自己做生意},{letter:C,text:技术工程师},{letter:D,text:教师}]))datajson.loads(result)这一步返回的是完整的排盘数据——八字四柱、五行力量分布、十神关系、紫微十二宫主星、大运流年——全部计算完毕以结构化的 JSON 形式返回。然后LLM Agent拿到这些数据按照 SKILL.md 中写好的推理规则自己判断答案。关键AI 不是猜的是在一个规则系统里推的。但这只是工程层面的解读。真正让这个项目区别于其他AI算命项目的是接下来的东西——40条推理规则。二、更关键的东西40 条推理规则如果只是调个工具排个盘那和普通算命软件没什么区别。MingLiSkill 的核心价值在于它的SKILL.md——一份长达数千行的推理规则文档。里面写了 40 条 Agent 必须遵守的推理纪律我挑几条最有意思的说规则 2地支天干天干外在表现、别人看到的。地支内在真实、潜意识。当天干和地支信号冲突时地支为真天干为表。这条规则直接决定了性格判断的准确度。一个人天干正印表面知书达理地支双七杀内在恐惧压抑→ 内在恐惧是核心性格正印只是外包装。没有这条规则AI 会误判成一个温和有教养的人。规则 3制化改写十神十神不是孤立存在的。有制化的十神性格表现被改写。七杀被食神所制 → 不暴戾反而聪明有才、化压力为动力。这相当于命理学里的化学反应方程——两个十神相互作用产出的不是 AB而是 C。不做制化检查会误判一个人的核心性格。规则 5多信号交叉验证任何选项判断必须至少有 2 个独立信号源支撑。单一信号作出的判断置信度低。八字信号是一个维度紫微斗数是一个维度流年数据是第三个维度。这三个维度的信号要互相印证取净正向最多的选项。这和量化交易里的多因子模型逻辑一模一样。规则 7十神力量权重原则所有涉及数量的判断不得仅数出现次数必须同时乘以对应五行力量。力量值 1.0 的十神即使出现多次实际影响力极弱。这条规则来自 Benchmark 测试中反复踩坑后的修正。AI 天然喜欢数数——看到印星出现了 3 次就判高学历。但加权后印星力量只有 0.5实际连大专都勉强。不加权的判断是灾难性的。这 40 条规则不是凭空设计的。每一条都来自 Benchmark 错题的回溯修正。那这些规则到底准不准数据最能说明问题。三、93% 的准确率是怎么测出来的MingLiSkill 的所有推理规则都在一个统一的 Benchmark 数据集上测试——MingLi-Bench包含 160 道命理选择题覆盖 11 个类别事业、婚姻、财运、健康、子女、学业、家庭、性格、官非、灾劫、外貌。三种推理模式的对比推理模式准确率速度全球排名Agent SkillLLM自主推理93.3%分钟级—混合路由LLM规则引擎41.77%秒级第 2 名纯规则引擎 v333.75%0.02 秒/题第 8 名三个数据点很有意思纯规则引擎只有 33.75%。说明命理推断不是一个穷举规则就能解决的问题规则引擎能覆盖模式清晰的部分比如灾劫 100%、健康 53%但对需要综合判断的题目规则是死的。LLM Agent 能达到 93.3%。因为 Agent 用规则作为约束框架但在框架内做了自主推理——相当于一个受过系统训练的命理师而不是一个按手册操作的机器。最让我惊讶的是各分类的准确率类别正确题数准确率事业55100%健康33100%家庭44100%婚姻11100%性格11100%学业2367%事业、健康、家庭、婚姻、性格——五个类别全对。学业错了 1 题可能是因为印星加权的规则在部分边界 case 上还需要调优。到这里你可能会问这东西到底有什么用总结一个开源项目的野心MingLiSkill 不是那种输入生日看桃花运的娱乐产品。它是一个严肃的推理框架实验——把千年传承的命理体系用现代 AI Agent 的方式重新表达。规则是约束不是教条Agent 是推理者不是执行器。对我来说这个项目最有价值的地方不是它会算命而是它展示了 LLM Agent 在一个高度结构化的领域里如何在规则约束下做出超越规则的推断。我没有提这个项目的不足。不是因为它没有——是因为它的 Benchmark 仍在持续迭代每周都有规则更新和准确率提升。下一次测试的成绩可能就不是 93% 了。项目地址github.com/dfytensor/MingLiSkill

相关新闻

震惊！多家UV软膜技术大对比，哪家性价比高一看便知！

1781071448281

NTAG 213 TT芯片ASCII镜像与安全特性深度解析及配置实战

实战指南：深度解析Mastodon iOS小组件的完整开发架构与实现方案

智慧树课程自动化终极指南：3大逆向工程突破实现高效学习

告别系统束缚：跨平台iOS应用管理的终极解决方案

MaxToCAD插件实战：从3DMax模型到精准CAD平面图的参数化生成指南

S32K344 FreeRTOS 移植实战：从零搭建实时操作系统环境

MPC8548E硬件设计实战：PLL滤波、时钟配置与热管理避坑指南

AIOps 事件关联与影响面分析：从单点告警到全局拓扑

Grafana 仪表盘即代码与模板化管理：从手动配置到 GitOps

梯度累积与大 Batch 训练策略：从显存限制到等效大批量

陪诊小程序开发玩法分析：全流程就医服务架构、匹配机制与落地方案

从“大通铺”到“写字楼”的链路层进化史

RAG 召回质量治理：用 Go 构建可调试的切片、检索与重排链路

从陌生到熟悉：Royal TSX中文汉化包的体验地图之旅

时延最优化设计

别再重启了！Windows 11下dwm.exe内存飙升，我用Intel官方工具升级显卡驱动搞定