MiroMind新模型超越GPT-5.4,三位顶尖AI科学家加盟

MiroMind新模型超越GPT-5.4,三位顶尖AI科学家加盟 MiroMind的MiroThinker系列模型每次更新都有巨大进步。高难度基准测试表现超GPT5MiroThinker-v1.0深度研究模型单次任务多达600次工具调用。最强搜索智能体MiroThinker-v1.5再次刷新榜单。刚刚发布的MiroThinker-v1.7模型家族在深度研究任务中刷新了开源模型的最佳成绩MiroThinker-H1深度研究评测成绩更是超越了OpenAI、Google、Anthropic等巨头的最新产品。新模型发布的同时MiroMind还迎来了三位顶尖科学家的加盟。深度研究能力的新标杆MiroThinker 1.7模型家族这是一次针对长链条任务智能体的重大升级。所谓长链条任务指的是需要多步骤推理、多次工具调用、深度信息检索才能完成的复杂任务。MiroThinker 1.7支持256K上下文窗口能够进行长程推理和深度多步分析。单个任务最多支持300次工具调用相比前代产品在逐步推理和决策准确性上有了显著提升。模型提供30B和235B两个参数规模适配不同的研究场景和算力预算。在评测数据方面MiroThinker 1.7交出了一份亮眼的成绩单。在BrowseComp评测中取得74.0%的准确率在BrowseComp-ZH中文评测中达到75.3%在GAIA-Val-165评测中获得82.7%在HLE-Text评测中取得42.9%的成绩。其中BrowseComp-ZH的成绩刷新了开源模型的最佳纪录。而MiroThinker-1.7-mini仅用30B参数就在BrowseComp-ZH上取得了72.3的成绩同样打破了开源模型的纪录。通过优化的后训练流程较小的模型规模也能在特定任务上达到出色的表现。BrowseComp是由OpenAI发布的浏览智能体评测基准要求模型在网络中持续导航以寻找难以发现、相互交织的信息。这个评测专门测试AI在网络环境中定位信息的能力其问题设计简洁但挑战性极高答案简短且易于验证。BrowseComp-ZH则是该评测的中文版本专门评估模型在中文互联网环境中的信息检索能力。MiroMind还推出了一款专有智能体MiroThinker-H1它在多个评测中都取得了领先成绩。在BrowseComp上达到88.2%在BrowseComp-ZH上达到84.4%在GAIA上达到88.5%在xbench-DeepSearch-2510上达到72.0%在SEAL-0上达到61.3%。多个基准上超越了目前顶级闭源模型Claude-4.6-OpusGemini-3.1-Pro和OpenAI-GPT-5.4。长链条可验证推理是MiroMind技术路线的核心特点。推理过程可以被逐步验证推理结果可以被全局验证。这种方法提升了复杂智能体工作流的性能使AI系统能够完成更可靠的任务。三位顶尖科学家加盟与MiroThinker 1.7发布几乎同步MiroMind宣布三位世界级科学家加入其核心AI研究团队。三位科学家分别负责推理模型训练、运行时与智能体系统、可验证AI三大技术方向构成了MiroMind重型求解器引擎的三大支柱。杜少雷博士出任推理模型与训练首席科学家。杜博士现任华盛顿大学保罗·艾伦计算机科学与工程学院副教授研究领域涵盖机器学习理论、深度学习优化、大规模推理模型训练。他曾在xAI担任技术团队成员直接参与前沿大模型研发工作。此外他曾在Facebook AI Research担任访问教授在普林斯顿高等研究院从事博士后研究。杜博士将负责MiroMind核心推理模型训练系统的端到端构建包括模型架构设计、大规模训练策略、推理能力的系统性增强。华盛顿大学计算机科学与工程学院在AI领域享有盛誉杜博士于2024年获得斯隆研究奖这是北美最具声望的青年科学家奖项之一。他的研究聚焦于为深度学习构建理论基础理解模型的工作原理并设计更好的算法。在强化学习、非凸优化、数据合成与选择等领域都有重要贡献。安波教授出任运行时与智能体系统首席科学家。安教授现任新加坡南洋理工大学终身教授研究领域涵盖多智能体系统、强化学习、博弈论、AI驱动决策。他的研究成果发表在NeurIPS、ICML、AAAI等顶级国际会议上论文被引用超过13300次。他领导了多项大规模研究项目指导了一代博士研究员。安教授不仅在学术上成就斐然在应用AI和技术转化方面也有丰富经验。他曾与多家领先科技企业和政府机构合作参与大规模决策系统、自主协调机制、AI驱动优化等项目。他将负责MiroMind运行时与智能体系统技术部门监督系统执行层架构的设计和持续演进推动推理模型与验证核心的深度融合目标是构建高度可靠、可水平扩展、完全可审计的系统框架。杨凯宇博士出任可验证AI实验室首席科学家。杨博士此前在Meta基础人工智能研究院担任研究科学家更早之前在加州理工学院从事博士后研究。他在可验证推理和形式证明系统领域建立了领先的研究地位这些领域正是MiroMind技术愿景的核心所在。杨博士的研究目标是构建能够产出可信任结果的AI其正确性无需耗费大量人工检验。他的研究涵盖AI辅助形式定理证明、自动形式化等领域开发了LeanDojo、CoqGym、Goedel-Prover等工具被引用超过9600次。他在2025年4月的西蒙斯研究所演讲中系统阐述了形式推理与大语言模型结合的前景。在MiroMind杨博士将负责建立和运营可验证AI实验室聚焦两个关键研究方向即可验证推理和可验证生成。可发现智能的宏大愿景MiroMind的使命不是构建更善言辞的语言模型而是设计一类全新的AI系统能够进行严格推理解决现实世界的难题其输出不仅看似合理而且可以形式化验证。创始人陈天桥是一位连续创业家和慈善家。他于1999年创立了盛大网络开创了中国网络游戏产业的先河盛大也成为国内最早的科技独角兽之一。此后他与妻子创立了陈天桥雒芊芊脑科学研究所长期致力于脑科学和神经科学研究。陈天桥在中美两地都有深厚的商业和投资经验这为他构建MiroMind的全球化视野奠定了基础。MiroMind的愿景是打造可发现智能即能够做出预测并探索新概念的AI而非仅仅分析现有知识。公司正在构建世界上第一个通用求解器一种以推理为先的AI系统其目标不仅是看起来正确而是可以被证明正确。通过开创可验证的长链条系统2推理MiroMind的AI在软件工程、金融服务、医疗制药、法律合规、科学研究等高风险领域具备可靠性和可信度。公司团队超过80%是博士研究员由全球顶尖的科学领导团队引领。MiroMind正在走出一条与众不同的道路不追求模型规模的单纯扩张而是聚焦于推理能力和可验证性这在当前AI领域是一股清流。从评测数据来看这条技术路线已经初见成效。MiroThinker-H1在BrowseComp和BrowseComp-ZH上均取得了所有模型中的最高分分别达到88.2%和84.4%。在GAIA评测中MiroThinker-H1的88.5%同样是所有模型中的最佳成绩。MiroThinker 1.7的开源发布让更多研究者和开发者能够接触到这一技术路线的成果。参考资料https://github.com/MiroMindAI/MiroThinkerhttps://huggingface.co/collections/miromind-ai/mirothinker-17https://www.prnewswire.com/news-releases/miromind-announces-three-world-class-scientific-leaders-to-join-its-core-ai-research-team-302712917.html