机器学习解偏微分方程：文献中的过度乐观与评估准则-尧图企业网站定制

一项新的研究指出在关于机器学习模型如何求解特定类型方程的科学期刊文章中存在普遍的过度乐观倾向。研究人员提出了两条报告结果的准则并呼吁进行系统性变革以提升报告的清晰度与准确性。围绕机器学习人工智能的一种形式的热潮很容易让人感觉这类技术解决所有科学问题只是时间问题。虽然常有令人印象深刻的论断但这些论断并不总能经得起推敲。机器学习或许对解决某些问题有用但在其他问题上则表现不足。在《自然·机器智能》期刊的一篇新论文中某机构的研究人员对比较机器学习与传统方法求解流体相关偏微分方程的研究进行了系统性回顾。这类方程在许多科学领域都至关重要包括为电网发展聚变能的等离子体研究。研究人员发现在求解流体相关偏微分方程时将机器学习方法与传统方法进行比较的结果往往偏向于机器学习方法。他们还发现负面结果总是被低估。他们提出了进行公平比较的规则并认为要解决这些似乎具有系统性的问题文化层面的变革同样不可或缺。“我们的研究表明尽管机器学习潜力巨大但当前文献在描绘机器学习如何求解这类特定方程时呈现出的图景过于乐观”该机构的计算科学副主管、该研究的首席研究员表示。与弱基线比较结果偏微分方程在物理学中无处不在对于解释热传导、流体流动和波等自然现象尤为有用。例如这类方程可用于计算放入热汤中的汤匙沿长度方向的温度分布。知道汤和汤匙的初始温度以及汤匙的金属材质就可以利用偏微分方程来确定汤匙放入汤中后任意时刻、任意点的温度。这类方程在等离子体物理学中也有应用因为许多描述等离子体的方程在数学上与描述流体的方程相似。科学家和工程师们已经开发出多种求解偏微分方程的数学方法。其中一种方法被称为数值方法因为它是以数值方式而非解析或符号方式求解问题以找到那些难以或无法精确求解问题的近似解。最近研究人员开始探索是否可以利用机器学习来求解这些偏微分方程目标是比使用其他方法更快地解决问题。系统综述发现在大多数期刊文章中机器学习并未像宣传的那样成功。“我们的研究表明在某些情况下机器学习在求解流体相关偏微分方程时可能稍快但在大多数情况下数值方法更快”论文的第一作者表示。数值方法在精度和运行时间之间存在一个基本的权衡。“如果你花更多时间解决问题你就能得到更精确的答案”第一作者说“许多论文在比较时并未考虑到这一点。”此外不同的数值方法之间速度也可能存在巨大差异。第一作者认为机器学习方法要想发挥作用其性能需要优于最优秀的数值方法。然而他的研究发现比较的对象往往是那些比最快方法慢得多的数值方法。公平比较的两条准则因此该论文提出了两条准则来尝试克服这些问题。第一条准则是只将机器学习方法与具有相同精度或相同运行时间的数值方法进行比较。第二条准则是将机器学习方法与一种高效的数值方法进行比较。在被研究的82篇期刊文章中有76篇声称其机器学习方法在与数值方法比较时表现更优。研究人员发现这些声称机器学习方法更优的文章中有79%实际上使用了薄弱的基线违反了至少一条准则。有四篇文章声称其性能逊于数值方法两篇文章声称性能相当或各有优劣。“很少有文章报告机器学习表现更差这并不是因为机器学习几乎总是做得更好而是因为研究人员几乎从不发表机器学习表现更差的文章”第一作者说。第一作者认为低标准的比较往往源于学术界出版中不正当的激励。“为了让论文被接收发表一些令人印象深刻的结果是有帮助的。这激励你让你的机器学习模型尽可能工作得好这是好事。然而如果你用来比较的基线方法本身效果不好你同样也能获得令人印象深刻的结果。结果就是你没有动力去改进你的基线这是坏事”他说。最终结果是研究人员最终在他们的模型上努力工作却没有去寻找可能的最佳数值方法作为比较的基线。研究人员还发现了报告偏差的证据包括发表偏差和结果报告偏差。当研究人员意识到他们的机器学习模型表现并不比数值方法更好时选择不发表结果就会产生发表偏差而结果报告偏差则可能涉及在分析中丢弃负面结果或使用非标准的成功衡量标准来使机器学习模型显得更成功。总体而言报告偏差倾向于压制负面结果从而造成一种整体印象即机器学习在求解流体相关偏微分方程方面比实际情况更好。“这个领域存在大量炒作。希望我们的工作能为使用机器学习来改进现有技术水平的原则性方法奠定基础”该研究的首席研究员说。为了克服这些系统性的文化问题该研究员认为资助研究的机构和大型会议应该采取相关政策以防止使用薄弱的基线或者要求更详细地描述所使用的基线及其被选中的原因。“他们需要鼓励自己的研究人员对自己研究的结果保持怀疑”研究员说“如果我发现了那些好得令人难以置信的结果那么它们很可能就是不可信的。”FINISHED更多精彩内容请关注我的个人公众号公众号办公AI智能小助手或者我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关新闻

HLAE终极指南：专业级游戏影视制作全流程解析

华中科大大突破：让AI拥有“空间感“，从此告别“方向感缺失症“

WireShark4.0在Win10上的高效安装与基础配置指南

告别CAN总线8字节限制：手把手教你用ISO 15765-2协议搞定UDS长报文传输

今日头条iOS签名算法逆向解析与Python复现

零基础玩转NASA飞行模拟：XPlaneConnect完整入门指南 ✈️

Git入门指南：5个核心命令掌握代码版本控制

Transformer多实体嵌入与分布感知聚类：从序列中高效提取与组织实体信息

pytest-mock 实战指南：提升 Python 单元测试效率与可靠性

Unity ML-Agents 环境配置避坑指南：Python+CUDA+Unity 版本精准匹配

毕业设计 yolov11骨折检测医疗辅助系统（源码+论文）

别再死记硬背了！用5个生活化比喻彻底搞懂Linux进程的fork、exec和wait

为什么你的AI Agent总在跨境清关环节“失语”？揭秘NLP+规则引擎混合推理的5个关键断点

【AI Agent行业落地黄金法则】：20年架构师亲授7大避坑指南与3个已验证千万级ROI场景

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪 技术地位与核心优势

从stress到stress-ng：一文搞懂Linux压力测试工具怎么选？实战对比CPU/内存/磁盘压测效果

从TTL到eDP：嵌入式工程师选屏接口的实战避坑指南（附信号实测对比）

实测 Taotoken 多模型路由的响应延迟与稳定性体感

镜像视界浙江科技有限公司｜数字孪生・视频孪生・无感定位・跨镜追踪技术地位与核心优势