面试官:说说 ReAct 是怎么回事?

面试官:说说 ReAct 是怎么回事? 面试现场说说 ReAct 是怎么回事就是让模型边推理边行动交替进行。具体怎么交替法Think 一下然后 Action然后看结果再 Think。行回去等通知吧——到底怎么理解ReAct Reasoning推理 Acting行动谷歌 2022 年提出来的。核心思想就一句让模型交替进行推理和行动形成思考 → 行动 → 观察的循环直到任务完成。不是一次性规划好所有步骤再执行而是走一步看一步根据上一步的结果决定下一步。三个关键标签ReAct 用三个标签来组织整个过程Thought思考模型自己想现在该做什么。这是推理部分。Action行动具体要执行的动作——调用什么工具、传什么参数。这是行动部分。Observation观察工具执行后返回的结果喂给模型用来做下一轮思考。举个例子就懂了用户问“今天北京天气怎么样”步骤内容Thought需要查询实时天气调用天气 APIActioncall_weather_api(city北京, datetoday)Observation{weather: 晴, temperature: 28°C}Thought已经拿到天气数据可以回答了Answer今天北京天气晴气温 28°C看到没整个过程是动态的——模型根据 Observation 的结果决定下一个 Thought而不是提前规划好所有步骤。ReAct 的优缺点优势实现简单Prompt 里给几个示例就能跑不需要额外训练适合动态环境。缺点缺乏全局规划能力容易陷入局部最优不适合需要复杂长期规划的任务。真实场景到底用在哪网页浏览 AgentThought需要搜索这个信息 → Action调用搜索引擎 → Observation拿到搜索结果 → 继续 Thought游戏 NPCThought玩家说了什么 → Action生成回应或执行游戏动作 → Observation玩家反应 → 调整策略数据分析助手Thought需要先查哪个表 → Action执行 SQL → Observation拿到数据 → 决定下一步分析面试官爱问ReAct 和 Chain-of-Thought 有什么区别 答CoT 只推理不行动输出的是思维链但没有外部工具调用。ReAct 把推理和行动结合起来能通过工具获取外部信息。简单说CoT 是想一想ReAct 是想一想 做一做。实在记不住就背这句ReAct 推理 行动交替执行用 Thought / Action / Observation 三个标签组织循环边想边做动态完成任务。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】