本文介绍了如何利用LangChain和Azure OpenAI构建AI数据库Agent实现自然语言与数据库的交互。课程由微软数据和AI专家Adrian Gonzalez Sanchez讲授内容涵盖环境准备、与CSV文件和SQL数据库交互、OpenAI函数调用等让用户无需编写SQL即可通过AI实现数据查询和分析。核心要点包括数据库Agent的构建方法、Chain Agent模式、RAG和函数调用的应用以及追踪记录的透明性为AI领域发展最快的方向之一提供了实用指导。从自然语言到数据库查询一文掌握AI数据库Agent构建方法不用写SQL让AI替你去查数据库——这门课来自吴恩达AI大模型系列讲师是微软的数据和AI专家Adrian Gonzalez Sanchez。整个课程教你用LangChain搭一个能和表格数据、CSV文件、SQL数据库打交道的AI Agent。数据库 Agent说白了就是让语言模型LLM替你向数据库发请求。不管底层是什么数据库、什么数据模型、什么查询语言LLM在中间当个翻译官不懂SQL的人也能和数据对话。Agent是AI领域发展最快的方向之一。核心思路很直白LLM不仅能听懂你的问题还能自己琢磨着干一系列活儿——调函数拿数据、跑SQL查结果、分析数据——直到把你的事儿办完。这门课用的就是LangChain Agent 框架加上Azure OpenAI服务手把手教你怎么搭一个自己的数据库 Agent。二、Lesson 1搭建你的第一个AI Agent环境准备先配好Azure OpenAI环境主要搞定API端点和API密钥。用LangChain的AzureChatOpenAI建立连接设好API版本建议用最新的预览版、部署名称和端点就行。fromimportyour-deploymenthttps://your-endpoint.openai.azure.comyour-api-key2024-02-15-preview发送第一条消息建一个HumanMessage调一下模型的invoke函数fromimport将这句话翻译成法语和西班牙语I like red cars and blue housesprint行了你的第一个 AI Agent 调用就完成了。给模型喂知识的两种方式RAG检索增强生成用编排工具把模型和数据源比如数据库连起来不用重新训练模型。省事又实用省去了模型训练的巨大开销。微调Fine-tuning拿特定数据集重新训练模型。能定制但烧资源。这门课用的是RAG。RAG有个好处——灵活。以后模型升级或者换新的现有架构基本不用动。三、Lesson 2与CSV数据进行交互从CSV到DataFrame Agent第二课开始从CSV文件里读表格数据通过Azure OpenAI做自然语言查询。这是搭数据库 Agent 的第一步虽然还没连上真正的数据库。流程是这样的用Pandas把CSV文件加载成DataFrame创建Pandas DataFrame Agent用自然语言提问Agent自动转成Python代码去执行实战分析COVID-19数据集课件用的是美国各州的COVID-19统计数据2020到2021年。基本查询——统计行数这个数据集有多少行# 输出共有20780行复杂查询——自定义前缀和后缀可以自己定义前缀prefix和后缀suffix来控制 Agent 的行为第一组Pandas显示所有列展示列名以便回答问题在提供最终答案之前先反思并尝试另一种方法验证f{prefix}\n问题2020年7月德克萨斯州有多少住院患者\n{suffix}Agent 会把完整的思考过程展示出来——筛数据、汇总数据、再验证一遍。追踪记录trace把每一步都记得清清楚楚Agent 正在思考需要筛选2020年7月的数据框然后汇总住院人数…正在查找日期必须是2020年7月…需要查找德克萨斯州的相关信息…如果某个州没有数据Agent 会自己分析上下文给出合理解释不会硬编一个错误答案出来。关键概念Chain AgentChain Agent是LangChain的核心玩法——模型收到输入动手操作看结果继续推理直到得出最终答案。这套思考→行动→观察的循环就是AI Agent的底层逻辑。四、Lesson 3连接SQL数据库从CSV到SQL第三课是第二课的自然延伸——把CSV换成真的SQL数据库。用SQLite轻量级数据库通过LangChain跑RAG模式最终实现自然语言直接变SQL代码。架构升级主要变化是多了一个SQL数据库工具包SQL Database Toolkitfromimportfrom importfromimport# 创建数据库连接sqlite:///db/test_database.db# 创建工具包# 创建SQL AgentTrue你是一个专门与SQL数据库交互的Agent...实战效果问它2020年10月纽约州有多少住院患者时Agent 的思考过程是这样的引擎已找到所有相关信息——正在选择FROM表、WHERE条件…所有需要执行的查询都已自动完成。结果很清楚2020年10月纽约没有新增住院病例全国大约还有53例新增住院。Agent 不光能返回结果还会把生成的SQL查询语句亮出来——对团队学习和审计来说这点特别有用。五、Lesson 4OpenAI函数调用为什么需要函数调用Agent 已经能干活了为什么还要函数调用几个理由•确定性行为给系统下具体指令精确控制执行流程•结构化输出把查询封装在函数里不用暴露SQL转换过程的细节•优先级控制建议优先处理哪些查询类型拿到你想要的格式函数调用的两步流程第一步定义并声明可用函数拿天气查询来举例先声明一个获取当前天气的函数typefunctionfunctionnameget_current_weatherdescription获取指定地点的当前天气parameterstypeobjectpropertieslocationtypestringdescription城市名如旧金山、纽约requiredlocation问它旧金山、纽约和拉斯维加斯的天气如何系统会自动识别出需要调三次函数。第二步执行函数并获取结果系统选好函数、备好参数之后就去查数据拿结果了旧金山当前气温为50度…整个过程分两步先告诉系统有啥资源可用然后系统根据问题自动挑合适的函数去执行。数据库场景实战把函数调用套到数据库场景里定义一个函数比如get_hospitalizations_by_state_and_date函数接收参数州名string、日期string系统把自然语言请求匹配到对应的函数执行SQL查询返回结构化结果defget_hospitalizationsstate:str,date:str按州和日期查询住院人数fSELECT sum(hospitalized) FROM covid_data WHERE state{state} AND date{date}return这么做的优势是可以同时提供多个函数让系统根据用户意图自己挑——比如查住院人数和查阳性病例是两个不同的函数系统会自己判断该调哪个。总结从第一课的基础API调用到第二课的CSV数据交互第三课的SQL数据库再到第四课的函数调用——这条路径把数据库 Agent 从简单到复杂的变化完整串起来了。核心要点• 数据库 Agent 让不懂技术的人也能用大白话查数据• LangChain 的 Chain Agent 模式思考→行动→观察是一切的基础• RAG方式连数据库比微调灵活得多、实用得多• 函数调用给SQL查询加了确定性和结构化控制• 追踪记录trace让 Agent 的思考过程完全透明随时可以审计假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】
吴恩达AI大模型教程:用LangChain构建数据库Agent
本文介绍了如何利用LangChain和Azure OpenAI构建AI数据库Agent实现自然语言与数据库的交互。课程由微软数据和AI专家Adrian Gonzalez Sanchez讲授内容涵盖环境准备、与CSV文件和SQL数据库交互、OpenAI函数调用等让用户无需编写SQL即可通过AI实现数据查询和分析。核心要点包括数据库Agent的构建方法、Chain Agent模式、RAG和函数调用的应用以及追踪记录的透明性为AI领域发展最快的方向之一提供了实用指导。从自然语言到数据库查询一文掌握AI数据库Agent构建方法不用写SQL让AI替你去查数据库——这门课来自吴恩达AI大模型系列讲师是微软的数据和AI专家Adrian Gonzalez Sanchez。整个课程教你用LangChain搭一个能和表格数据、CSV文件、SQL数据库打交道的AI Agent。数据库 Agent说白了就是让语言模型LLM替你向数据库发请求。不管底层是什么数据库、什么数据模型、什么查询语言LLM在中间当个翻译官不懂SQL的人也能和数据对话。Agent是AI领域发展最快的方向之一。核心思路很直白LLM不仅能听懂你的问题还能自己琢磨着干一系列活儿——调函数拿数据、跑SQL查结果、分析数据——直到把你的事儿办完。这门课用的就是LangChain Agent 框架加上Azure OpenAI服务手把手教你怎么搭一个自己的数据库 Agent。二、Lesson 1搭建你的第一个AI Agent环境准备先配好Azure OpenAI环境主要搞定API端点和API密钥。用LangChain的AzureChatOpenAI建立连接设好API版本建议用最新的预览版、部署名称和端点就行。fromimportyour-deploymenthttps://your-endpoint.openai.azure.comyour-api-key2024-02-15-preview发送第一条消息建一个HumanMessage调一下模型的invoke函数fromimport将这句话翻译成法语和西班牙语I like red cars and blue housesprint行了你的第一个 AI Agent 调用就完成了。给模型喂知识的两种方式RAG检索增强生成用编排工具把模型和数据源比如数据库连起来不用重新训练模型。省事又实用省去了模型训练的巨大开销。微调Fine-tuning拿特定数据集重新训练模型。能定制但烧资源。这门课用的是RAG。RAG有个好处——灵活。以后模型升级或者换新的现有架构基本不用动。三、Lesson 2与CSV数据进行交互从CSV到DataFrame Agent第二课开始从CSV文件里读表格数据通过Azure OpenAI做自然语言查询。这是搭数据库 Agent 的第一步虽然还没连上真正的数据库。流程是这样的用Pandas把CSV文件加载成DataFrame创建Pandas DataFrame Agent用自然语言提问Agent自动转成Python代码去执行实战分析COVID-19数据集课件用的是美国各州的COVID-19统计数据2020到2021年。基本查询——统计行数这个数据集有多少行# 输出共有20780行复杂查询——自定义前缀和后缀可以自己定义前缀prefix和后缀suffix来控制 Agent 的行为第一组Pandas显示所有列展示列名以便回答问题在提供最终答案之前先反思并尝试另一种方法验证f{prefix}\n问题2020年7月德克萨斯州有多少住院患者\n{suffix}Agent 会把完整的思考过程展示出来——筛数据、汇总数据、再验证一遍。追踪记录trace把每一步都记得清清楚楚Agent 正在思考需要筛选2020年7月的数据框然后汇总住院人数…正在查找日期必须是2020年7月…需要查找德克萨斯州的相关信息…如果某个州没有数据Agent 会自己分析上下文给出合理解释不会硬编一个错误答案出来。关键概念Chain AgentChain Agent是LangChain的核心玩法——模型收到输入动手操作看结果继续推理直到得出最终答案。这套思考→行动→观察的循环就是AI Agent的底层逻辑。四、Lesson 3连接SQL数据库从CSV到SQL第三课是第二课的自然延伸——把CSV换成真的SQL数据库。用SQLite轻量级数据库通过LangChain跑RAG模式最终实现自然语言直接变SQL代码。架构升级主要变化是多了一个SQL数据库工具包SQL Database Toolkitfromimportfrom importfromimport# 创建数据库连接sqlite:///db/test_database.db# 创建工具包# 创建SQL AgentTrue你是一个专门与SQL数据库交互的Agent...实战效果问它2020年10月纽约州有多少住院患者时Agent 的思考过程是这样的引擎已找到所有相关信息——正在选择FROM表、WHERE条件…所有需要执行的查询都已自动完成。结果很清楚2020年10月纽约没有新增住院病例全国大约还有53例新增住院。Agent 不光能返回结果还会把生成的SQL查询语句亮出来——对团队学习和审计来说这点特别有用。五、Lesson 4OpenAI函数调用为什么需要函数调用Agent 已经能干活了为什么还要函数调用几个理由•确定性行为给系统下具体指令精确控制执行流程•结构化输出把查询封装在函数里不用暴露SQL转换过程的细节•优先级控制建议优先处理哪些查询类型拿到你想要的格式函数调用的两步流程第一步定义并声明可用函数拿天气查询来举例先声明一个获取当前天气的函数typefunctionfunctionnameget_current_weatherdescription获取指定地点的当前天气parameterstypeobjectpropertieslocationtypestringdescription城市名如旧金山、纽约requiredlocation问它旧金山、纽约和拉斯维加斯的天气如何系统会自动识别出需要调三次函数。第二步执行函数并获取结果系统选好函数、备好参数之后就去查数据拿结果了旧金山当前气温为50度…整个过程分两步先告诉系统有啥资源可用然后系统根据问题自动挑合适的函数去执行。数据库场景实战把函数调用套到数据库场景里定义一个函数比如get_hospitalizations_by_state_and_date函数接收参数州名string、日期string系统把自然语言请求匹配到对应的函数执行SQL查询返回结构化结果defget_hospitalizationsstate:str,date:str按州和日期查询住院人数fSELECT sum(hospitalized) FROM covid_data WHERE state{state} AND date{date}return这么做的优势是可以同时提供多个函数让系统根据用户意图自己挑——比如查住院人数和查阳性病例是两个不同的函数系统会自己判断该调哪个。总结从第一课的基础API调用到第二课的CSV数据交互第三课的SQL数据库再到第四课的函数调用——这条路径把数据库 Agent 从简单到复杂的变化完整串起来了。核心要点• 数据库 Agent 让不懂技术的人也能用大白话查数据• LangChain 的 Chain Agent 模式思考→行动→观察是一切的基础• RAG方式连数据库比微调灵活得多、实用得多• 函数调用给SQL查询加了确定性和结构化控制• 追踪记录trace让 Agent 的思考过程完全透明随时可以审计假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】