视频 #4:阶段 A 演示与讲解
我的理解
这是 Phase A 的总览视频,用四章结构概括了从零构建一个最小化 Agentic AI 系统的完整路径。核心思路是”在实践中试错”而非堆砌理论:先用 FastAPI 打地基(OpenAPI schema 让 AI 能读懂接口),再通过 Builder Space 统一网关接入多模型,然后从 Chatbot 进化为 Agent(赋予工具使用和多步决策能力),最后用前端 GUI 闭合产品闭环。整章的精髓在于把 AI 产品开发的每个环节都做成可验证的反馈循环。
相关链接
- Ch02-L02 打好基础 FastAPI应用 — 第一章技术选型的详细展开
- Ch02-L04 集成核心智能引擎 — 第二章 Builder Space 接入的详细展开
- Ch02-L05 用Agentic工具扩展能力 — 第三章 Agentic Architecture 的详细展开
- Ch02-L07 用全栈体验闭合产品闭环 — 第四章产品化的详细展开
原文
Lesson 10 of 46 视频 #4:阶段 A 演示与讲解 / Video #4: Phase A Demos and Walkthrough
中文版(可以点 CC 加载字幕) YouTube 自动配音版本(在视频设置中选择音轨”English”):https://youtu.be/4m7fWk_37E8
课程基本内容:构建最小化 Agentic AI 系统 前言:工程视角下的 AI 学习
这一章演示了如何在一个受控的环境中,通过构建一个麻雀虽小、五脏俱全的 Agentic 系统(具备自主搜索、决策能力的 AI 代理),来理解 AI 产品开发的完整闭环。我们推崇在实践中试错的学习哲学,而不是单纯的堆砌理论。
第一章:技术选型与基础设施 (Infrastructure)
为什么在 AI 开发中,我们选择了 FastAPI?
FastAPI 的核心价值:超越传统的 Web 框架,FastAPI 原生生成的 OpenAPI.json 规范不仅供开发者阅读,更是 AI 理解系统能力的关键接口。
交互式文档 (Swagger UI):利用 /docs 界面进行可视化的 API 调试与验证,建立”开发-验证”的快速反馈循环。
AI 友好的开发流:演示如何利用机器可读的接口定义(Schema),让 Cursor 等 AI 辅助工具自动生成正确的调用代码,实现用 AI 开发 AI。
第二章:AI 服务的接入与安全规范 (Integration & Security)
如何优雅地管理 AI 模型资源,避免工程实践中的常见陷阱。
AI Builder Space:介绍课程提供的统一 API 网关,解决多模型(GPT, Gemini, Claude)鉴权繁琐的问题,实现一站式调用。
配置管理与安全:详解 .env 环境变量文件的使用机制。强调避免 API Key 硬编码(Hard-code)到代码中的工程底线,确保代码库的安全与可移植性。
基础对话接口:构建第一个能够透传用户请求至 LLM 的 /chat 接口,完成最基础的问答链路。
第三章:从 Chatbot 到 Agent 的进化 (Agentic Architecture)
本章是 Phase A 的核心。我们将跨越单纯的文本生成,赋予 AI 使用工具和自主决策的能力。
痛点分析:通过实例(如查询实时天气或突发新闻)展示传统 LLM 因缺乏实时信息而产生的局限性(幻觉或知识截止)。
Agent 的本质定义:
工具使用 (Tool Use):AI 识别需求并主动请求调用外部能力(如搜索引擎)。
多步决策 (Multi-step Reasoning):AI 根据工具返回的结果,决定是输出最终答案,还是进行下一轮探索。
Agentic Loop 的代码实现:
工具定义:如何将搜索服务包装成 AI 可理解的 Function Schema。
循环构建:编写逻辑处理 User -> LLM -> Tool Call -> Code Execution -> LLM 的完整闭环。
并行调用与容错:处理 AI 同时请求多个工具的场景,以及如何通过详细的日志系统(Logging)监控 AI 的思考过程。
第四章:产品化与用户体验
从后端 API 走向面向用户的完整产品。
前后端分离的雏形:脱离 Swagger UI,构建一个类 ChatGPT 的独立网页前端。
实时交互实现:前端如何通过 API 与后端 Agent 通信,处理加载状态(Loading State)与 Markdown 渲染。
完整系统验收:在一个真实的 GUI 界面中,验证 AI 从理解意图、调用搜索、分析数据到生成图文并茂回答的全过程。