AI Agent 概念
type
status
date
slug
summary
tags
category
icon
password
URL

🎯 AI Agent 是什么?(快速理解)
AI Agent ≠ 传统聊天机器人,它是一个有「记忆 + 目标 + 推理能力」的智能体。
通俗理解:
- 🧠 像一个能读文档、能上网、能执行操作的小助手。
- 🗂 由 LLM + 工具 + 记忆 + 状态管理 + 多轮交互能力 组成。
🧠 核心组成模块:
模块 | 作用 | 举例 |
LLM(大语言模型) | Agent 的“脑子” | GPT-4、Claude、通义千问 |
工具(Tools) | 让 Agent 能动手 | 计算器、搜索引擎、爬虫、数据库 |
记忆(Memory) | 记住上下文和知识 | 聊天记录、向量数据库 |
状态管理(State) | 追踪任务进度、控制流程 | 当前执行到哪一步?失败是否重试? |
多模态输入(可选) | 视觉、语音能力 | 上传图片,语音指令等(可后期探索) |
首选语言:Python
原因 | 说明 |
✅ 生态成熟 | 几乎所有主流 AI 框架(Langchain、Transformers、FastAPI、LlamaIndex)都是基于 Python |
✅ 模型原生支持 | OpenAI、Hugging Face、百度/阿里/讯飞模型接口,都优先支持 Python SDK |
✅ 社区强大 | 开源项目最多,几乎你想做的东西都能找到现成 Demo |
✅ 开发效率高 | 写法简洁、调试方便,适合快速迭代原型 |
✅ 脚本语言 | 更容易实现像「调用工具」「执行 shell 命令」「任务调度」这样的功能,非常适合 Agent 的多步执行场景 |
次选语言:TypeScript + React 技术栈,主要是开发面向用户的前端界面。
web 端还是 JS 的天下,选择 React 技术栈是可以兼顾 web 端和 Native 端。配合 RN 的 Expo 框架可以快速上线 web、iOS 和 android。
Loading...