AI Agent 概念

type
status
date
slug
summary
tags
category
icon
password
URL
notion image
🎯 AI Agent 是什么?(快速理解)
AI Agent ≠ 传统聊天机器人,它是一个有「记忆 + 目标 + 推理能力」的智能体。
通俗理解:
  • 🧠 像一个能读文档、能上网、能执行操作的小助手。
  • 🗂 由 LLM + 工具 + 记忆 + 状态管理 + 多轮交互能力 组成。
🧠 核心组成模块:
模块
作用
举例
LLM(大语言模型)
Agent 的“脑子”
GPT-4、Claude、通义千问
工具(Tools)
让 Agent 能动手
计算器、搜索引擎、爬虫、数据库
记忆(Memory)
记住上下文和知识
聊天记录、向量数据库
状态管理(State)
追踪任务进度、控制流程
当前执行到哪一步?失败是否重试?
多模态输入(可选)
视觉、语音能力
上传图片,语音指令等(可后期探索)

首选语言:Python
原因
说明
✅ 生态成熟
几乎所有主流 AI 框架(Langchain、Transformers、FastAPI、LlamaIndex)都是基于 Python
✅ 模型原生支持
OpenAI、Hugging Face、百度/阿里/讯飞模型接口,都优先支持 Python SDK
✅ 社区强大
开源项目最多,几乎你想做的东西都能找到现成 Demo
✅ 开发效率高
写法简洁、调试方便,适合快速迭代原型
✅ 脚本语言
更容易实现像「调用工具」「执行 shell 命令」「任务调度」这样的功能,非常适合 Agent 的多步执行场景
次选语言:TypeScript + React 技术栈,主要是开发面向用户的前端界面。
web 端还是 JS 的天下,选择 React 技术栈是可以兼顾 web 端和 Native 端。配合 RN 的 Expo 框架可以快速上线 web、iOS 和 android。
 
 
 
 
 
 
 
Loading...