🧩 AgentMeshOS 核心模块设计¶
版本:v0.1.0
阶段:模块化设计阶段
1️⃣ 模块总览¶
AgentMeshOS 核心模块:
1. Network Module
2. Compute Module
3. Scheduler Module
4. Storage Module
5. AI Core Module
6. Event Bus Module
7. Security Module
8. Observability Module
2️⃣ Network Module(网络模块)¶
基于 Tailscale Client + Headscale 自托管控制面
职责:¶
- 节点互联
- 私有网络构建
- NAT 穿透
- 自托管网络控制面管理
边界:¶
- 不负责任务调度
- 不处理计算逻辑
3️⃣ Compute Module(计算模块)¶
组成:¶
- Docker Runtime
- Container Executor
职责:¶
- 执行任务
- 运行容器
- 提供计算资源
边界:¶
- 不负责调度
- 不负责决策
4️⃣ Scheduler Module(调度模块)¶
基于 Nomad
职责:¶
- 任务分配
- 节点选择
- 负载均衡
- 任务生命周期管理
边界:¶
- 不执行任务
- 不保存数据
5️⃣ Storage Module(存储模块)¶
实现:¶
- S3 Compatible API
- MinIO / Ceph / SeaweedFS
职责:¶
- 对象存储
- 任务数据持久化
- AI 记忆存储(未来)
- 控制面元数据统一读写出口
边界:¶
- 不执行计算
- 不参与调度
6️⃣ AI Core Module(智能模块)¶
职责:¶
- 任务规划(Planner)
- 任务拆解
- Agent 编排
- 决策生成
关键原则:¶
- AI 不直接控制节点
- AI 只输出“计划”,不执行
- AI 只能调用 Gateway / Scheduler 暴露的受控接口,不能直连 Worker / Docker / Nomad 内部端口
7️⃣ Event Bus Module(事件总线)¶
作用:¶
- 模块之间解耦通信
- 事件驱动系统核心
事件示例:¶
契约约束:¶
- 事件必须包含 event_id、trace_id、timestamp、producer、payload_version
- 默认至少一次投递(at-least-once),消费者必须幂等
- 失败事件必须支持重试和死信队列
- Event Bus 只承载模块间异步协作,不替代同步控制 API
8️⃣ Security Module(安全模块)¶
职责:¶
- 节点认证
- Token 管理
- 权限控制
- API 安全
- TLS / mTLS、ACL、密钥轮换
原则:¶
- 所有请求必须可验证
- 控制面默认零信任:Tailnet 内部流量也不能视为天然可信
9️⃣ Observability Module(可观测性)¶
职责:¶
- 日志系统
- 指标监控
- 节点状态监控
- 任务追踪
🔟 模块关系图¶
AI Core
│
▼
Scheduler
│
┌───────┼───────┐
▼ ▼ ▼
Compute Storage EventBus
│
Network (基础连接层)
Security + Observability(横向能力)
补充:Metadata Store 归属 Storage / Control Plane,不允许 Compute、Agent、Worker 直接访问。
📌 模块边界核心原则¶
- AI 不执行任务
- Scheduler 不运行代码
- Compute 不做决策
- Storage 不参与计算
- Network 不处理业务逻辑
- 只有 Gateway / Scheduler 可以接受 AI 的任务提交或调度意图
🚀 下一步¶
下一份文档:
05_技术选型说明.md
- 为什么选 Nomad
- 为什么选 Tailscale Client + Headscale
- 为什么选 Docker
- 为什么选 S3
- 替代方案对比