PilotDeck是什么
PilotDeck是一个以WorkSpace(工作舱)为核心架构的AI智能体操作系统,由清华大学THUNLP实验室、面壁智能、OpenBMB与AI9Stars联合开源,面向多任务并行与长周期生产力场景设计,用于将AI对话工具升级为可持续执行任务的系统级生产力平台。
- 工具名称:PilotDeck(AI Agent Operating System / 智能体操作系统)
- 开发公司:清华大学THUNLP实验室、面壁智能、OpenBMB、AI9Stars联合研发开源
- 发布时间:2026年5月28日正式开源(据官方README更新日志)
- 主要功能:多智能体管理、WorkSpace任务隔离、记忆管理、智能路由、Always-on自动执行
- 技术特点:WorkSpace三层架构(文件+记忆+技能)、白盒记忆系统、动态模型路由、端云协同执行
- 使用方式:支持Web界面、本地部署、CLI命令行与Docker方式运行
- 价格说明:完全开源(AGPL v3.0),可免费使用与二次开发
- 适用人群:AI开发者、内容生产者、自动化工作流用户、企业级Agent系统构建者

PilotDeck的核心优势
- WorkSpace任务隔离优势:PilotDeck通过WorkSpace实现项目级物理隔离机制,每个任务拥有独立文件系统、记忆与技能空间,避免多任务上下文污染。据官方架构说明,该设计可显著降低跨项目干扰问题,使多任务并行效率提升约50%以上,并支持长期任务稳定运行。
- 白盒记忆可控优势:与传统黑盒AI不同,PilotDeck将记忆生成、存储与使用全链路可视化,用户可查看每条记忆来源并进行修改或删除。据OpenBMB技术说明,该机制可减少错误记忆累积问题,并支持一键回滚Dream整理结果,提升系统可控性。
- 智能路由成本优化优势:PilotDeck通过任务复杂度识别自动分配模型资源,简单任务使用轻量端侧模型,复杂任务调用云端大模型。据官方实测数据,在社交媒体生成场景中可节省约70% Token成本,在复杂任务组合中可实现约1/6成本完成同等质量输出。
- Always-on持续执行优势:系统支持Agent后台常驻运行,可主动发现任务并执行,无需用户持续交互。据官方描述,该机制突破传统对话式AI限制,使任务能够在用户离线状态下持续推进,实现真正的长周期自动化生产力。
- 端云协同执行优势:PilotDeck支持端侧模型与云端模型混合调用,可在本地执行隐私敏感任务,在云端处理复杂推理任务。据THUNLP联合研究说明,该架构可在保证隐私的同时提升任务执行效率,适用于跨设备AI协作场景。
PilotDeck的主要功能
- WorkSpace工作舱系统:基于项目级隔离架构,将文件系统、记忆系统与技能系统统一封装,每个项目形成独立AI执行环境。
- 白盒记忆管理系统:采用全链路可追溯记忆机制,支持查看AI记忆来源、修改错误记忆并进行版本回滚。
- 智能模型路由系统:通过任务复杂度分析自动选择模型执行路径,轻量任务调用低成本模型,高复杂任务调用高性能模型,并支持多模型fallback机制。
- Always-on常驻执行系统:允许AI在后台持续运行任务,包括任务发现、执行与结果输出,无需用户持续交互。适用于内容生产、数据监控与长期研究类任务,实现真正意义上的自动化Agent执行流程。
- 端云协同执行架构:支持在端侧部署轻量模型执行本地任务,同时调用云端模型处理复杂逻辑,并可自动加载语音、视频等多模态模型,实现跨模型协作与统一调度。
如何使用PilotDeck
- 环境安装初始化:用户可在macOS或Linux终端执行官方安装脚本完成部署,系统自动配置Node.js环境并初始化依赖。该过程通常耗时3-10分钟,适用于无复杂开发经验用户。
- 启动系统服务:安装完成后通过pilotdeck命令启动服务,系统默认在本地
3001端口运行Web控制台,用户可通过浏览器访问操作界面,进入AI工作空间管理系统。 - 创建WorkSpace项目:在控制台中新建工作舱,为每个任务分配独立空间,包括文件存储区、记忆模块与技能系统,从而实现项目级隔离管理,避免多任务混乱。
- 配置模型与路由策略:用户可在设置中配置大模型API(如OpenAI、DeepSeek等),并启用智能路由系统,使系统根据任务复杂度自动选择最优模型组合。
- 输入任务并执行:在WorkSpace中输入自然语言任务,例如内容生成或数据分析,系统自动拆解任务并执行,同时支持后台持续运行与任务追踪。
- 查看与优化结果:用户可实时查看执行结果、记忆变化与任务进度,并对输出内容进行调整或回滚,优化后系统会自动沉淀执行策略到当前WorkSpace。
PilotDeck的项目地址
- 项目官网:https://pilotdeck.openbmb.cn/pilotdeck.github.io/
- GitHub仓库:https://github.com/OpenBMB/PilotDeck
PilotDeck的应用场景
- AI内容生产与写作:适用于白皮书、行业报告与长文创作场景,用户输入主题后系统自动生成结构化内容,并持续优化文本逻辑,实现长周期内容生产自动化。
- 游戏与交互系统开发:可通过自然语言生成3D交互场景或小游戏原型,例如塞尔达风格开放世界游戏,实现从想法到可运行原型的快速转化。
- 多语言内容分发:结合语音模型(如VoxCPM)生成多语言播客内容,可支持30种语言输出,用于全球化内容传播与自动化音频制作。
- AI工程自动化:适用于模型训练、数据处理与工程脚本生成等任务,通过Agent自动执行流程,提高研发效率并减少人工操作成本。
- 长期监控与任务管理:用于数据监控、市场追踪与自动报告生成,系统可在后台持续运行并定期输出结果,适合企业级自动化场景。
PilotDeck的价格与付费方案
PilotDeck目前为完全开源项目,采用GNU AGPL v3.0协议,用户可以免费使用、修改与部署系统。实际使用成本主要来自第三方大模型API调用费用,系统通过智能路由机制优化Token消耗,从而降低整体使用成本。
使用PilotDeck时需要注意的问题
PilotDeck虽然具备强大的任务执行能力,但其属于系统级AI基础设施,部署与使用仍需要一定技术理解能力。用户需正确配置模型API,否则可能影响任务执行效果。同时,由于支持后台常驻任务(Always-on),应注意控制任务数量以避免资源占用过高。此外,白盒记忆系统虽然提高可控性,但也要求用户理解记忆结构逻辑,避免误删关键任务信息。对于敏感数据处理,应结合本地部署与权限控制策略确保数据安全。
和其他 AI 工具相比,PilotDeck有哪些差异?
| 维度 | PilotDeck | Claude Code | Cursor | OpenClaw |
|---|---|---|---|---|
| 系统定位 | AI Agent操作系统(WorkSpace架构) | 编程Agent工具 | AI编程IDE | Agent通信与执行框架 |
| 任务管理 | 项目级WorkSpace隔离,多任务并行 | 单任务代码执行 | 开发任务为主 | 消息驱动执行 |
| 记忆机制 | 白盒记忆,可追溯可修改 | 上下文记忆 | 局部上下文 | 黑盒向量记忆 |
| 成本控制 | 智能路由自动降本70% | 固定模型调用 | 依赖用户选择 | 手动配置模型 |
| 自动化能力 | Always-on主动执行任务 | 需手动触发 | 交互式执行 | 定时/消息触发 |
| 扩展能力 | 支持MCP + 插件系统 | 有限扩展 | 插件生态 | 中等扩展性 |
从对比可以看出,PilotDeck的核心差异在于系统级定位,它不再是单一工具,而是面向多智能体管理的操作系统。相比传统编程AI工具,它更强调任务持续性、成本优化与项目隔离能力,因此更适合复杂生产力场景。
关于PilotDeck的常见问题
PilotDeck是什么类型的工具?
PilotDeck是AI智能体操作系统,通过WorkSpace实现任务隔离与长期运行能力,不是单一聊天或生成工具,而是面向生产力的系统级平台。
PilotDeck怎么使用?
用户通过安装脚本部署系统后,在浏览器创建WorkSpace并输入任务即可运行,系统自动调用模型执行并持续推进任务进度。
PilotDeck免费吗?
PilotDeck完全开源免费,但使用过程中需要调用大模型API,实际成本取决于用户选择的模型服务与调用频率。
PilotDeck适合新手吗?
基础使用较为简单,但完整发挥系统能力需要理解WorkSpace与模型配置逻辑,因此更适合有一定技术基础的用户。
PilotDeck和Cursor有什么区别?
Cursor侧重AI编程辅助,而PilotDeck是系统级Agent OS,支持多任务管理、长期执行与成本优化,更偏生产力平台而非开发工具。
PilotDeck能做什么任务?
可用于内容生成、游戏开发原型、多语言播客、模型训练流程与长周期自动化任务执行,覆盖范围远超传统AI工具。
PilotDeck的核心优势是什么?
核心优势在于WorkSpace隔离、白盒记忆、智能路由与Always-on机制,使AI从被动响应转变为主动执行系统。
浙公网安备33010202004812号