当数据库开始承载 Agent 运行过程:Harness、数据闭环与可扩展性
ASF Member,OceanBase 技术专家
Apache 软件基金会 Member,开源工程师,长期关注数据基础设施、开源生态与生成式 AI 的结合。目前在 OceanBase 关注数据库与智能应用基础设施方向,探索数据库原生 Agent Harness、Agent Runtime 数据管理与智能体工程实践。他也是 Agent Client Protocol(ACP)的早期贡献者,参与推进 Agent 与客户端、工具及运行环境之间的开放协作协议建设。过去的技术实践覆盖云原生数据仓库、GraphRAG 与大模型应用等方向。曾多次在 ApacheCon Asia、PyCon China、Rust China Conf 等技术会议分享开源基础设施、数据系统与 GenAI / Agent 工程相关主题。
议题背景:
如果把模型比作一匹马,那么 Harness 就是人驾驭它抵达目的地所需要的一整套东西:缰绳、马鞍、路线、反馈、记录和训练方法。
在 Agent 场景里,模型本身并不等于一个可持续运行的系统。真正让 Agent 能在团队和产品中稳定工作的,是围绕模型构建的上下文管理、工具调用、状态记录、运行轨迹、调试回放、评测反馈和数据闭环。
这次分享会围绕 Agent Harness 的数据闭环与可扩展性展开:当 Agent 从一次性的任务调用走向长期运行的基础设施,如何设计这套“驾驭模型”的系统,如何扩展工具、渠道、模型和运行环境,以及如何把每一次运行过程自然沉淀为可查询、可回放、可评测、可训练的数据资产。
本次演讲会结合现有 Agent 系统中运行时数据碎片化的问题,以及 OceanBase 开源团队在 AgentSeek 中对数据库原生 Agent Harness 的探索,讨论:当数据库不再只是保存业务结果,而是直接承载 Agent 的运行过程时,下一代智能应用基础设施可能会长什么样。
内容大纲:
1. 从模型到 Harness:为什么需要被“驾驭”
1.1 模型不是系统,Harness 才是运行时:上下文、工具、状态、权限、记忆、反馈共同构成 Agent 的可持续运行基础。
1.2 Harness 的核心职责:把提示词、工具调用、任务流程、运行轨迹和调试能力组织成稳定的工程系统。
1.3 生产级 Agent 的真正难点:不是单次回答有多聪明,而是长期运行中能否可控、可观测、可复盘、可演进。
2. 从 Bub 看 Agent Harness 的运行形态:可扩展性和数据沉淀
2.1 Hook-first 的可插拔运行管线:模型、工具、渠道、提示词和技能都可以被替换、组合和扩展。
2.2 把运行过程变成可追溯上下文:消息、工具调用、事件、反馈如何沉淀,支持回放、分支与协作。
2.3 Harness 的扩展边界:从单 Agent 扩展到多模型、多工具、多渠道、多团队协作和持续迭代。
3. 从 AgentSeek 看数据库原生 Harness:数据闭环如何形成
3.1 运行过程不应散落在日志、Trace 和临时文件里:Agent 的上下文、任务、记忆、工具调用、反馈和评测需要统一的数据底座。
3.2 数据库开始承载 Agent 运行本身:AgentSeek 探索把 Harness 直接构建在数据库之上,让运行轨迹天然可查询、可回放、可分析。
3.3 从运行记录到智能应用的数据闭环:每一次执行都沉淀为调试、评测、优化和训练的数据资产,推动 Agent 系统持续进化。
听众受益:
1. 第一,理解 Agent Harness 为什么是生产级 Agent 的核心,而不是外围工程;
2. 第二,理解如何把上下文、运行轨迹、工具调用和反馈统一成可扩展架构;
3. 第三,理解数据库原生 Harness 如何把每一次 Agent 运行自然沉淀为可查询、可回放、可评测、可训练的数据资产。