自主智能体遇阻：数据库成最大挑战

随着大语言模型从单纯的聊天机器人逐步进化为具备推理、规划与行动能力的自主智能体，它们已经能够自主编排复杂的应用栈。然而，这些智能体如今面临着一个最严峻的障碍：数据库。 “数据库是智能体当下面临的最难攻克也最为关键的挑战，它对准确性与性能有着严苛的要求。”卡内基梅隆大学计算机科学副教授 Andy Pavlo 在加州山景城计算机历史博物馆举办的 Percona Live 2026 大会上向与会者说道。在一场关于 AI 与开源基础设施交叉领域的讨论中，Pavlo 提出，虽然编码智能体能够轻松套用标准的数据结构，但数据库仍然是各类系统里最难实现自动化开发与优化的部分。 “举例来说，如果智能体在生成 UI 组件时出现幻觉，页面只是看起来略有偏差，但如果它在生产数据库中编造出错误查询或配置变更，整个系统都可能彻底瘫痪。”Pavlo 说道。这才是真正值得警惕的。多智能体的拉锯战 Pavlo 指出 AI 影响数据库的两种主要方式：调优智能体和编码智能体。调优智能体主要破解数据库优化里的“玄学难题”——自动调整系统参数、物理设计（如索引）和查询执行策略。以往，数据库管理员需要耗费数年积累经验与直觉才能判断出最优配置来提升系统性能。 Pavlo 表示，目前的难题在于这类专用智能体往往是独立运行的。参数调优智能体无法感知索引调优智能体的工作状态，容易让系统陷入局部最优：性能虽优于默认配置，但远未达到理想水平。卡内基梅隆大学针对多轮及顺序调优进行了相关研究，通过创建协调框架来解决这一问题，但即便如此，也面临着“维度灾难”的问题。卡内基梅隆大学数据库研究团队率先提出了自驱动与机器学习驱动的数据库优化理念。顺序调优与多轮调优是其自主数据库管理系统（DBMS）项目的核心模块。 AI 数据库中的多轮和顺序调优指的是结合前沿机器学习与数据工程的技术方法，其中 AI 模型可针对多步推理、工具使用或复杂对话历史完成优化。这些框架确保 AI 模型不再局限于单次独立响应，能够在复杂交互中持续保留上下文、维持逻辑连贯。由于数据库的配置组合多达数万亿种，完美的数据库搜索空间规模实际上是指数级的。编码智能体的优势与优化器壁垒在开发方面，编码智能体已经被证明是超高产的协作者。Pavlo 发现，卡内基梅隆大学的学生开始使用大语言模型后，数据库项目的代码提交量大幅增长。他表示：“编码智能体非常擅长构建数据库的各个部分——B+树、哈希表、缓冲管理器——因为它们能够复现教科书和开源代码库中的标准实现。” 不过，Pavlo 所说的顶级难题仍然是查询优化器。与基础数据结构不同，查询优化器几乎没有规整、模块化的开源参考实现，往往与所属系统深度耦合。此外，如何验证 AI 生成的转换规则具备语义正确性——也就是在查询结果与原语句完全一致的前提下实现性能提速——目前仍是一道未解难题。风险主要包括模型幻觉与安全隐患向智能体化的管理数据库转型并非毫无重大风险。Percona 联合创始人 Peter Zaitsev 与 Pavlo 等业内人士均发出警告：将编排工作工作交给智能体负责会带来严重的稳定性与安全隐患。Zaitsev 表示，已有真实案例证实，智能体在对接数据库后要么会误删整个系统数据，要么因未能理清访问控制的细节造成敏感信息泄露。除此之外，大语言模型还存在所谓的“ AI 垃圾代码”问题：模型生成的代码往往只为特定查询量身定制，不具备通用适配能力。例如，如果开发者借助智能体优化“提取年份”的查询语句，智能体可能会构建一个内部数据结构，在执行“提取月份”操作时可能会直接报错崩溃。自动化是为了协作，而非替代尽管存在上述种种难题，Pavlo 仍看好“智能体运维”模式。这种模式的思路是：由智能体处理突发故障，比如凌晨三点出现的系统性能异常、稳定性问题，人类则聚焦于更高层级的架构设计。Pavlo 提到，借助智能体增强技术，并从过往完成调优的数据库中提取训练数据，系统优化耗时可从 12 小时缩短至 15 分钟以内。步入全新的 AI 时代，我们追求的不再只是能编写代码的 AI，而是能够自主推理自身性能与正确性的智能系统。 Pavlo 总结道，数据库是各类智能体的知识根基。他表示：“如果我们想要打造真正的自主系统，就必须先攻克自主数据库这一要求严苛的技术难关。” 【声明：本文由InfoQ翻译，未经许可禁止转载。】原文链接： https://thenewstack.io/ai-agents-database-challenge/ "

订阅66必读