构建可靠的代理人工智能系统

2026-06-21 1 阅读 sarangk90
构建可靠的代理人工智能系统 构建可立即投入生产的代理人工智能系统的案例研究 本文介绍了临床前信息中心 (PRINCE),这是拜耳公司与 Thoughtworks 共同开发的云托管平台,旨在解决制药行业在药物开发方面的挑战。 PRINCE 利用代理检索增强生成和文本到 SQL 来集成数十年的安全研究报告。我们描述了 PRINCE 从基于关键词的搜索到能够回答复杂问题和起草监管文件的智能研究助理的演变。我们通过上下文工程(信息如何在专业代理之间形成和路由)和利用工程(如何围绕模型构建编排、恢复和可观察性以保持控制和可靠性)的角度来反思关键工程决策。该系统通过透明度、可解释性和人机交互集成来​​优先考虑信任。 PRINCE 展示了人工智能在制药领域的变革潜力,显着提高数据可访问性和研究效率,同时确保治理和合规性。 2026 年 6 月 16 日 Sarang Sanjay Kulkarni Sarang Kulkarni 是 Thoughtworks 的首席顾问,从事软件工程、数据平台和应用人工智能的交叉领域工作。他专注于构建生产级 GenAI 系统,特别是检索增强生成 (RAG) 和多代理工作流程,并帮助团队将这些系统从早期想法转变为实际使用。 Sarang 还为 Thoughtworks 的全球人工智能服务开发团队做出了贡献,并教授 O’Reilly 的有关构建生产就绪的 RAG 应用程序的课程。目录 挑战:探索临床前数据迷宫 解决方案:PRINCE - 进化平台 系统架构:设计可靠的代理 RAG 系统 代理 RAG 系统阐明用户意图 思考和计划:过程反思 研究人员代理 反思代理:数据验证和充分性 编写者代理:答案合成和格式化 在生产 LLM 系统中建立信任 透明度和可解释性评估 弹性监控工程:错误处理和可解释性恢复增强数据质量:命名实体识别和注释旅程继续:迭代开发结论临床前药物发现本质上是复杂且数据密集的。研究人员面临着有效访问和分析这一关键阶段生成的大量信息的重大挑战。传统的基于关键词的搜索方法通常依赖于严格的布尔逻辑,在面对临床前研究问题的细微差别和复杂性时经常会出现不足。大型语言模型(LLM)的出现提供了一个变革的机会。通过将法学硕士的生成能力与信息检索系统的精度相结合,检索增强生成(RAG)已成为一种有前途的技术。这种方法有可能彻底改变临床前数据访问,使研究人员能够用自然语言提出复杂的问题,并获得基于专有数据的准确、上下文丰富的答案。拜耳很早就认识到了这一潜力,致力于探索这些技术如何解决临床前研究中长期存在的挑战。在这篇文章中,我们将分享这段历程——拜耳对生成式人工智能的早期投资如何催生了 PRINCE,这是一个基于 Agentic RAG 构建的代理人工智能系统。本案例研究探讨了将临床前数据检索从具有挑战性的迷宫转变为直观的对话体验的技术架构、工程决策和经验教训。 PRINCE 背后的许多工程决策现在可以通过上下文工程和线束工程的视角来理解,尽管在系统最初设计时我们并没有使用这些术语。情境工程决定了每个模型接收到的信息、未接收到的信息,以及情境如何在研究、反思和写作等专门步骤之间移动。利用工程围绕模型塑造了脚手架:编排、工具边界、状态持久性、重试、回退、验证、反射循环、可观察性和人工审查。虽然这篇文章重点讨论技术架构和工程挑战,但我们在《人工智能前沿》上发表的论文更详细地介绍了产品演变和业务影响。挑战:穿越临床前数据迷宫 与许多大型制药组织一样,拜耳的临床前研究领域的特点是数据多样化且广泛。这包括来自各种研究的高度结构化数据集,以及嵌入文本文档(例如研究报告、出版物和监管提交文件)中的大量非结构化信息。研究人员在获取和分析这些信息时经常遇到重大障碍。