微软研究院论坛第二季第四期：AI智能体、推理验证与语言模型的新进展

（本文阅读时间：5分钟）由微软研究院推出的面向全球研究界的线上系列活动 Microsoft Research Forum 第二季即将上线第四期。 Microsoft Research Forum聚焦有价值的科学研究及其现实影响力——从基础探索到以负责任的方式推动AI发展，通过产品与开源实现创新规模化，并为社会带来积极变革。论坛持续为全球科研同行带来前沿洞察与最新成果分享，共同探讨全球研究界关注的重要议题。在第二季的第四期中，来自微软研究院的科研人员将围绕 AI 智能体、语言模型微调、实时验证、开发工作流自动化以及 AI 对未来社会与经济的影响等前沿议题展开分享，带来多项最新研究成果与实践探索。北京时间5月15日（周五）01:00-02:00（太平洋时间5月14日09:00-10:00），Microsoft Research Forum 邀你一起走进科技创新的最前沿！欢迎扫描二维码注册、观看！错过直播的朋友也无需担心，关注“微软亚洲研究院”官方账号，我们将在直播结束后第一时间上传完整回放，方便您随时观看。演讲1：微软研究院 AI Frontiers的新发布发布内容敬请期待！演讲2： GitHub 智能体工作流：能自动打理代码库的 AI（Introducing GitHub Agentic Workflows: AI that runs your repo）如果你的代码仓库能够自动运行，那么将会怎样？GitHub 智能体工作流（Agentic Workflows）将 AI 智能体直接引入代码仓库自动化流程，使各项任务能够在 GitHub Actions 内部实现端到端的运行。凭借内置的安全防护机制（Guardrails）以及微软托管在Azure 云平台上的模型，该系统提供了一种安全且可扩展的方案，通过意图驱动（Intent-driven）的 AI 来实现开发工作流的自动化。演讲3： Interwhen：利用实时验证引导推理智能体（Introducing Interwhen: Steering reasoning agents with real-time verification） AI 智能体在执行任务时边做边检查的验证方法，可以从自然语言中提取可验证的属性，并使用符号化或基于模型的验证器对其进行评估。Interwhen 作为一个全新的开源库，能够对每一步操作进行实时验证，帮助智能体在处理复杂的现实任务时更加安全、可靠地执行操作。演讲4：全新语言模型微调：匹配语义，而非词元（New fine-tuning of language models: Match meaning, not tokens）语言模型通常被训练用于预测下一个词，但这并不总能带来最佳的整体回答。研究员们引入了基于能量的微调（energy-based fine-tuning），这是一种能够训练模型生成更优质完整回复的新方法。该方法无需复杂的奖励模型或验证器即可带来更强大的模型表现。演讲5：引导 AI 变革走向美好未来（Guiding the AI disruption to the Good Place） AI 真正的影响力并不在于它参加测试的能力有多强，也不在于它在网络搜索上的表现有多好，而是在于它能否在一个为智能体而非人类设计的网络世界中，高效地进行教学、协调与运作。可以预见AI将强化工作流，减少沟通摩擦，并催生出更多由AI 驱动的中介机构，从而将市场与人类目标相契合。我们的研究致力于探索如何引导这一转型朝着开放、创新驱动的生态系统发展，以确保 AI 必然的演进能带来广泛的社会福祉，而不是将社会禁锢在狭隘的围墙之中。北京时间5月15日，第二季第四期 Microsoft Research Forum 将在云端与你相聚，不见不散！欢迎扫描下方二维码进行注册、参与线上直播！你也许还想看：阅读原文文章原文