智能AI
morning
微软研究院论坛第二季第四期:AI智能体、推理验证与语言模型的新进展
2026-05-13
1 阅读
微软研究院AI
(本文阅读时间:5分钟) 由微软研究院推出的面向全球研究界的线上系列活动 Microsoft Research Forum 第二季即将上线第四期 。 Microsoft Research Forum聚焦有价值的科学研究及其现实影响力——从基础探索到以负责任的方式推动AI发展,通过产品与开源实现创新规模化,并为社会带来积极变革。论坛持续为全球科研同行带来前沿洞察与最新成果分享,共同探讨全球研究界关注的重要议题。 在第二季的第四期中,来自微软研究院的科研人员将围绕 AI 智能体、语言模型微调、实时验证、开发工作流自动化以及 AI 对未来社会与经济的影响等前沿议题展开分享,带来多项最新研究成果与实践探索。 北京时间5月15日(周五)01:00-02:00(太平洋时间5月14日09:00-10:00),Microsoft Research Forum 邀你一起走进科技创新的最前沿! 欢迎扫描二维码注册、观看! 错过直播的朋友也无需担心,关注“微软亚洲研究院”官方账号,我们将在直播结束后第一时间上传完整回放,方便您随时观看。 演讲1: 微软研究院 AI Frontiers的新发布 发布内容敬请期待! 演讲2: GitHub 智能体工作流:能自动打理代码库的 AI(Introducing GitHub Agentic Workflows: AI that runs your repo) 如果你的代码仓库能够自动运行,那么将会怎样?GitHub 智能体工作流(Agentic Workflows)将 AI 智能体直接引入代码仓库自动化流程,使各项任务能够在 GitHub Actions 内部实现端到端的运行。凭借内置的安全防护机制(Guardrails)以及微软托管在Azure 云平台上的模型,该系统提供了一种安全且可扩展的方案,通过意图驱动(Intent-driven)的 AI 来实现开发工作流的自动化。 演讲3: Interwhen:利用实时验证引导推理智能体(Introducing Interwhen: Steering reasoning agents with real-time verification) AI 智能体在执行任务时边做边检查的验证方法,可以从自然语言中提取可验证的属性,并使用符号化或基于模型的验证器对其进行评估。Interwhen 作为一个全新的开源库,能够对每一步操作进行实时验证,帮助智能体在处理复杂的现实任务时更加安全、可靠地执行操作。 演讲4: 全新语言模型微调:匹配语义,而非词元(New fine-tuning of language models: Match meaning, not tokens) 语言模型通常被训练用于预测下一个词,但这并不总能带来最佳的整体回答。研究员们引入了基于能量的微调(energy-based fine-tuning),这是一种能够训练模型生成更优质完整回复的新方法。该方法无需复杂的奖励模型或验证器即可带来更强大的模型表现。 演讲5:引导 AI 变革走向美好未来(Guiding the AI disruption to the Good Place) AI 真正的影响力并不在于它参加测试的能力有多强,也不在于它在网络搜索上的表现有多好,而是在于它能否在一个为智能体而非人类设计的网络世界中,高效地进行教学、协调与运作。可以预见AI将强化工作流,减少沟通摩擦,并催生出更多由AI 驱动的中介机构,从而将市场与人类目标相契合。我们的研究致力于探索如何引导这一转型朝着开放、创新驱动的生态系统发展,以确保 AI 必然的演进能带来广泛的社会福祉,而不是将社会禁锢在狭隘的围墙之中。 北京时间5月15日,第二季第四期 Microsoft Research Forum 将在云端与你相聚,不见不散! 欢迎扫描下方二维码进行注册、参与线上直播! 你也许还想看: 阅读原文 文章原文