基于大语言模型的 AI 智能体安全威胁与防御系统性综述——分层攻击面框架

摘要

作者：Kexin Chu 译者：知道创宇404实验室翻译组原文链接：https://arxiv。org/pdf/2604。23338v2 摘要智能体AI系统可跨多会话规划、保留记忆、调用外部工具并与对等智能体协同，无状态大语言模型则不具备这些能力。现有安全分类体系按攻击类型（如提示注入、越狱）划分威胁，却未说明脆弱的架构组件或威胁显现的时间尺度。

作者译者知道创宇实验室翻译组

2026-05-09 1 阅读约1分钟阅读 Seebug Paper

字号:

作者：Kexin Chu 译者：知道创宇404实验室翻译组原文链接：https://arxiv.org/pdf/2604.23338v2 摘要智能体AI系统可跨多会话规划、保留记忆、调用外部工具并与对等智能体协同，无状态大语言模型则不具备这些能力。现有安全分类体系按攻击类型（如提示注入、越狱）划分威胁，却未说明脆弱的架构组件或威胁显现的时间尺度。本文直接解决这些结构性问题，提出分层攻击面模型（...

分享文章：

这篇文章对您有帮助吗？

订阅66必读

每日精选科技资讯，直达你的邮箱

← 返回安全攻防