灵境 AIDR 技术首发 | 以 AI 治理 AI,悬镜智能体安全卫士新品发布

2026-05-20 1 阅读 悬镜安全
首页 阅读 安全资讯 安全知识 安全工具 活动 社区 学院 安全导航 内容精选 专栏 精选专题 安全KER季刊 360网络安全周报 灵境 AIDR 技术首发 | 以 AI 治理 AI,悬镜智能体安全卫士新品发布 阅读量 3084 发布时间 : 2026-05-20 17:31:47 x 译文声明 本文是翻译文章 译文仅供参考,具体内容表达以及含义原文为准。 随着企业全面进入智能体(Agent)爆发时代,AI 数字员工深度融入业务决策与执行链路,影子 AI 无序蔓延、AI 决策全程黑盒已成为企业 AI 安全治理的核心风险,攻击者借助提示词注入、模型幻觉诱导、工具越权调用等 AI 原生攻击手法,可在 1 小时内精准诱导智能体执行数据库删改、敏感文件泄露、高危指令运行等高危操作,直接引发核心数据篡改、业务流程失控、内部系统被入侵等严重安全后果。 在此背景下,悬镜安全正式推出 灵境 AIDR —— 智能体安全卫士平台 , 以大模型为引擎、全链路自动化为骨架、实战化闭环为目标,重构智能体安全治理全流程,让企业在 AI 威胁时代守住安全底线。 灵境 AIDR 智能体安全治理能力图 Agentic AI时代,智能体安全治理面临新挑战 安全团队的痛点:明明已先后建设了从边界防火墙 WAF、端点安全 EDR 到应用免疫 RASP 等整套塔防体系,为什么会被AI新型攻击降维打击,瞬间击穿? 因为 AI 时代的治理逻辑已经彻底改变: 第一,资产黑盒化与“看不清” :影子 AI(Shadow AI)泛滥,企业难以梳理内部AI 基础设施(如OpenClaw等智能体、推理框架、编排工具等)的部署情况,以及隐藏在业务代码和配置文件中的外部模型 API 调用、远程模型拉取、本地模型等,密钥与 AI 配置面临泄露风险 。 第二,情报脱节化与“跟不上”:AI安全事件高频发生,漏洞、投毒等风险层出不穷。企业难以实时将情报关联至动态资产,针对 MCP、Skills 的部署与执行缺乏敏捷检测与实时监控手段,导致防御响应始终滞后于攻击步调。 第三,行为失控化与“拦不住” :智能体在通过MCP、Skills 以及 Function Calling 调用外部工具时,可能因提示词注入、权限管控不足、模型幻觉等原因执行高危指令,导致敏感文件、敏感数据库被非法篡改或泄露。 第四,过程黑箱化与“不可溯” :在智能体ReAct(推理和行动,Reasoning and Acting) 多步任务循环(Agent Loop)中,智能体为何做出错误决策?推理耗时过长?Token 消耗异常等。传统工具无法还原单个任务的完整链路,导致风险定位难、闭环难 。 当防御速度跟不上 AI 的进化速度,传统“先发现、后研判、再被动修复”的静态模式已彻底失效。在数字员工深度接入生产力的今天,唯有通过 AI 原生能力重构“监测-预警-阻断-溯源”的行为闭环,才能拨开灵境迷雾,守住智能时代的防御红线。 安全情报驱动,以AI治理AI 智能守护AI数字员工 灵境 AIDR 紧扣企业 AI 数字员工的实战场景,通过 AI 安全情报驱动智能检测,实现“以 AI 治理 AI”的闭环。它将全域发现、动态验证、自适应安全护栏与链路追踪深度融合,为数字化生产力构建智能防御屏障,确保企业在享受 AI 红利的同时,稳守安全与合规底线。 灵境 AIDR 产品架构图 核心能力一: 【可见】智能体全域发现与 AI-BOM 治理 灵境 AIDR 构建全栈式智能探测体系,从源头将 AI 资产发现质量做到极致。平台通过主机扫描与多模态 HTTP 网络指纹嗅探等方式,实现代码层、应用层、容器层、主机层、网络层全域 AI 资产测绘。并联动悬镜云脉 AI供应链风险情报,实现高危风险入口的实时预警。 l 全域覆盖 :代码、应用、容器、主机、网络五层 AI 资产测绘与深度扫描 。 l 精准识别 :覆盖模型风险、不安全配置、密钥泄露、工具投毒等多类 类 AI 安全风险 。 l 强力检出 :针对 AI 混淆代码、碎片化漏洞及 0day/1day 风险具备行业领先的强检出能力 。 l 实时预警 :依托悬镜云脉 XSBOM AI供应链风险情报库、资产特征库、模型元数据库实现三库联动,实现高危入口秒级预警 。 l 配置审计 :深度扫描 OpenClaw、Hermes Agent、Dify、n8n、Ollama等智能体/编排运行框架的配置文件与环境变量,预防密钥泄露与不安全的配置带上生产环境。 业务价值 :消除影子 AI 资产盲区,将检测输出直接转化为可治理的 AI-BOM,从源头减少无效告警,为智能体安全响应筑牢确定性基础 。 核心能力二:【可管】AI 资产分析管控与合规基线核查 灵境 AIDR 在全域资产盘点与 AI-BOM 的基础上,构建了覆盖模型、智能体、MCP、Skills、密钥与配置的统一管理体系,把“专家经验”沉淀为“系统策略”。平台依托 AI 风险研判与策略检查引擎,进行资产智能分类分级: l 多维自动分级 :基于风险程度、业务价值、暴露面、利用难度多维度加权,实现 AI 风险的自动标准化分级。 l 一键输出指引 :一键式呈现风险影响范围、触发条件及验证指引,大幅降低技术门槛。 l 智能红队验证 :内置模型风险评估与 MCP、Skills 安全扫描,支持越狱、Prompt 注入、有害内容、隐私泄漏等多维度模拟攻击,内置 TC-260 兼容测试集,自动生成模型风险评估报告。 l 研判时效跃升 :通过 AI 自动化研判,将响应时间从 小时级极压缩至分钟级 。 l 异常行为监测 :智能分析风险预警,捕获Token 消耗激增、高频提示词注入触发、工作流死锁等异常指标。 业务价值:显著降低人工研判消耗 ,让安全团队直接聚焦于高危行为的处置与响应,而非陷入海量的告警数据分析。 核心能力三: 【可控】响应闭环,一键处置、风险不过夜 依托全链路智能编排与安全护栏能力,灵境 AIDR 打通了从风险监测到响应处置的“最后一公里”,真正实现秒级阻断与自动闭环 。平台针对智能体异常行为提供多级响应动作,并支持与企业现有 SOC 平台无缝联动,实现全流程无人值守的“发现即处置、处置即闭环” 。 l 多级响应动作 :提供告警、脱敏、替换回复、拦截、配置加固等多级动作,支持“模拟拦截”观察模式,便于策略上线前充分验证。 l 高危行为即时阻断 :针对 AI智能体的工具调用层,实时拦截数据库 DROP/DELETE、系统敏感文件读写及高危命令的执行 。 l 工具调用审计与管控 :对 MCP、Skills 及 Function Calling 调用进行严格管控,通过工具/命令黑白名单机制实现分钟级加固 。 l 无缝流程适配 :通过集成管理与企业现有 SIEM/SOARd 等安全运营平台对接告警,支撑高频风险场景下的自动修复与自动验证,大幅缩短 MTTR。 业务价值:将响应与修复周期从天/小时级极压缩至分钟/秒级 ,在攻防对抗的关键窗口期内,确保智能体行为始终处于安全边界之内。 核心能力四: 【可溯】实战化合规运营,可度量、可优化 围绕“决策透明化”设计的全流程溯源能力,让安全效果透明可视,合规要求精准落地。灵境 AIDR 系统内置完整的任务执行