GUARD‑SLM:面向小语言模型、基于令牌激活的越狱攻击防御方法

2026-05-08 1 阅读 Seebug Paper
作者:马里兰州Jueal Mia1, Joaquin Molto1, Yanzhao Wu1, M. Hadi Amini 译者:知道创宇404实验室翻译组 原​​文链接:https://arxiv.org/html/2603.28817v1/https://arxiv.org/html/2603.28817v1 摘要小语言模型(SLM)正成为大语言模型(LLM)且经济可行的替代方案,在计算成本...