智能AI
morning
Claude通过率低于4%,SaaS-Bench撕碎了计算机使用的「虚拟办公」幻想
2026-05-25
1 阅读
量子位的朋友们
UniPat AI 发布 SaaS-Bench 评测,Claude 等主流大模型在真实办公任务中完全通过率最高仅 3.8%,AI 全自动办公远未落地。