智能AI
morning
只需一套神奇的Skills,彻底跑通四个办公场景!
2026-05-21
1 阅读
新智元
新智元报道 【新智元导读】 光有强大的模型本身还不够,从脏数据到分析报告到汇报PPT,中间那条自动化链路谁来跑?GitHub上刚开源的SenseNova-Skills给出了一个答案,我们实测了四个真实场景,效果有点超出预期。 就在最近,第三方榜单Claw-Eval上出现了一个有意思的名字。 SenseNova 6.7 Flash-Lite,一个轻量级模型,冲进了前十。 紧跟DeepSeek V4 Pro和GPT-5.4,压过了Gemini 3.1 Pro和DeepSeek V4 Flash。 有趣的是, 行业巨头们也在同一周有了新动作。 ChatGPT for Excel全球上线,GPT-5.5驱动,直接在Excel里嵌了一个侧边栏。 两天后,Claude把Excel、Word、PowerPoint三件套转正GA,Outlook同步开了公测。跨四个Office应用保持对话上下文不断,从邮件到表格到PPT一路跟着你走。 两大巨头都急着把大模型塞进办公套件,为什么? 实际上,要真正解决你工作的问题,只靠模型是不够的。 如果你想做到跨环节、全链路的办公自动化——从一堆脏数据,到分析报告,到汇报PPT ——得有专门的Agent和Skills来实现。 让大模型从「会聊天」变成「会交作业」,靠的就是这一层。 最近GitHub上出了一套开源的办公Skills跟的就是这波趋势,并且迅速斩获了4位数的Star。 抱着试试看的心态,我们亲自实测了一波,发现效果有点超出预期。 项目地址:https://github.com/OpenSenseNova/SenseNova-Skills 一句话出一张图,零乱码 第一次出国旅游,面对签证、机票、海关、转机一堆流程,大多数人的第一反应是上小红书翻攻略。 现在换个思路。 把需求扔给装了Skills的Agent,它自动生成一张完整的流程图解。 步骤清晰,层级分明,中文排版零乱码,风格直接对标小红书爆款。 一句提示词,一遍成,不抽卡。 左右滑动查看 客户端点开大图后点击下一张(>) 从数据到报告到PPT,三个真实办公场景 开胃菜吃完,上硬菜。 6家厂商13种品类混着来,抗噪才是真本事 下一个测试任务:存储芯片价格分析。 做过采购和分析的朋友肯定懂这种烂账,7个月的报价记录,6家厂商,从DDR4到HBM3e到企业级SSD,13种细分品类全搅在一张表里,厂商名大小写不统一,空值东一个西一个,离群值占了13%。 不光是数据多,更恼人的是数据杂。 品类之间价格量级差了几十倍,你要是不分层处理,一算均价直接就是垃圾。 换作真人,洗数据加写报告,起码熬一天半。 对于这套内容,Agent的处理堪称老手。 它首先跑了一轮「数据审计」,把厂商命名不规范的、报价空值的,全部清理了一遍。 光厂商名就揪出4个问题,什么「 sk hynix」前面多个空格、「 samsung」大小写乱飞,这种脏数据你不清,后面按厂商聚合的时候同一家会被拆成两条线。 尤其值得一提的,是它对离群值的处理。 110条数据被标记为离群值,占了13%,比例不小。 但Agent没有一刀切全删。 它分析了一下发现,其中一部分对应的是真实业务场景,比如渠道清库存促销带来的低价,以及HBM现货紧缺时的溢价,然后果断选择保留数据并单独做了标记,后续分析里分层处理。 数据审计完,紧接着是多维拆解。 按「品类×应用场景×厂商」交叉分析,准确捕捉到2026年2月下旬的价格拐点。HBM3e和企业级SSD周涨幅明显抬升,消费类DDR4与eMMC只是温和跟涨。 最终结论很犀利:本轮上涨是AI服务器需求带动的结构性修复,不是普涨。 上下滑动查看 数据分析能跑通了,更长的链路呢? 给Agent一个行业名,它交回一份调研报告 低空经济行业调研。 只给了一个题目,没有提供任何参考资料。 Agent先锚定了一个核心判断,2025到2026年是中国低空经济商业化的关键窗口期。 然后,它开始自主检索国内外主流厂商的最新进展,逐一比对机型、适航进展和订单数据。 这里有个细节。面对大量口径不一的公关稿和重复信息源,Agent精准提取出了UAM落地节奏、eVTOL核心零部件国产化率和关键环节成本占比。 随后,它又在此基础上自动生成了产业链结构图、成本占比饼图,并用TAM/SAM/SOM框架测算2025、2027、2030年市场规模。 最终给出的调研报告,有判断框架、有数据支撑、有可视化图表,远超「网上搜一圈拼在一起」的信息堆砌。 上下滑动查看 整个过程是sn-deep-research这个Skill在编排。 规划→分维度取证→综合→成稿,支持断点续跑。 23页PPT,连配色都替你想好了 城市新能源汽车充电基础设施布局与运营方案。 首先,内容结构上搭建了完整的七段式框架,行业背景、需求测算、选址模型、技术方案、运营模式、投资测算、政策建议。 最终交付的是一份23页的完整 PPT。 其次,每一部分都匹配了对应的视觉表达。选址模型页自动配置GIS热力示意图,运营模式页生成三种模式的对比矩阵,投资测算页给出利用率与回收期之间的敏感性分析图。 最后一页还给出了3条具体到行动主体和时间节点的落地建议。 生成即交付,打开就能编辑。 上下滑动查看 重点来了。 这份PPT不仅在OpenClaw里跑通了,同样的Skill拖进ChatGPT也能用。 把SenseNova-Skills仓库克隆到本地,通过ChatGPT的Skills入口导入,搭配GPT的原生能力,同样能跑出高质量的PPT。 四大类任务,不挑模型 到这里该揭底牌了。 前面四个场景背后跑的,是同一套东西,SenseNova-Skills。 来自商汤的团队把办公场景里最高频的能力拆成了四大类任务入口,每个入口底下挂着一串具体的Skills各司其职,刚在GitHub开源,MIT协议,覆盖了办公场景里最高频的需求。 1. 数据分析 ,sn-da-excel-workflow,多表读取、大文件超过1万行自动触发Parquet优化、清洗聚合导出,全流程编排。还有专门处理图片表格OCR的sn-da-image-caption。 2. 深度研究 ,sn-deep-research,下面挂了6个子Skills分别负责规划、取证、综合、成稿、格式发现、HTML转换,中间产物持久化,断点可续。 3. PPT生成 ,从sn-ppt-entry统一入口进入,支持标准模式和创意模式。标准模式的链路是大纲→逐页HTML→逐页VLM评审(不合格自动重写)→PPTX导出。 4. 搜索 ,聚合了arXiv、Semantic Scholar、PubMed、GitHub、Stack Overflow、Hacker News、HuggingFace、Reddit、Twitter、YouTube、B站、知乎、抖音,学术+开发者+中英文社交全覆盖。 另外,SenseNova-Skills还能通过调用SenseNova U1模型,完成高密度复杂的信息图生成,包含自动提示词扩写+VLM质检+质量排序。 每个Skill都是独立目录,通过SKILL.md声明什么时候触发、什么时候不触发。 Agent会根据指令自动选择和编排,不需要手动指定调哪个。 这套Skills在Claude