智能AI
evening
豆包专业版实测:2亿人都可以体验能干活的Agent了!
2026-06-24
1 阅读
新智元
新智元报道 【新智元导读】 6 月 24 日, 豆包上线专业版,首个 Agent 驱动的办公任务模式搭载豆包 2.1 Pro。实测调研报告、财报分析、自建 Skill 等办公场景,交付质量对标 Claude Opus 4.6。2 亿日活的国民 AI 应用,开始认真干活了。 刚刚,豆包正式上线专业版,同步发布豆包 2.1 系列大模型。 这次更新最核心的变化是全新的「办公任务模式」,分别为专业版用户和免费用户提供豆包 2.1 Pro 和豆包 2.1 Turbo 模型,这也可以被认为是豆包的第一个 Agent 版本。 在这个模式下,豆包能完成一个完整的工作目标,自主拆解步骤,调用本地电脑、浏览器、飞书办公套件等工具,产出可以直接交付使用的工作成品,一份行业报告、一张数据分析表、一套 PPT,或者一个带后端数据库的网站。 谈到模型能力,有个效果十分吸睛的 Demo:一个芯片设计 RTL 的测试,豆包 2.1 Pro 连续运行近 18 小时,完成 6 个核心模块、1303 行 RTL 代码,经历 9 轮迭代,还跑通了仿真、测试、综合检查等完整工程流程,展现出模型在真实工程场景里的生产级 Coding 交付能力。过去完成该任务需要 3-5 个工程师做数周。 豆包日活超过 2 亿,是中国用户量最大的 AI 应用。 这 2 亿人里大多数从未接触过 Claude Code 和 Codex 等专业 Agent 工具。 Agent 能力进入一个每天 2 亿人打开的 App,覆盖的是一个全新的用户群体。 免费用户不受任何影响,现有功能和额度保持不变,底层模型升级为豆包 2.1 Turbo,能力甚至有显著提升。 办公任务模式也在一定额度内向所有用户免费开放。 对于豆包的免费用户来说,免费服务的现有功能和额度保持不变,还整体接入了豆包 2.1 模型,能力有所提升。 此外,免费用户还能体验接入豆包 2.1 Turbo 模型的办公任务模式。 那么这个 Agent 模式到底能把活干到什么程度? 三大场景,实测豆包 Agent 办公任务模式的逻辑很简单,Agent 明确目标,拆解步骤,调用工具,交付成品。 产出物是可以直接发给同事、交给客户的工作成果。 以下三个场景按难度递进,用交付结果说话。 场景一:本地电脑操作 + 应用生成 第一个场景直接测豆包新推出的办公任务模式最硬核的能力之一——操作用户本地电脑上的文件,写代码、跑代码、发现问题自己修。 实测分两轮。 第一轮 Prompt: 设计一个可复用的本地软件,帮助我检测出重复照片中质量最好的,将其余质量相对更差的放入回收站。可以用我本地文件夹的这些照片来测试并完善软件。 豆包先查看了本地照片文件夹,了解测试数据,然后开始写代码。 过程中经历了多轮自我迭代,遇到依赖兼容性问题主动切换技术方案,发现评分算法和分组逻辑的 Bug 后自行修复重跑,直到测试结果达标才交付。 第二轮 Prompt: 能否加上一套极简 UI,让连运行 Python 代码都不会的人也能傻瓜式操作? 豆包用 tkinter 做了一个完整的图形界面,文件夹选择、严格度滑块、备份模式、可视化扫描结果、进度条、二次确认弹窗,删除默认进系统回收站。 生成了一个双击启动脚本,用户点一下就能打开。 最终交付四个文件,命令行版、GUI 版、启动脚本和使用说明。 最终,Agent 从两张相同场景的照片中成功挑出了质量最好的一张。 正确对焦的清晰照片:IMG_5676.jpg 错误对焦的模糊照片:IMG_5684.jpg 成功选出了更清晰的第一张照片:IMG_5675.jpg 一个完全不会写代码的人,全程鼠标操作就能清理完重复照片。 场景二:财报数据分析 + 对比图表 实测 Prompt: 帮我整理近半年全球 AI 芯片行业的财报核心数据,对比英伟达、AMD 两家公司的营收增速、毛利率变化,生成对比分析表格并给出行业趋势总结,输出为飞书表格 + 500 字以内的投资摘要文档。 Agent 要从多个数据源提取财务指标,清洗比对,生成可读性强的表格,还要写出有判断力的趋势分析。 从信息提取到数据处理到可视化到文字总结,这是一个多步骤链式任务,任何一环断了都交不出合格的活。 豆包交付了两个文件,一份双 Sheet 的飞书表格和一份投资摘要文档。 表格链接: https://my.feishu.cn/sheets/DFBHsfWtOh7zHMtJur4cootPn9c 文档链接: https://my.feishu.cn/docx/Xwxfd5Dv5opPaAxcGLPccvs6nbd Sheet 1 Sheet 2 文档 表格做到了什么程度? 第一个 Sheet 是季度对比,按公司分列、按指标分行,英伟达 FY2027 Q1 营收 816 亿美元(同比 +85%)、GAAP 毛利率 74.9%、数据中心收入 752 亿美元(同比 +92%);AMD 2026 Q1 营收 103 亿美元(同比 +38%)、毛利率 53%。 第二个 Sheet 是年度核心数据,包括全年营收、AI 业务占比、市值等维度。 每个数字都有明确的时间范围标注,不需要人去猜「这个季度到底是哪几个月」。 投资摘要没有停留在复述数字的层面,而是提炼出了三个行业趋势判断,全球 AI 算力建设加速驱动需求持续超预期、英伟达 CUDA 生态加硬件迭代形成深厚护城河、竞争格局呈现「一超多强」分化。 最后给出了配置建议,英伟达超配、AMD 标配,并提示关注三季度新品节奏和云厂商资本开支变化。 AI 生成的财务数据仍需人工核验,文档也标注了「部分内容由豆包生成」。 但作为初稿,这份表格加摘要的双交付,已经覆盖了一个初级分析师大概半天的工作量。 场景三:自建 Skill + 世界杯数据分析 实测 Prompt: 创建一个可以生成数据可视化面板的技能,然后用这个技能把今天世界杯的所有比赛数据分析一下。 第三个场景展示的是 Agent 最有想象空间的能力,用户在教 AI 学一个新技能,然后让它用这个技能干活。 这条 Prompt 里包含两个任务。 第一步是创建一个自定义 Skill,第二步是调用刚创建的 Skill 执行具体分析。 豆包先生成了一个名为「data-dashboard」的 Skill,基于 ECharts 构建,支持统计卡片、柱状图、饼图、折线图、双轴图等多种图表类型,响应式设计,深色渐变主题,并附带了完整的 HTML 模板和使用指南。 然后豆包调用这个 Skill,抓取了 6 月 24 日世界杯 4 场比赛的实时数据,生成了一个交互式数据面板。 面板里的信息让人很难相信这是一句 Prompt 的产物。 6 个关键指标统计卡片(总进球、零封场次、场均进球等),各队进球数对比柱状图,比赛状态分布饼图,进球时间分布折线图,小组积分形势双轴图,外加一张完整的赛程数据表格。 数据的时效性也跟上了,葡萄牙 5 比 0 大胜乌兹别克斯坦,C 罗梅开二度 (siuuuuu~) ,成为历史首位在六届世界杯中全部取得进球的球员(41 岁 138 天),这些细节都准确呈现在面板里。 图源:央视新闻 这个案例的价值在于 Agent 完成了「先造工具,再用工具干活」的复合指令。 传统工作流