豆包专业版实测：2亿人都可以体验能干活的Agent了！

新智元报道【新智元导读】 6 月 24 日，豆包上线专业版，首个 Agent 驱动的办公任务模式搭载豆包 2.1 Pro。实测调研报告、财报分析、自建 Skill 等办公场景，交付质量对标 Claude Opus 4.6。2 亿日活的国民 AI 应用，开始认真干活了。刚刚，豆包正式上线专业版，同步发布豆包 2.1 系列大模型。这次更新最核心的变化是全新的「办公任务模式」，分别为专业版用户和免费用户提供豆包 2.1 Pro 和豆包 2.1 Turbo 模型，这也可以被认为是豆包的第一个 Agent 版本。在这个模式下，豆包能完成一个完整的工作目标，自主拆解步骤，调用本地电脑、浏览器、飞书办公套件等工具，产出可以直接交付使用的工作成品，一份行业报告、一张数据分析表、一套 PPT，或者一个带后端数据库的网站。谈到模型能力，有个效果十分吸睛的 Demo：一个芯片设计 RTL 的测试，豆包 2.1 Pro 连续运行近 18 小时，完成 6 个核心模块、1303 行 RTL 代码，经历 9 轮迭代，还跑通了仿真、测试、综合检查等完整工程流程，展现出模型在真实工程场景里的生产级 Coding 交付能力。过去完成该任务需要 3-5 个工程师做数周。豆包日活超过 2 亿，是中国用户量最大的 AI 应用。这 2 亿人里大多数从未接触过 Claude Code 和 Codex 等专业 Agent 工具。 Agent 能力进入一个每天 2 亿人打开的 App，覆盖的是一个全新的用户群体。免费用户不受任何影响，现有功能和额度保持不变，底层模型升级为豆包 2.1 Turbo，能力甚至有显著提升。办公任务模式也在一定额度内向所有用户免费开放。对于豆包的免费用户来说，免费服务的现有功能和额度保持不变，还整体接入了豆包 2.1 模型，能力有所提升。此外，免费用户还能体验接入豆包 2.1 Turbo 模型的办公任务模式。那么这个 Agent 模式到底能把活干到什么程度？三大场景，实测豆包 Agent 办公任务模式的逻辑很简单，Agent 明确目标，拆解步骤，调用工具，交付成品。产出物是可以直接发给同事、交给客户的工作成果。以下三个场景按难度递进，用交付结果说话。场景一：本地电脑操作 + 应用生成第一个场景直接测豆包新推出的办公任务模式最硬核的能力之一——操作用户本地电脑上的文件，写代码、跑代码、发现问题自己修。实测分两轮。第一轮 Prompt：设计一个可复用的本地软件，帮助我检测出重复照片中质量最好的，将其余质量相对更差的放入回收站。可以用我本地文件夹的这些照片来测试并完善软件。豆包先查看了本地照片文件夹，了解测试数据，然后开始写代码。过程中经历了多轮自我迭代，遇到依赖兼容性问题主动切换技术方案，发现评分算法和分组逻辑的 Bug 后自行修复重跑，直到测试结果达标才交付。第二轮 Prompt：能否加上一套极简 UI，让连运行 Python 代码都不会的人也能傻瓜式操作？豆包用 tkinter 做了一个完整的图形界面，文件夹选择、严格度滑块、备份模式、可视化扫描结果、进度条、二次确认弹窗，删除默认进系统回收站。生成了一个双击启动脚本，用户点一下就能打开。最终交付四个文件，命令行版、GUI 版、启动脚本和使用说明。最终，Agent 从两张相同场景的照片中成功挑出了质量最好的一张。正确对焦的清晰照片：IMG_5676.jpg 错误对焦的模糊照片：IMG_5684.jpg 成功选出了更清晰的第一张照片：IMG_5675.jpg 一个完全不会写代码的人，全程鼠标操作就能清理完重复照片。场景二：财报数据分析 + 对比图表实测 Prompt：帮我整理近半年全球 AI 芯片行业的财报核心数据，对比英伟达、AMD 两家公司的营收增速、毛利率变化，生成对比分析表格并给出行业趋势总结，输出为飞书表格 + 500 字以内的投资摘要文档。 Agent 要从多个数据源提取财务指标，清洗比对，生成可读性强的表格，还要写出有判断力的趋势分析。从信息提取到数据处理到可视化到文字总结，这是一个多步骤链式任务，任何一环断了都交不出合格的活。豆包交付了两个文件，一份双 Sheet 的飞书表格和一份投资摘要文档。表格链接： https://my.feishu.cn/sheets/DFBHsfWtOh7zHMtJur4cootPn9c 文档链接： https://my.feishu.cn/docx/Xwxfd5Dv5opPaAxcGLPccvs6nbd Sheet 1 Sheet 2 文档表格做到了什么程度？第一个 Sheet 是季度对比，按公司分列、按指标分行，英伟达 FY2027 Q1 营收 816 亿美元（同比 +85%）、GAAP 毛利率 74.9%、数据中心收入 752 亿美元（同比 +92%）；AMD 2026 Q1 营收 103 亿美元（同比 +38%）、毛利率 53%。第二个 Sheet 是年度核心数据，包括全年营收、AI 业务占比、市值等维度。每个数字都有明确的时间范围标注，不需要人去猜「这个季度到底是哪几个月」。投资摘要没有停留在复述数字的层面，而是提炼出了三个行业趋势判断，全球 AI 算力建设加速驱动需求持续超预期、英伟达 CUDA 生态加硬件迭代形成深厚护城河、竞争格局呈现「一超多强」分化。最后给出了配置建议，英伟达超配、AMD 标配，并提示关注三季度新品节奏和云厂商资本开支变化。 AI 生成的财务数据仍需人工核验，文档也标注了「部分内容由豆包生成」。但作为初稿，这份表格加摘要的双交付，已经覆盖了一个初级分析师大概半天的工作量。场景三：自建 Skill + 世界杯数据分析实测 Prompt：创建一个可以生成数据可视化面板的技能，然后用这个技能把今天世界杯的所有比赛数据分析一下。第三个场景展示的是 Agent 最有想象空间的能力，用户在教 AI 学一个新技能，然后让它用这个技能干活。这条 Prompt 里包含两个任务。第一步是创建一个自定义 Skill，第二步是调用刚创建的 Skill 执行具体分析。豆包先生成了一个名为「data-dashboard」的 Skill，基于 ECharts 构建，支持统计卡片、柱状图、饼图、折线图、双轴图等多种图表类型，响应式设计，深色渐变主题，并附带了完整的 HTML 模板和使用指南。然后豆包调用这个 Skill，抓取了 6 月 24 日世界杯 4 场比赛的实时数据，生成了一个交互式数据面板。面板里的信息让人很难相信这是一句 Prompt 的产物。 6 个关键指标统计卡片（总进球、零封场次、场均进球等），各队进球数对比柱状图，比赛状态分布饼图，进球时间分布折线图，小组积分形势双轴图，外加一张完整的赛程数据表格。数据的时效性也跟上了，葡萄牙 5 比 0 大胜乌兹别克斯坦，C 罗梅开二度（siuuuuu～），成为历史首位在六届世界杯中全部取得进球的球员（41 岁 138 天），这些细节都准确呈现在面板里。图源：央视新闻这个案例的价值在于 Agent 完成了「先造工具，再用工具干活」的复合指令。传统工作流