![]()
长久以来,绝大多数AI工具都停留在“文字问答”层面。我们向AI抛出问题,得到一段文字回复,后续整理数据、制作表格、编写代码,依旧需要人工一步步完成。海外成熟的Agent智能体工具虽然能自主完成整套工作,但门槛极高,普通上班族几乎接触不到。就在6月24日,日活突破2亿的国民级应用豆包,正式上线专业版,同步推出豆包2.1系列大模型,带来全新的办公任务模式。这一次,AI不再只负责打字聊天,而是能拆解任务、调用电脑工具,直接交付一份可以发给同事、对接客户的成品工作文件,把专业智能体能力送到了亿万普通用户手中。
一、核心升级:办公任务模式,豆包首个正式Agent版本
这次更新最核心的亮点,就是全新上线的办公任务模式,这也是豆包第一款真正意义上的Agent智能体产品。付费专业版用户可以使用豆包2.1Pro模型,免费用户则升级为豆包2.1Turbo,并且能在固定额度内免费体验办公任务模式,原有所有免费功能和使用额度全程保持不变,不存在任何功能缩水。
![]()
简单来说,传统AI只会被动回答问题,而办公任务模式下的豆包拥有完整的工作逻辑:接收整体目标,自动拆解分步流程,自主调用本地电脑、浏览器、飞书文档等工具,全程自主排查bug,直到产出完整成品。小到清理电脑里的重复照片,大到编写芯片工程代码、搭建带数据库的网站,一句话指令就能走完完整工作流程。
官方放出的芯片开发测试案例格外亮眼。豆包2.1Pro连续自主运行18个小时,完成6大核心模块,写完1303行RTL代码,历经9轮迭代优化,独立跑完仿真、测试、综合检查全流程。这项工程工作,原本需要三到五位工程师连续忙碌几周,如今交给AI就能独立落地,真正达到了生产级代码交付水平。
二、三大实测场景:一句话指令,交付完整工作成果
为了直观展现Agent的落地能力,官方放出了三组难度逐级递增的实测案例,每一项都能切实减轻职场人的工作量。
场景一:操控本地电脑,一键制作清理照片软件
第一个测试直击本地文件处理痛点。我们只需要下达指令,让AI编写程序筛选文件夹里的重复照片,自动保留画质最优版本,把模糊冗余文件移入回收站。
![]()
豆包首先读取本地文件夹里的全部图片,开始编写Python代码。运行过程中遇到代码兼容问题,它会主动更换技术方案;发现图片评分算法存在漏洞,立刻自主修改代码反复测试,直到筛选结果完全准确。
![]()
后续再追加需求,给程序增加傻瓜式图形界面。短短几分钟内,豆包基于tkinter做出完整GUI窗口,包含文件夹选择、严格度调节、扫描进度条和二次确认弹窗,最终打包生成启动脚本、命令行程序和详细使用说明。哪怕完全不懂编程的上班族,双击文件就能一键清理手机导出的上千张旅行照片,自动区分对焦清晰原图和模糊废片,全程不用手动操作代码。
![]()
![]()
正确对焦的清晰照片:IMG_5676.jpg
![]()
错误对焦的模糊照片:IMG_5684.jpg
![]()
成功选出了更清晰的第一张照片:IMG_5675.jpg
场景二:自动整理财报数据,产出表格+投资分析文档
第二项测试瞄准金融数据分析。一句指令,让AI整理近半年英伟达与AMD的AI芯片财报,对比两家企业营收增速与毛利率,输出飞书表格加500字行业投资摘要。
整个任务包含信息抓取、数据清洗、表格制作、趋势总结多个环节,任何一环出错都会导致任务中断。最终豆包交付了双工作表文件,第一张表格罗列两个企业季度财务数据,精准标注英伟达季度营收816亿美元、同比增长85%等核心指标;第二张汇总全年营收、AI业务占比与市值信息,每一组数据都标注了统计周期,不用人工反复核对。
![]()
![]()
![]()
配套的文档也没有简单复述数字,总结出算力建设拉动需求、英伟达依靠生态构筑护城河、行业一超多强的三大趋势,同时给出对应的资产配置建议。除去人工核验数据的步骤,这份初稿可以直接替代初级分析师半天的工作内容。
场景三:自定义技能模板,自动生成赛事数据看板
第三项测试展现了Agent最具想象力的能力:先打造工具,再使用工具完成任务。用户下达指令,先创建一套数据可视化模板,再利用这套模板分析世界杯赛事数据。
豆包率先生成名为data-dashboard的自定义技能,基于ECharts搭建深色交互式面板,支持柱状图、饼图、折线图等十余种图表。紧接着自动抓取最新比赛信息,生成包含进球统计卡片、球队成绩对比、积分排行的完整数据页面,就连C罗六届世界杯连续破门这类细节信息都完整收录在内。
![]()
![]()
![]()
![]()
这套模板只需要创建一次,后续每一天的赛事数据,只需要重新下达指令就能自动刷新,彻底省去反复制作图表的重复劳动。未来用户还能把更多常用模板存入技能商店,不断扩充AI的工具箱。
除了三大场景之外,办公任务模式还支持更多实用功能:授权后整理电脑文件、跨软件搬运资料;设置定时任务,每周固定时间自动生成行业周报;从零搭建带后端数据库的小型网站,满足个人和小团队的系统搭建需求。后续还会上线手机远程操控电脑、深度打通飞书办公生态等新功能。
![]()
三、底座全面升级:豆包2.1Pro跻身全球第一梯队
强悍的落地能力,离不开底层大模型的迭代。此前字节将代码能力拆分到独立的SeedCode模型,而在豆包2.1版本中,代码编写与智能体执行能力全部整合进主模型,同时推出SeedEvolving迭代版本,每一两周就更新一次模型参数,持续优化任务执行效果。
在各项权威评测里,豆包2.1Pro已经对标海外顶尖模型ClaudeOpus4.6。在开发者代码众测中,它拿到了59.1%的胜率;覆盖上千项高价值职场任务的ALE评测里稳居第一梯队;衡量工作经济价值的GDPval榜单拿下最高分;TerminalBench跑分71.0,和ClaudeOpus4.7几乎持平,正式跨过Agent落地的门槛。
定价也充分贴合国内市场。API调用价格仅为海外同级模型的四分之一。面向个人用户的专业版分为三档:68元标准版、200元加强版、500元高阶版,三档之间只区分使用额度,所有模型与功能完全开放。同时针对在校大学生推出专属优惠,认证后每月仅需38元就能使用旗舰模型;视障用户也能享受视频通话功能专属福利。免费用户全程保留原有权益,还能免费体验基础版办公任务模式,不会出现“免费功能缩水”的情况。
四、2亿日活带来的AI普惠飞轮
豆包拥有超过2亿日活用户,这是海外Agent工具完全无法比拟的优势。绝大多数普通人从来没有接触过ClaudeCode这类专业开发工具,智能体对于他们来说,只是科技新闻里的新概念。如今办公任务模式嵌入国民级APP,行政文员可以一键整理桌面文件,大学生能用低价订阅自动完成课程作业与数据分析,中老年用户也能轻松借助AI批量整理照片文档。
![]()
![]()
海量用户不断用真实工作任务训练模型,形成正向循环:用户越多,积累的办公场景数据越丰富;数据越充足,Agent拆解任务、自主纠错的能力越强;模型持续进化,又会吸引更多人尝试自动化办公。这套用户、数据、模型互相推动的飞轮,正是SeedEvolving高频迭代的底气。
很长一段时间里,Agent智能体只属于程序员和行业分析师的小众工具,普通职场人只能观望。而豆包这次更新,把能自主干活的数字员工装进了全民都在用的软件里。跑分成绩只是入场券,亿万用户真实的办公需求,才是AI下一阶段真正的战场。当AI从回答一句话,升级为独立完成一整套工作,2亿普通人的工作方式,即将迎来一次彻底改变。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.