high 2026-02-09

Exclusive: Wu Yonghui's First Year Leading ByteDance's Seed AI Research Department

晚点独家丨吴永辉接管字节 Seed 这一年

晚点LatePost latepost
This exclusive media report details the leadership changes, strategic refocusing, and internal restructuring undertaken by Wu Yonghui after taking over ByteDance's large-scale model research department, Seed, in early 2025, with the goal of improving research efficiency and competing at the forefront of AI.
Document Text 6,058 characters
创新需要适当的灰度和混乱,但应对竞争需要秩序和纪律。<br> 文丨陈佳惠 贺乾明<br> 制图丨黄帧昕<br> 编辑丨贺乾明<br> 上千人的研究团队、投入上百亿元追赶两年,终于研发出能排在中国第一梯队的基础模型,迅速被只有上百人的团队用更少资源研发的模型超过,部门负责人承认失误,公司 CEO 在全员会上点名,本可以做得更好。<br> 这是吴永辉 2025 年初接管字节跳动大模型研究部门 Seed 时的情况。多位 Seed 人士说,他背负着 “把模型能力做到国内第一,与国际领先模型公司竞争” 的期待。<br> “沉稳” 是他们对吴永辉的直观感受。我们了解到,接管 Seed 后,吴永辉密集与 100 多位核心研究员 1on1,随后提拔了数位模型架构方向的研究员。<br> 接管 Seed 一年间,吴永辉聚焦两件事:一是提升基础模型能力,提高研究效率保证交付;二是营造研究导向的氛围,“做第一流的研究,打造第一流的 AI 研究团队”。<br> “有务实又有浪漫。” 一位接近吴永辉人士说,他像是在字节体系内成长起来的,而不是出自 Google。<br> 吴永辉 2008 年博士毕业后加入 Google,前 7 年作为软件工程师参与最核心的搜索排名工程;随后转岗到 Google Brain 从事 AI 应用研究,推动深度学习改变翻译领域、用到搜索排名算法中;2023 年成为大模型研发部门 Google DeepMind 研究副总裁,参与 Gemini 大模型研发和早期追赶历程。<br> 另一位接近吴永辉的人士说,“他对技术了解很深,能迅速判断什么方向可以出成果。” 过去一年,Seed 的文生图、文生视频模型在一些基准测试榜单上排在全球前列,豆包手机助手模型成为行业关注焦点。<br> 在竞争最激烈、最重要的基础模型方向,Seed 迭代 4 版(算上即将发布的豆包 2.0),与此前模型能力有较大提升,持续追赶海外领先模型。“但还需要补课,填上过去几年留下来的 ‘技术债’。” 一位 Seed 人士说。<br> 追求 “一流研究团队” 这个长期目标的同时,吴永辉还要不断和短期目标做平衡。<br> 调整:组建三个虚拟团队,打通数据、代码库提高效率<br> 2025 年 1 月,Seed 组建 “Seed Edge” 虚拟团队,设置 3 年期限的考核机制,鼓励骨干研究更基础、更长期的 AGI 课题。我们了解到,吴永辉参与了该团队的组建。<br> 随后他又抽调研究人员组建 Focus 团队,打破部门边界和既有分工,负责基础模型的攻坚,研发下一版模型需要提升的部分。剩下基础模型的团队划分成 Base,包括工程、数据、测评等,研发当前一代基础模型。<br> 这年 3 月,时任 LLM 团队负责人乔木被举报暂停工作后,LLM 下属的 Pre-train(预训练)、Post-train(后训练) 和 Horizon 等直接向吴永辉汇报。<br> 两位 Seed 人士说,在吴永辉的规划中,可以同时推进三代模型研发,人员、课题都可以相互轮换,同时盘活内部的资源,“Edge 有了成果可以直接下放;Focus 发现长期课题可以转入 Edge,有了成果可以用于改进当前一代模型。”<br> 为了提高效率,吴永辉还推动内部数据、代码库透明,对外保密。他在内部说,这是 “改进内部反映的一些问题”。<br> 在字节跳动,Seed 脱离各营收部门单独设立,团队直接向集团管理层汇报,更容易摆脱部门政治。但在 Seed 中,总是多个团队研发方向接近,团队之间沟通相对困难。<br> 两位曾在 Seed 工作的研究员说,之前他们像是一群研究小组的集合,而不是整体的研究部门,比如小组 A 的研究者想看小组 B 的文档,要先经过文档所有者、所有者的领导同意,“有时候部门负责人出面调解都看不了全部信息。”<br> 更透明的信息共享提高了沟通效率,也带来了一些麻烦。我们了解到,2025 年下半年,Seed 至少发生两起实习生泄密事件。之后他们不再要求内部文档公开授权。<br> 基础语言模型研究方向之外,Seed 依旧保持原有的组织架构。上一任 Seed 负责人朱文佳与吴永辉同时负责 Seed 部门数月后,转向吴永辉汇报,负责大模型应用。<br> 多模态交互和世界模型团队由 2024 年从阿里加入字节的周畅负责,代表成果是豆包手机助手模型。过去一年,随着视觉多模态生成负责人杨建朝休假、视觉基础模型研究负责人冯佳时离职等变动,周畅的管理范围持续扩大,新增文生图 Seedream、文生视频 Seedance 模型等。<br> Infra(基础设施)团队由项亮负责。字节跳动的 AI Lab 带着剩下的三个研究方向——AI for Science、Robotics、Reponsible AI 并入 Seed,负责人李航向吴永辉汇报。<br> 过去一年,Seed 整体规模维持在 1500 人左右,扩张速度比前两年放缓,几乎不再从外部招聘中高层技术管理者。他们更加重视招聘应届毕业生、提拔年轻人。我们了解到,一位 2024 年从清华大学毕业的博士生,现在同时向周畅和吴永辉汇报。<br> 成果:边开车边修轮子,训出万亿参数豆包 2.0<br> 即将发布的豆包 2.0 模型是吴永辉接管 Seed 一年最核心的产出。它是一款类似 Gemini 的多模态模型,10000 亿参数,是 Seed 成立以来训练的最大模型。<br> 吴永辉到来后,多位 Seed 研究员明显感受到开会的频率提升,原本 3 个月开一次会的研究团队现在每月就要沟通一次,核心团队基本每两周一次。有字节人士提到,在食堂吃饭时,经常能看到吴永辉端着餐盘坐到研究员对面,边吃边聊进展。<br> 每次研究团队汇报完毕后,吴永辉通常会提几个简短的问题——通常是 3 个。“他不会直接给出具体的解决方案,而是引导大家思考更本质的问题。” 一位 Seed 研究员说。<br> 多位 Seed 人士告诉我们,这款模型训练期间遇到基础设施层面的挑战。他们分析,过去两年 Seed 持续追赶期间,相对忽视了基础能力建设,所以训练豆包 2.0 期间扩大参数规模时不稳定,一度难以推进。<br> “就像盖房子,如果地基不稳,往上加砖头的确容易出问题。” 一位 Seed 研究员说。<br> OpenAI 的 RL Infra 负责人翁家翌在一档播客节目中说,每个模型团队的 Infra 都有 bug,模型公司本质上拼的是 Infra 修 bug 的速度,它决定了单位时间内验证想法的数量,而想法只要提高人才密度就能解决。OpenAI 去年开始重构使用三年的 Infra 体系,解决越积越多的 “技术债”。<br> 过去一年,阿里、腾讯的大模型团队都提高了对 Infra 的重视程度。Qwen 模型团队去年中开始在内部组建 Infra 团队,这部分工作原来主要靠阿里云的人工智能平台 PAI。腾讯去年底宣布成立 AI Infra 部及数据计算平台部,由大模型负责人姚顺雨直接负责。<br> 而对于 Seed 团队,想要重整 Infra 系统难度更大。我们了解到,Seed 的 Infra 团队有数百人,同时支撑 Seed 内部数十款模型的研发和尝试,高层认为水平国内第一。“想要重整,需要投入大量人力、物力,还要承担不小的信任成本。” 一位 Seed 人士说,只能 “边开车边修轮子”。<br> 我们了解到,训练豆包 2.0 遇到问题后,最终多个团队配合,花了 3 个月时间,主要从模型架构、训练数据等方面入手解决问题,确保模型赶在春节前上线。<br> 难题:既要做一流研究组织,又要有短期产出<br> “我们致力于打造一种独特的文化融合体:既有初创企业的专注与活力,又兼具学术界的天马行空式思维。”Google DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)曾说。<br> 多位 Seed 人士说这也是吴永辉的目标,“他想把 Seed 做成一流的研究品牌。”<br> 字节跳动给他提供了环境。过去两年,字节在 Seed 聚集了一批研究人才,就算没有合适的位置,也倾向于 “先把人招进来”。<br> 字节给 Seed 部门设置更宽松的考核机制,大部分取消 OKR。2025 年中,字节发放独立于公司期权之外的 “豆包虚拟股” 激励员工,并多次提高薪酬。<br> 他们也在 Seed 营造一种宽松的工作氛围,实习生能直接与最高层交流。一位 TopSeed 实习生曾在社交媒体上分享,他在开发某个项目的近两个月里,大部分时间睡在公司,经常凌晨两点带着新想法兴奋惊醒,写两小时代码再睡,“感觉每一刻都在不断的发现新现象”。<br> 去年 3 月,吴永辉在部门全员会上说,Seed 做了很多不错的工作,但外界不太了解,鼓励研究者以论文和博客的形式发表成果。“他还建议大家 ‘装修’ 下个人主页。” 一位曾在 Seed 的人说。根据我们初步统计,吴永辉加入 Seed 之后的三个月,该团队发布的论文数量就超过 2024 年全年。<br> 能够对外界充分展示研究成果,进一步激发了 Seed 研究者的自驱力。“筛选出来了一批非常勤奋专注,或者说热衷于钻研的年轻人。” 一位去年离开 Seed 的核心研究者说,他们多数人每天两点一线,为了省事,吃饭只在公司食堂,“生活的主要乐趣就在于工作带来的 feedback”。<br> 我们了解到,Seed 会出现一种情况:几个研究员决定自发研究一个方向,如果上级不同意、不分配资源,他们可以上升汇报,得到认可后,就可以从上到下推进。<br> “他们从前是自己领域内的 ‘小霸王’,带着 ego 来到 Seed,每个人都想成就一番事业。” 上述人士预估,可能只有 20% 的资源是用在短期有用的课题上,“浪费有可能是对的,字节不缺资源。”<br> 但 Seed 并不是一个脱离竞争存在的研究组织,他们需要给字节跳动提供 “弹药”,应对腾讯、阿里等公司的竞争。团队资源不可避免会向短期有成果的团队倾斜。多位 Seed 人士说,去年下半年开始,有研究者做一些单点研究,“感觉不符合 Seed 的主流方向,就很少有人在意这份成果”。<br> 我们了解到,从去年三季度开始,字节管理层对 Seed 团队发论文有了新要求,包括 “高质量”“内容与正迭代的核心技术无关” 等,之后每月发布的论文有所减少。<br> “永辉想要营造研究氛围,但很难避免 DDL 导向。” 一位 Seed 研究员说,他们团队本来要花更多资源和时间,自研算法解决某个技术问题,但为了尽快上线,项目启动后不久就被要求调整思路,在开源项目基础上改进,“哪怕性能有损失”。<br> 今年 1 月,字节跳动 CEO 梁汝波在全员会上说,字节今年关键词是 “勇攀高峰”,短期内高峰是 “豆包 /Dola(豆包海外版)助手应用”,重点是 “AI 模型能力要做到行业前列,通过助手整合好已有业务”。一年前的全员会上,梁汝波说 AI 研究团队要 “探索智能上限”。<br> 创新需要适当的灰度和混乱,而应对竞争需要秩序和纪律。怎么平衡好这两个目标,是吴永辉在 Seed 持续要解的管理难题。<br> 题图来源:《盗梦空间 Inception》<br> 特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。<br> Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.<br> var loadMessageError2 = function () {<br> // message加载失败降级到nginx,产品可以在load事件重新初始化<br> var cdnPath = 'https://dl.reg.163.com/webzj/ngx/message.js';<br> var script = document.createElement('script');<br> script.src = cdnPath;<br> document.body.appendChild(script);<br> }<br> var loadMessageError1 = function () {<br> // message加载失败降级备份cdn域名,产品可以在load事件重新初始化<br> var cdnPath = 'https://webzj.netstatic.net/webzj_cdn101/message4.js';<br> var script = document.createElement('script');<br> script.src = cdnPath;<br> script.onerror = loadMessageError2<br> document.body.appendChild(script);<br> } <br> //初始化反作弊<br> var wm = null;<br> // 只需初始化一次<br> initWatchman({<br> productNumber: 'YD00157343455660',<br> onload: function (instance) {<br> wm = instance<br> }<br> });<br> var isShowComments = true, tieChannel = "";<br> (function () {<br> if (window.isShowComments === undefined) {<br> window.isShowComments = true;<br> }<br> var config = {<br> "productKey": "a2869674571f77b5a0867c3d71db5856",<br> "docId": "KLBB86QE0531M1CO", //"data.article.postid", "FNMG85GQ0514HDQI"<br> "target": document.getElementById("tie"),<br> "operators": ["up", "down", "reply", "share"],<br> "isShowComments": isShowComments, //是否显示帖子列表<br> "hotSize": 3, //热门跟贴列表 展示3 条<br> "newSize": 2, //最新跟贴列表 展示 10 条<br> "showPaging": false, //显示分页栏<br> "submitType": "commentPage" //新发帖子的展现形式:停留在当前页面(currentPage) | 跳转到跟贴详情页(commentPage)<br> };<br> Tie.init(config, function(data) {});<br> })();<br> /阅读下一篇/<br> 返回网易首页<br> 下载网易新闻客户端
Topics
artificial intelligence technology competition corporate strategy
Metadata
Publisher 晚点LatePost
Site latepost
Date 2026-02-09
Category report
Policy Area 人工智能
CMS Category 媒体报道
Keywords 字节,算法,翻译,吴永辉,研究员,seed,正式版模型