AI笨鸟
AI笨鸟

腾讯 AI · 五问丨混元的三年战争

AI最新日报 2026-05-11 21:37:00

2025年,从阿里巴巴离职的语音专家鄢志杰,正面临一个重要抉择。

腾讯 AI · 五问丨混元的三年战争

鄢志杰

一边是急于在AI领域大展拳脚的京东,其研究院正招兵买马,尤其从阿里、商汤、百度等企业招揽英才;另一边是腾讯的AI Lab团队,俞栋团队也正在寻找一位值得信赖的语音领域顶尖人才。

当时,早就有意亲自管理京东研究院的刘强东求贤若渴,甚至直接与鄢志杰会面,希望将这位通义实验室语音团队的前负责人招入麾下,最终却被鄢志杰婉拒。

鄢志杰婉拒老刘的原因,并非腾讯AI Lab给出的待遇优厚——在他心中,俞栋是自己在微软时期的同事,这份情谊重逾千钧。

腾讯 AI · 五问丨混元的三年战争俞栋

于是,鄢志杰义无反顾地加入了俞栋的团队。

天有不测风云,鄢志杰到岗时,俞栋麾下语音团队已经开始跟混元团队合作,共同开发对标豆包语音的项目——“混元-O”,此时混元团队研发任务紧张,语音+视觉理解的团队已成建制,项目已经在跑起来了。

人员调动,刚入职腾讯的鄢志杰也受到了影响。一说鄢志杰本人被调到混元,无法和俞栋“双剑合璧”;一说鄢志杰的团队被调走了一批人,而把鄢和一个三五个人的小团队留在了 AI Lab。

然而,“混元-O”项目的开发却并不顺利。由于缺乏语音数据,团队巧妇难为无米之炊,最终的训练结果自然不及预期。

这也在一定程度上导致了鄢志杰入职仅3个月便离开腾讯,转而加入京东研究院。

再之后,俞栋也在各种组织变动之下离职。俞栋走后,AI Lab 的三剑客正式全部离开了腾讯,这也为后来AI Lab的撤销埋下了伏笔。

不难发现,AI 大模型的出现,直接地挑战着互联网大厂的组织架构。

当 Transformer 架构一统语言、视觉、声音等能力,当大量算力不得不向尖端部门集中,当技术的迭代开始以周为单位计算……

面临历史的浪潮,腾讯该何去何从?

(腾讯的 AI Lab 往事,AI笨鸟仍在持续跟进中,欢迎添加作者微信:william_dong,交流爆料。)

01 张正友时代:分工与重整

张潼离开腾讯之际,卢山及一众腾讯高层都不得不认真反思:

“腾讯对管理科学家的用人方式,是不是出了问题?”

或许是此前给予张潼的发展空间过于有限,使其难以充分施展才华,这才促使他选择离开,重返自己更为熟悉的学术界。

于是,接下了张潼 AI Lab 主任之位的张正友,也就被总办赋予了更大的自由和话语权。甚至有消息称,张正友加入腾讯时,总办明确不为他和团队设置硬性的 KPI,好让科学家们能更自由地研究、发展。

腾讯 AI · 五问丨混元的三年战争张正友

而向外看去,2019 年前后,正是 AI 市场的又一个低潮期,资本逃出 AI 深水区、深度学习遇上瓶颈、落地场景受限严重等因素,导致市场对 AI 技术的评价开始两极反转,而大厂们也转而关注怎样把 AI 工程落地,实打实地赚到真金白银。

张正友所在的 AI Lab,自然也有如此的焦虑。

此后数年,AI Lab 下设了产研中心,大批“工程部门”应运而生。Lab 的人员编制(HC)开始从研究中心向产研中心倾斜,管理层甚至会直接通过产研中心,调配 NLP 团队的成员,这引发了团队内部不少人的不满。

而在张正友的管理下,核心技术骨干主要就是前文提及的 AI Lab 副主任俞栋,以及 AI Lab 原 NLP 中心负责人史树明、视觉中心刘威等人。

俞栋 2017 年便加入腾讯 AI Lab,和张正友原本是在微软的老同事,他身处美国西雅图,在这座美国阴雨天最多的城市之一组建了 AI 实验室。曾师从俞栋的齐筠这样评价他:他是一位“传统”的科学家,能力出众,行事沉稳,少有权力欲,也鲜少过问其他部门的事务。

而掌管 NLP 中心的史树明,也是一位特点鲜明的技术领袖。在前员工戴棕的眼中,史性格上和俞栋一样温和,同时有着研究者特有的“刚”劲,专注于“把事做成”。哪怕凌晨独自编写规则,连续工作 12 小时不停测试,他也非要把成果硬生生“拱”出来,不会一味追求技术层面是否完美。

腾讯 AI · 五问丨混元的三年战争史树明

俞栋、史树明这样的中流砥柱,不仅学术影响力不小,接触的项目也够多,扛起了腾讯体系内 AI Lab 的这杆大旗。

时间来到 2023 年,ChatGPT 横空出世。要做大语言模型,站在学术前沿的 AI Lab 与张正友,在当时必然要一马当先。

混元最早在 2022 年底-2023 年初立项,成立虚拟组织,当时的负责人是张正友,由他调动公司其他团队共同研发,主要的分工包括:机器学习平台部负责预训练、AI Lab 负责强化学习和后训练,数据平台部负责评测。当时TEG 的其他团队也纷纷被调动起来,包括数据标注、安全等等。

机器学习平台部的王迪,过去最早在 AI 平台部做过搜索,自姚星离职后就汇报给蒋杰,一段时间以来,主攻方向是广告场景中的搜广推,在NLP领域有多年的经验和积累。

腾讯 AI · 五问丨混元的三年战争

王迪

与此同时,因其辖内多个部门均与混元团队有合作,TEG 的蒋杰也多少参与其中。

大模型的研发关乎 TEG 的整体命运。于是,实际分属张正友与蒋杰的团队双管齐下,向着大模型的共同目标,开启了一场影响深远的“团队合作”。

张正友是当时混元的项目组组长,手下是俞栋的西雅图实验室,史树明的深圳 NLP 中心,和制衡着 NLP 中心的产研中心三拨力量。

而在 TEG,王迪率领的机器学习平台部(机平)、刘煜宏和刘威领衔的数据平台部(数平),虽然仍然虚线汇报给张正友,但实际仍然是实线汇报给蒋杰。

“对待机平和数平两个部门,正友过问的频率相对 AI Lab 低一些,一起开会的次数也少很多。”一位 AI Lab 的前员工蒲佗如是说道。

数据平台部的刘威是 AI Lab 创始 “三剑客” 之一,与张潼、俞栋同期加入团队。他最早向张潼汇报,是早期 AI Lab CV 领域的技术大牛。

腾讯 AI · 五问丨混元的三年战争刘威

在公司内部,刘威一直以他的性格耿直、仗义执言著称。

在 AI Lab 早期,张潼曾发全员邮件,要求 AI Lab 不要打无准备之仗,除非有把握能取得前三的成绩,否则不要参与外部的比赛。而刘威则直接在全员邮件中回复“昨天我们说好,只要能进前五,就可以参赛”,直直地把矛盾暴露在所有人面前。

张潼走后,仍在 AI Lab 的刘威本是向张正友汇报,但奈何两人关系一度紧张,便活水到了数平,实际向蒋杰一系汇报,通过 CV 技术帮助腾讯的广告业务。

尽管对其他人,刘威显得有些太过直白,但在团队内,受到刘威照顾的人不少,他的技术实力也广受认可,大家都亲切地喊他一声“威哥”。

在数据平台部,刘威的上峰,是腾讯的老员工刘煜宏,早在2005 年加入腾讯。

据悉,刘煜宏懂得在大厂内部处理关系,能力以沟通见长。他的办公室里常备着一副茶具,进入他办公室的同学,他都会泡上一杯热茶,总令他的手下联想到“潮汕老板的作风”。

腾讯 AI · 五问丨混元的三年战争

刘煜宏

TEG 的机平、AI Lab 和数平三个部门,就这样开始了混元第一个版本模型的研发。

王迪的机器学习平台部负责预训练、俞栋旗下的 AI Lab 负责后训练,刘煜宏的数平则负责为模型做评测。

鄂梅回忆,当时的 AI Lab,几乎三军用命,领导们也带头冲锋,团队每天加班到凌晨两三点,周末无休,每天除了五个小时左右的睡眠,几乎都在工作,这样的日子持续了三四个月之久。

在这个过程中,联合项目组陆续交付了几个版本的模型,几乎是每个月都有迭代,但是效果却不能让人满意,加上当时国内百度、阿里巴巴都陆续发布了自研的模型,大家都觉得压力很大,此时项目组也到了不得不交作业的时候。

这场围绕混元的竞争,大概在 2023 年的五六月份就初见变化——上峰突然表示,AI Lab 不再负责后训练,只专注强化学习。而这一切的导火索,则是数平部拿出了一个“号称比 AI Lab 更好的模型”。

此前,数平一直在广告场景对模型进行后训练,因而积累了不少实战技术和经验。很快,数平便拿出来了一个新版本的模型,测试后发现效果还不错,这就是当年 9 月面向公众推出的混元 1.0 版本。

但在整个流程中,数平却掌握着评定模型的大权,但又和机平同属蒋杰一系。

如果说,数平的评分可以做到公平公正,那么在算力和数据上的巨大悬殊,也是 AI Lab 团队绕不开的一道坎。

算力上,AI Lab 的团队要进行如此大体量的工作,手里的 GPU 仅有小几千张,规模甚至比不上一个初创公司,反观机平的算力家底,甚至能达到 AI Lab 的数倍之多。

在数据上,鄂梅对AI笨鸟(公众号:AI笨鸟)说,AI Lab 的数据获取屡屡碰壁——拿到 PCG、WXG 的数据自是天方夜谭,只能通过买数据、爬公域数据的方式来支持强化学习。同时,AI Lab 和机平、数平在蒸馏的策略上也有所差别,最终也影响了他们具体的训练成果。

这之后,AI Lab 的败势便难以逆转,后来即使在强化学习的领域做的不错,AI Lab  也还是把混元 RLHF 的业务交了出去。

“AI Lab 已经决定退出了,即使继续做下去,某一天还是要交出去。”鄂梅对AI笨鸟如是说道。一段时间后,后训练又从数平迁往了机平,完成了业务的又一次交棒。

有消息称,在 AI Lab 在混元竞赛中宣告失败的当天,刘威曾只身来到 AI Lab 所在的楼层,挨个向工位上的同学嘘寒问暖,自豪与喜悦之情溢于言表。

腾讯内部透露,混元的节奏进展缓慢,算力和数据上的制约也是一个很大的原因,早期不管是AI Lab 还是机平,总的卡数量不足几千张,跟外界的数万张比起来,差距非常悬殊。

自此,张正友 AI Lab 一系在混元全线撤退,但即使如此,这也并非他离开 AI Lab 最核心的原因。

(混元的实际开发细节,由于篇幅限制,有不少信息没有录入文中,腾讯的 AI 故事还远没讲完,欢迎添加作者微信:william_dong,获取更多八卦。)

2023 年到 2024 年,AI Lab 爆发了一场大规模的中层离职潮,技术、工程两大板块都有人离开。从分管视觉中心的 T15 技术专家王珏,到医疗中心负责人黄俊洲、分管虚拟人的暴林超,再到语音技术中心的苏丹与翁超,一众核心骨干相继离开了腾讯。

而自知在腾讯难以为继的史树明,则是坚持到了最后一刻,等待团队里大部分想走的同事尘埃落定,才最终选择与腾讯分手。

离开了腾讯的史树明,甚至自嘲“太好了,终于可以好好地学一下大模型了”,并自己独力写完了一个 VLLM 的推理架构——3.5 比特量化的推理框架 inferflow,还完成了一篇颇具前瞻性的技术报告,之后也觅到了一个好去处,过得自在。

而腾讯 AI Lab 这边,史树明一走,NLP 中心没了员工,也没了主心骨,组织就也散了。

一个总监离职事小,一个团队跟着没了就变成了大事。

于是,在 2024 年 8 月,腾讯召开了一场内部大会,张正友随后离开 AI Lab,也自然不再负责混元相关事务。

02 蒋杰时代:大调整的全面酝酿

张正友离开 AI Lab 后,把棒交给了蒋杰。此时蒋杰也正是混元的主要负责人,当时组织调整的一大考虑,就是希望团队之间的拉通和融合更加深入。

然而,AI Lab 已经开始走向下坡路,蒋杰接下的,正是这样一个摊子。

相比张正友,蒋杰更像姚星——管理军事化、高压化,言语并不避讳,刚猛的气魄和他在公司内部的英文名 Zeus(宙斯)相当契合。而他手下的骨干们,身上也有他从阿里带来的“领地意识”,即使面对并不擅长、从未接触过的工作,也敢于接活,充斥着“有战用我,用我必胜”的乐观。

腾讯 AI · 五问丨混元的三年战争蒋杰

于是,混元在蒋杰治下,迎来了前所未有的组织变革,目标是以 AI 为轴心的“大一统”。

首先,是史树明离职后的 NLP 中心,与俞栋团队合并,成为 AGI 中心,仍然分属 AI Lab 旗下。

然而,AI Lab 终究不是蒋杰的“主战场”,只是他攻伐下的又一个领地——最大的变化,却首先发生在刘威身上。

混元一役前后,刘威便快速得以晋升,正以高速逼近腾讯内部技术线的天花板。

然而,出乎外界所有人预料,大厂前途一片光明的刘威,却在升职不久后火速离职,外出创业 Video Rebirth,专研视频生成算法。(刘威为何在事业巅峰期急流勇退?内部人士透露了哪些关键信息?他的创业项目又藏着怎样的野心?欢迎添加作者微信:william_dong 深度交流。)

2024 年,正是 OpenAI 通过 Sora 引爆视频生成技术的风口期,但技术路径显然还并不可见。刘威受命开发视频模型,进展却不如人意,在总办也承压不少。

在这个时候,刘煜宏则在外部,引入了华为的天才少年——钟钊,来接手腾讯的混元视频与图像业务。

腾讯 AI · 五问丨混元的三年战争

钟钊

在华为,钟钊的主要工作是神经架构搜索(NAS),但作为科研的常态,这条技术路径不久就被证明是一条的“弯路”。到了腾讯,钟钊在内部对过去的工作几乎全盘否定,要求把视频模型的研发从头来过,技术理念不同,刘威也在同年离职创业。

在腾讯站稳脚跟,钟钊便开始招揽华为的同袍。而另一方面,面对技术路径,有传闻称,钟钊不怕“跟进”,让团队的应届生、实习生纷纷找到自己母校实验室的师哥师姐取经,要来他们的实现方案、数据来源和清洗方法,以此强化混元的多模能力。

不久,钟钊也将图像生成团队兼并进了自己的麾下。

去年Q1,团队内部就开始进行音画一致预研,内部有人提出可以将音频和视频同步训练,不仅能增加“音画同出”的能力,更能让模型的智能和鲁棒性进一步提升了,然而由于内部音画一致数据缺乏,方案到年底才开始进行。这个技术路径在今天也被可灵3.0和Seedance2.0所验证。

钟钊接管刘威团队后,原先刘的手下几乎流失八成。

刘威离职 8 个月之后,从阿里离职的薄列峰(也就是网上风传的“Linus”)加入了腾讯混元,分管混元的多模态模型部,一揽文生图、文生视频、文生 3D 和数字人四大部门。

腾讯 AI · 五问丨混元的三年战争薄列峰

在腾讯,罗福对薄列峰的评价不错,说他对技术细节相当关注,甚至会过问自己 -2 的具体工作,把管理抓得很细。

薄列峰的到任,总算是暂时稳住了混元多模态模型部的结构,让改变得以缓慢发生。

与此同时,AI Lab 的组织调整却还在继续,R1-R4 四个部门兴起,并且以合伙人制的方式,打破了原有的体系设置。

其中,R1 的合伙人还是 AI Lab 的副主任俞栋;R2 的合伙人则是 2025 年一月入职,MSRA 视觉计算组前首席研究员胡瀚;R3 的合伙人是在字节曾任Seed大模型视觉基础研究团队负责人的冯佳时;R4 的合伙人则是曾经开发了王者“绝悟”的技术负责人,也是公司最年轻的 leader 总监,最年轻的首席专家——叶德珩。

腾讯 AI · 五问丨混元的三年战争叶德珩

然而,新变阵的 AI Lab,最终还是出了问题,而且问题出在了素来与世无争的俞栋身上。

鄢志杰事件之后,俞栋重新梳理了一个 20 人的团队,准备重新出发。然而一年还没过去,俞栋又接收到了要把团队并进多模态模型部的信号。

公平地说,语音工作与混元在多模态领域的布局,在某种程度上的确密不可分。新的技术路线之下,语音工作必须依托于大模型底座,才能取得更好的效果。

但对俞栋而言,这无疑是第二次触动了他的痛处。

“俞老师本来就是一个技术能力极强的人,”原先在俞栋团队的常白评价道,“让他带一个小团队突破,他能做出很好的成果——而如果把俞老师推到管理岗承压,最后结果就不会太好。”

于是,就如先前在《独家|腾讯 AI Lab 撤销背后:俞栋离职是最大导火索》中说道的一样,俞栋几乎在静默中悄然离职,不久后,他的语音团队被正式划入薄列峰治下,成为了多模态模型部的第五个板块。

自此,张潼、刘威、俞栋先后离职,AI Lab 的三剑客正式全部离开了腾讯。

而俞栋的离开,难免让腾讯的总办想起短短两年前的史树明等人——与其放任 AI Lab 成为一具空壳,不如先破后立,重新设计混元的组织架构。

于是 AI Lab 成为了历史,蒋杰也退出了混元体系。混元的姚顺雨时代要来了。

03 姚顺雨时代:让 AI Native 的人领路

和不少 AI Lab 做研究的科学家交流,他们往往会提到一个情况:在实际的研究工作中,他们长期碰不到基模。

一方面原因,是过去根深蒂固的部门墙,阻隔了 AI Lab 和基模团队之间的通路;而另一方面,基模是与自己无关的工作,AI Lab 也不愿涉入太深,生怕踩了别人领地。

而在宣布 AI Lab 撤销的全员会上,姚顺雨则直言,要打破这面“坚不可摧”的墙。

腾讯 AI · 五问丨混元的三年战争姚顺雨

事实上,选择姚顺雨,一定是腾讯总办的深思熟虑——小马哥和总办高层在硅谷聊人无数,但最后选择了这个博士毕业仅两年的 95 后,必然有他们的道理。

加入腾讯时,姚顺雨虽然不在总办,却能给总办“上课”,直接对刘炽平汇报。

在今天的 AI Lab 撤销后,姚顺雨的混元大语言模型部和 AI Infra 部,与 TEG 薄列峰的混元多模态模型部平行,在不同的方向展开工作。

在姚顺雨旗下,有多方信源确认,当下有五大板块,分别是预训练、后训练、Baseline Infra、模型评估和 Frontier(前沿)。其中,前沿组则招纳了不少原来 AI Lab 的人。

“大家做的事情还是一样的,只是换个地方而已。” AI Lab 的一位科学家贺澜说道。

除了王迪以外,胡瀚也在被薄列峰辞去了在多模态模型部的工作后,加入了姚顺雨的旗下,专注多模态理解的研究。原先 R3 实验室的冯佳时仍然还在,研究 GUI Agent 的相应工作。

腾讯 AI · 五问丨混元的三年战争

冯佳时

而其他的十余个小组中,不乏来自 Seed、DeepSeek、Qwen、Kimi 的大牛以及大量从顶尖院校毕业的应届生。混元的团队也正变得越来越年轻,越来越敏捷。卢山曾在内部讲话中提及,大模型时代,要让AI Native的带来新想法和新思路。

但即使如此,腾讯混元的变革仍在继续。姚顺雨也正在面临一场大考,想法再大,最后也要用模型说话。

(姚顺雨时代的腾讯混元,会变得更好吗?他的第一场“大考”成绩究竟如何?AI笨鸟正在持续关注中,欢迎添加作者微信:william_dong,获取更多一手信息。)

终究不愿再谈不切实际的美梦,姚顺雨的目标,就是在 2026 年中,让混元做进国内第一梯队。

 结语

事后,当常白问及离职的真正原因时,俞栋的反应只有一句淡淡的“体感不好”。

而这句“体感不好”,或许也体现出了不少科学家们在 AI Lab 的处境。

理论上,科学家应该是最好管的一批人。

他们大多自驱,不需要人在后面拿着鞭子赶。给他们一片花园,告诉他们边界在哪里,他们会自己翻土、播种、浇水、施肥,日复一日,静待花开。科学研究有自己的规律,急不得,也快不了。

但AI时代的问题在于,商业逻辑和技术演进路线的变化太快了。

过去的科研可以“花大钱办小事”——投一个实验室,养一拨人,三五年出一篇顶会论文,企业照样觉得值。

但今天,时代变了。

AI正在从“多个独立方向的平行研究”收敛为“一个统一架构的工程化落地”。独立AI Lab是第一个时代的最优组织形式,但在当前范式下,它的存在反而制造了摩擦——研究和产品之间隔了一层,资源在多个方向上分散,决策链条被拉长。

所以AI Lab们的落幕,是一种必然,也是AI朝向更宽广方向发展的必经之路。

实验室时代结束了,大模型时代来了,混元的故事才刚刚开始。

(腾讯 AI Lab 往事系列文章仍在继续推出,AI笨鸟将持续关注写作,欢迎添加作者微信:william_dong,交流认知,分享八卦。)


AI笨鸟原创文章,未经授权禁止转载。详情见转载须知