字节重回AI核心

字节重回AI核心0

11月13日早上,一则关于阿里巴巴决定申请仲裁“通义大模型前员工周畅违反竞业协议”的消息迅速在AI圈传播开来,而当天中午就有媒体得到阿里内部人士的确认:情况属实。

早在2020年,周畅就开始在阿里达摩院带领团队训练名为M6的多模态模型,2023年ChatGPT爆火后,他所在的团队在M6基础上研发了“通义千问”大模型,该模型如今已成为众多通义系列AI产品的技术底座。可以说他就是当今世界上最懂阿里大模型的人,但这个人现在跳槽到了字节跳动,对于阿里来说这无异于釜底抽薪。

7月中旬,最先曝出来的消息是周畅即将辞职创业,然而10月底,他就已经加入了字节跳动。“辞职创业就是个幌子,就是怕被竞业,”在一家服务字节的猎头公司工作的沈曼告诉《第一财经》杂志,“但这次瞒不住了,来字节的不止周畅一个人,他手底下的团队还有十多个人也跟着跳槽了。”

此外,最近几个月加入字节大模型团队的关键人才还包括零一万物前算法副总裁黄文灏,面壁智能原核心成员、序智科技创始人秦禹嘉。

这家中国最年轻也最激进的技术公司一直以拥有庞大的招聘团队著称,HR部门巅峰时有5000多名员工,其中绝大部分人唯一的工作就是招聘,再辅以同等规模的外包猎头体系,共同构成了一座史无前例的抢人工厂。其他体量相近的技术公司在招聘团队规模上与它有着约一个数量级的差距,这意味着只要字节决定入场,每家竞对公司都将面临人才流失的风险。

但字节曾是“迟钝”的。CEO梁汝波在2024年年初的全员会上反思道,公司“直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的”。百度2023年10月宣布已在百度搜索、文库、地图等各种应用中全部植入了AI能力时,豆包App刚上线不久,这也是当时字节唯一一款AI原生应用。

字节提速,从抢人开始

从2023年年中开始,这座工厂AI方向的抢人需求就没有断过。“目标主要是阿里通义团队、百度文心和飞桨团队,以及包括月之暗面、智谱在内的‘AI六小龙’,等等,”沈曼说,“国内有模型研发经验的人才基数较少,所以工作时往往可以直接定位到团队甚至个人。”字节对于基础模型研发相关人才的招聘是没有名额上限的,对于目标团队的候选人在薪资上开出的数字非常可观,经常可以看到基于原薪资双倍的涨薪幅度。

根据沈曼的经验,字节各个部门首先要向招聘团队提出招人需求,但公司开放给各部门招聘人才级别的权限并不相同。字节职级一共分10级,从最低的1-1到最高的5-2,数字越大,职级越高。其中2-1(工程师)到3-1(高级技术专家)是内部占比最大的。在业务维稳期,会有大量2-1和2-2的招聘需求。在业务需要“开疆拓土的阶段”会放出3-2、4-1以及更高的需求。一般来说,只有盈利部门3-1以上的需求会更多,但是在大模型研发人才的招聘上,字节格外大方。《第一财经》杂志通过多方信源了解到,字节给周畅提供了一份几乎无法拒绝的合同:4-2的职级和8位数的年包工资,按阿里的职级体系换算大约是连跳两级且薪资翻好几倍。与他一起来的原团队成员,字节也都给了4-1、3-2(对标阿里级别P10、P9)的职级。“你也可以把周畅这单合同看作一份英雄帖,字节是在告诉所有人,它愿意给,而且给得起。”沈曼说。

对于字节来说,抢人早已是公司开辟新业务时惯用的手段。字节创始人张一鸣曾多次在公开场合提到“人才密度”的概念,在他看来,只要保证人才密度超过业务复杂度,那么在有效的激励措施下业务的成功是水到渠成的。

张一鸣本人就是这套理论最忠实的践行者,字节旗下今日头条、抖音等信息流产品所倚仗的核心技术,即推荐、广告、搜索算法(简称“推广搜”)的研发班底其实就来自于百度。2014年至2015年,张一鸣以高薪从百度网页搜索部相继挖来了当时的副总监杨震原、主任架构师朱文佳,以及一批机器学习算法工程师。现如今,杨震原已是字节跳动副总裁兼火山引擎业务负责人,朱文佳则担任过今日头条CEO及TikTok产品技术负责,2023年年初更是成立了代号为“Seed”的神秘团队,专注于大模型底层技术的研发。

其实比从外面抢人更早一点发生的,是字节内部的“抢人”,或者按官方的说法:团队重组。

神秘和特殊是乐雁对Seed团队的最早印象。2023年年初,他发现在字节机器学习平台的算力使用榜前排出现了一些新名字。依照过往经验来看,排名靠前的都是当前字节内部最受重视、得到最多资源倾斜的团队,而前几名的算力使用量往往能占当时总算力的一半。一些消息灵通的同事称这个新成立的团队很可能在做基础模型的研发,他们的工作区还有第二道门禁。

乐雁2020年才作为算法工程师加入字节,但他对这家公司灵活多变的管理风格并不陌生,从每个人到每个部门,一切都在名为效率的指挥棒下快速移动、安置、再移动、再安置。

AI Lab在公司内部式微后,字节AI研究的重心转移到应用机器学习(Applied Machine Learning,AML),也被称作机器学习中台部门,该部门一方面负责传统产品的推广搜算法研发,另一方面被要求拓展新业务,包括搭建字节的算力集群并训练大模型。其中的关键人物包括原机器学习系统负责人朱亦博,他2023年辞职后参与创办了“AI六小龙”之一的阶跃星辰;大语言模型研发技术专家杨红霞2023年年初加入字节,曾在阿里达摩院担任M6大模型的技术负责人,也就是周畅曾经的领导,不过2024年5月她已离开字节。

字节跳动在生成式AI竞争中采取饱和式进攻策略

字节重回AI核心1
根据公开资料整理

在2023年年初成立Seed团队是字节在AI业务上的又一次调整,该团队主要班底来自搜索、AML、AI Lab等部门中的大模型相关人才。不仅如此,乐雁称这个团队同时还在从其他部门物色人才,以提升这个新兴业务的“人才密度”。

沈曼估计,如今Seed团队的人数应该已经超过了150人,这还仅仅只是字节研发基础模型的团队。2023年年底,字节又成立了一个名为Flow的团队,负责基于大模型的AI原生应用的研发,豆包就是其成果之一,该团队的人员增长更快,目前有近300人。除此之外,字节每个业务部门都被要求思考如何将大模型落地到相关业务场景里。

回归AI核心

字节正在自上而下地重建它的核心—人工智能。

早在2016年,张一鸣就在公司内建立了AI Lab,力邀微软亚洲研究院前常务副院长马维英、华为诺亚方舟实验室原主任李航、自然语言处理技术专家李磊等多位科学家加入,设立了包括计算机视觉(CV)、自然语言处理(NLP)、语音和音频处理、音乐、机器学习等多个子团队,几乎覆盖当时人工智能涉及的所有前沿领域。同时,这个实验室在北京、上海、深圳、新加坡、美国、欧洲等地都设有办公室。马维英被委任为AI Lab负责人,直接向张一鸣汇报。

AILab的设立显示了张一鸣在新技术时代的雄心。彼时的字节还不是“大厂”,它创立仅4年,只有今日头条一个爆款应用,无论公司资历还是业务体量都无法与阿里巴巴、百度、腾讯等巨头相比。那段时期,百度和腾讯已先后大手笔成立了自己的人工智能实验室,在全球招揽人才,其中百度还招募到了微软前全球执行副总裁陆奇加入。字节是那一轮AI L ab建设浪潮中鲜见的初创公司,而且它作出这一决定的时间比阿里巴巴早,后者直到2017年5月才宣布成立达摩院。

字节后来的发展数十倍、百倍地回报了这一时期的技术投 入。

AILab成立的同一年9月,抖音诞生。当时,2011年就成立的快手通过“农村包围城市”策略已收获大量三四线城市用户,作为刚诞生的同类应用,抖音试图从一二线城市突破,将“音乐”“年轻”“潮流”确立为主打风格,而支持这些风格所需要的功能—变脸、换装、美颜甚至尬舞,都依赖于人工智能技术。以“尬舞”为例,它使用字节AILab的“人体关键点检测”技术,可以让用户在镜头前跳舞时了解自己的姿态是否和目标姿态准确匹配。2017年,抖音上线了基于该技术的“尬舞机”功能,App版本更新后的第二天,抖音就冲到了应用商店免费榜的第一名。

人工智能技术不止加持了抖音,也使字节开始成为真正的App工厂、全球化公司。2018年,张一鸣在当年举办的首届数字中国建设峰会上发表题为《技术出海,建设全球创作与交流平台》的主题演讲时表示,“人工智能技术是字节跳动在全球市场取得优势地位的关键”。不论是综合资讯类的产品TopBuzz、News Republic,还是短视频类的产品TikTok、musical.ly、VigoVideo、BuzzVideo,这些产品虽然有着不同名字,内核都是同一套人工智能技术方案—推荐算法,张一鸣称它为全球用户提供了一致的产品体验。

字节重回AI核心2
字节旗下首款生成式AI原生应用“豆包”

然而当抖音、TikTok等核心应用取得具有绝对优势的市场地位、开始步入“流量如何商业化”的阶段,AI Lab在字节的位置松动了。指标性迹象是AI Lab负责人马维英的汇报对象从张一鸣变为当时的抖音负责人张楠,这意味着AI Lab不再是个集团级的前瞻性项目,变成了服务于抖音这一应用的技术团队。

马维英于2020年年中宣布离开字节跳动,回归学界加入清华大学智能产业研究院。同在该实验室担任总监的李磊和王长虎也于次年离职,其中李磊像马维英一样重返了学界,王长虎则于2023年投入视频生成模型领域的创业。

2024年6月开启大规模买量投流后,豆包月活跃用户(MAU)迅速超过竞争对手

字节重回AI核心3
数据来源:AI产品榜

随着核心团队成员的离开,字节AI L ab体系开始被进一步弱化和拆分。按照乐雁的说,他2020年加入AI L ab时这个部门还是字节跳动AI研究的核心部门,团队规模上百人。但次年,A I L a b重组,各个组被拆分到不同的业务线,比如图像视觉的一部分人就被划分到商业化团队下,为公司一些业务提供技术中台支持,如抖音的手势、肢体识别等AI功能。这次重组后,整个AI Lab只剩下不到50人,主要做一些偏学术方向的研究,比如机器人等,原先的视觉模型、自然语言处理等方向都已不存在。

张一鸣很早就意识到了AI在内容分发上的巨大潜力,不过他可能没有意识到AI在内容生产上的潜力更大,大到可能颠覆其基于内容分发技术构建的产品形态和竞争优势。目前,业内已有不少创业项目都在基于生成式AI构建新一代内容社区,其中既包括可能取代小红书的文字、图文社区,也包括可能颠覆抖音、TikTok的短视频社区。如果字节不能提供相似或更好水平的内容生产技术,用户很可能会转移至其他平台。毕竟社区的本质首先是为创作者提供创作工具,其次才是表达渠道,I nstagram、小红书、抖音的崛起,一再说明了这一点。

上一篇 点击页面呼出菜单 下一篇