杨植麟:人工智能创业不是种一棵树,而是要承包一片森林

作者: 刘雪妍 王闲乐

去年3月,聚焦通用人工智能大模型研发的公司Moonshot AI月之暗面成立,10月即推出全球首个支持输入20万汉字的智能助手产品Kimi,在用户端和资本市场都引起了巨大的反响。在今年5月份举行的第五届上海创新创业青年50人论坛上,月之暗面创始人杨植麟分享了自己的创业经历与心得。

杨植麟:人工智能创业不是种一棵树,而是要承包一片森林0

很少有人知道,潜心钻研硬科技的背后,这个高材生儿时的梦想是做摇滚歌手和流浪诗人。他说:“创新的精神和摇滚的精神一样,都是用新东西带来新增量。计算机刚开始发展的时候,IBM是全世界最大、市值最高的公司,大家形容IBM既是太阳又是月亮又是星星,日月星辰都被它包揽了。当时微软只有几个人,但还是做出了颠覆式的创新成果。这可能是我们想要努力的一个方向。”

杨植麟正沿着自己设想的创业道路前进——去年成立的月之暗面,现在已经成为国内通用大模型领域的六家独角兽之一。今年2月19日,月之暗面完成了最新一轮的融资,金额超过10亿美元,刷新了国内AI领域最大单笔融资纪录。该轮融资过后,月之暗面的估值已达约25亿美元(约合人民币180亿元)。

蛰伏3年,做能处理更复杂问题的AI产品

1992年出生的杨植麟,本科毕业于清华大学计算机系,拥有卡耐基梅隆大学计算机专业博士学位,师从苹果公司前AI负责人,曾在Facebook AI Research(脸书人工智能研究)和Google Brain(谷歌大脑)工作,是中国35岁以下自然语言处理领域引用最高的研究者。

2019年,博士毕业后,杨植麟紧张筹备着回国创业计划。但直到2023年才开始在AI大模型领域创业。此前3年他蛰伏在其读博第二年(2016年)创立的循环智能,继续做着服务AI大平台的工作。

直到2022年下半年,ChatGPT用数周斩获上亿用户的辉煌战绩,宣告了大模型在2C领域的爆发。感到时机成熟的杨植麟于2023年3月1日,马不停蹄创立了大模型公司月之暗面,并用上了自己的英文名Kimi。像一只蛰伏了3年的猎豹,当猎物出现后,杨植麟选择了迅速出击。而Kimi 也开启了以月为单位的“光速”融资。当年6月,Kimi完成了超2亿美元天使轮融资。次年2月,Kimi完成超10亿美元A轮融资,红杉、阿里、小红书都是背后金主。另据阿里财报披露,该公司于2024 财年向月之暗面投资 8 亿美元,购入36%的股权。

kimi推出5个月后,其产品可支持的无损上下文长度限制从20万字提升到200万字,而GPT-4.5 Turbo也只能处理20万个单词。今年3月,Kimi月度访问量环比更是增长了321%,一度火到宕机。

优秀的互联网公司,历来用产品说话,杨植麟尤胜他的前辈。他认为传统互联网和AI产品最大的区别,前者是先设计后制造,后者是通过制造完成设计,比如让产品具备很强的in-context learning (情绪学习)的能力、instruction following(指令遵循)的能力,就是一个在制造中完成设计的过程。这些思考,很多源于创立kimi前的那段摸索与蛰伏。

在国内最早的大模型竞逐中,没有深度涉水的杨植麟甘愿充当配角:但别人走过的坎儿,踩过的坑,他一个也没拉下。或许也是基于此,kimi创立后出奇的顺遂。

杨植麟:人工智能创业不是种一棵树,而是要承包一片森林1

“技术的发展是非常神奇的,为什么2022年底发布的GPT-4可以成为里程碑?因为它能做到以前不可能做到的事。”杨植麟说,这其实是一个天时地利的结果,互联网发展二十多年,本身创造了很大的价值,但很有可能再过三四十年回头看,会发现互联网最大的价值是为AI积累了大量数据。此外,AI的出现还得益于硬件的进步,包括Transfomer(变压器)架构的提出以及半导体发展。

那么人工智能接下来的发展新方向是什么?在杨植麟看来,是要从回答简单的问题,发展到解决长链路的复杂任务,还要从完成1%的工作流到90%的工作流。“比如以一些非常专业的文档为基础,你接下来所有的学习过程都在人工智能中进行,就可以快速在一个新的领域成为专家,这也是非常重要的应用场景。”

究竟什么叫作处理更复杂问题的能力?杨植麟解释,比如在用人工智能分析一项研究进展时,它不仅要能知道是最新进展如何,哪些研究机构做得好,甚至可以直接编写代码、分析实验结果,还可以和实验者讨论接下来的研究方向。“也就是说,它不光可以被动地遵循你的指令,还可能给你提出挑战。你给它一个指令,如果指令本身有问题,它是可以跟你探讨,然后和你一起去工作的。”

爬楼梯,而不只是看风景

在创业的过程中,杨植麟学到的重要一课是——对创业公司而言,组织方式要能适应新的生产方式。而新技术往往又会很大程度上影响生产方式。

“大模型的开发方式和互联网有很大不同。互联网更多是规划式的发展,定好一个目标,接下来每一步要开发什么都是有序的,很少遇到因为某个技术瓶颈导致这个东西开发不出来。但大模型是涌现式的,比如说我们现在在产业的开端,做到了10的25次方的运算,接下来还要进行26、27、28次方的运算,但不知道到哪个节点会出现什么新的能力,所以要更多关注基础能力,让模型不断涌现出来。”他说,对应的生产方式的变化就是,不是在一个地方种一棵树,而是要直接把整片森林承包下来。

他关于创业的另一个重要领悟,就是要“爬楼梯,而不只是看风景”,也就是要在商业化和技术发展之间取得平衡。“我们现阶段的重要目标是不断去提升模型的能力,探索智能的上限,给用户带来更好的体验,这是我们第一个目标,也就是‘爬楼梯’。我们希望能更多把优先级放在‘爬楼梯’上,而不仅仅只是‘看风景’。”

近期,月之暗面旗下大模型产品Kimi新增了“Kimi+”功能,覆盖了办公、娱乐、生活实用等多个场景。“技术的发展可以定义新的问题和新的场景。”杨植麟介绍,他们最近还在持续迭代,深入更多专业场景和生活场景。随着新用户的不断加入,他们接下来要进一步提升用户体验,降低产品的使用门槛,让产品发挥更大价值。“我们跟用户走得很近,通过用户的反馈也能知道哪些地方还有可能提升的空间。”

杨植麟的创业路看似一帆风顺,但他笑说,挫折基本上是以“天”为单位出现的,“每天都可能遇到研发的问题、招人的问题、融资的问题,我们克服了很多困难走到现在,很重要的原因是有包容的环境,有人才和资源的支持。”

从摇滚到创业,全身带着颠覆劲儿

巨大的商业成功,将杨植麟推入了全球大模型领军人物的序列。

不少人将他看作李彦宏“第二”。他们的人生的轨迹确实有些相似:学霸、海龟、技术大拿、海外从业经历,李彦宏31岁创立百度,如今杨植麟也31岁。

更重要的是,两者都身处大模型赛道,都坚信闭环的价值。李彦宏头顶中国大模型“第一人”光环,杨植麟则是Transformer-XL与XLNet两篇重要论文的第一作者,两者均涉及大语言模型领域的核心技术。

就财富而言,杨植麟在李彦宏面前还算后浪,但这个年轻人身上已经具备了独特的个人魅力。杨植麟之所以屡屡被资本看中,或许在于其从内而外散发的那股不按常理出牌的“颠覆劲儿”:不断反叛、并打破常规。

高中时,没有任何编程基础的他被选进信息学奥林匹克竞赛培训班,之后杨植麟在全国青少年信息学奥林匹克联赛中夺得广东赛区一等奖,因此获得清华大学保送生资格。但这年,杨植麟还是凭自己努力在高考中拿下了667高分,远超清华大学在广东的录取线。

最初,杨植麟在清华热能工程学的好好的,但大二时他又决定转入计算机系。这个决定,是其科研与创业的前提。

此外,作为第一作者,杨植麟发表的XLNet也在20项任务上超越了Google BERT,还被多家媒体评为2019年全球最重要的论文top 10。这篇论文,也是2019年度全球所有NLP论文中引用数量最高的(截至2020年6月)。

除了有出色的学业成绩及科研成果,杨植麟还是校园摇滚乐队Splay的创始人,曾晋级清华大学校园歌手大赛原创决赛。这让人深感惊叹:“学霸怎么还有时间去玩乐队?”

实际上,求学过程中,杨植麟并非“书呆子”,无论是高中或是大学,他都会花时间练习打鼓并加入校园乐队,他说,“打鼓是我生活不可或缺的一部分。我开心时喜欢打鼓,压力大时也会以此减压。”

“该拼的时候要拼,该玩的时候要玩,能尽量花最少的时间,做最有质量的事情”,杨植麟说,不管是学习还是个人兴趣爱好,只要认定了就一定投入百分之百的努力。在杨植麟眼里,学习并不是生活的全部,求学最重要的是多实践,并且多与不同文化、不同领域的人交流,体验各种新鲜的事物,拓宽自己的视野。

当然对杨植麟而言,摇滚不算一个梦,它的精神本质与创业相通。他甚至认为,对自己(人生)启发最大就是摇滚。而摇滚和创业都代表了一种反叛和打破常规的精神。一如月之暗名最核心本质的内涵:创新、长久、第一性原理。

上一篇 点击页面呼出菜单 下一篇