阿里瞄准大模型
作者: 何己派 鄢子为“所有产品都值得用大模型重做一遍。”台上的张勇,语气笃定。
4月11日的阿里云峰会,张勇来了,一起亮相的,还有他的新身份。
这是他兼任阿里云智能集团CEO的第15天。
40分钟的演讲,张勇反复提及“人工智能”这个关键词。
他透露,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。
业务重塑,阿里云打响关键的一枪。
高调参战
人实在太多了。
可容纳几千人的会场,几乎没有空位。张勇演讲的半途,工作人员不得不临时增加了几列座椅。
所有人关注的重头戏,是阿里大模型的进展。
几日前,阿里突然上线“通义千问”,与ChatGPT类似,它是达摩院自研的超大规模语言模型,能回答问题、创作文字,表达观点、撰写代码。
《21CBR》记者使用邀请码,体验了多轮对话。
在功能上,它能生成散文、故事、文案等各种类型文本,做简单的数学题,也能编写代码。此外,对“鸡娃”等中文语境的词句,也有不错的理解。
阿里云智能CTO周靖人特别提到,通义千问还具备多语言能力,可以使用英语、法语等语言进行交流。
不过,它并不支持文生图、图生文等多模态功能。
对记者“是否能生成图像”的提问,通义千问的回答列举了OpenAI的GPT-3、DALL-E等工具,表示自己并不具备这个能力,“只能提供算法和模型,不能直接生成图像”。
不同于百度、360在现场演示对话,通义千问主要以周靖人的PPT展示+三个视频介绍来展现具体功能。
现阶段,该模型主要定向邀请企业用户测试,尚未向公众开放。
一位行业人士向《21CBR》记者分析称,阿里云没有直接推C端产品,而是先从企业级别开始,在于企业更容易接受新技术,且企业级别的应用场景更复杂,需要更高级别的技术支持。
在深度科技研究院院长张孝荣看来,阿里采取了谨慎务实的策略。
“GPT模型最先进,但出现不少bug。阿里云大模型技术完善度有限,面向企业市场测试,在舆论层面比面向大众安全,阿里云也可提早定位潜在客户。”
中间形态
负责研发迭代大模型的,是周靖人团队。
周靖人在微软工作多年,于2016年加入阿里,曾负责阿里云、淘宝和支付宝的搜索、推荐等业务。
周靖人表示,不是来凑热闹。“我们在这方面一直在积累,是国内最早探索大模型方向的公司之一。”
在他眼里,“通义千问”是一个中间态产品。“千问是我们既定路线上的一个节点。”
换言之,在阿里,这是一个承上启下、持续发展的大模型。
要训练出GPT-3.5这样的大模型,至少需要1万张英伟达A100的芯片集群,光硬件投入就需要20亿元。
只有大厂,才拥有这个硬件实力。
近日传出的一份交流纪要里,阿里云AI专家提到,阿里云在云上就有上万片的A100,整体能够达到10万片,集团体量应该是阿里云的5倍。
大规模应用,成本也高。“ChatGPT完成一个推理任务,需要5张A100在2秒钟之内做一次推理。”上述AI专家提道。
数据方面,阿里在电商、搜索、办公领域,有相应积累。算法方面,达摩院在NLP领域深耕多年,较早就确定了多模态方向。
达摩院于2019年启动大模型研发,2021年4月,发布语言大模型“PLUG”;2021年10月,训练出多模态M6大模型,参数规模10万亿。2022年9月,阿里发布“通义”大模型;今年4月,通义千问发布。
国盛证券分析师刘高畅测评后指出,通义千问具备基础常识与初步的逻辑思考能力,有代码书写能力,但在复杂理科计算方面仍有提升空间。
“当前未能达到GPT4的水平,但处于国内领军水平”。他评论道。
周靖人也承认,“GPT4,目前是非常领先的。”
阿里将在多模态大模型的路径上继续探索。
“难的是把各个模态的模型能力融入一个模型,比如怎么把视觉能力融入到语言模型里面。”
周靖人表示,这就像大脑,可以把视觉、语言、听觉等不同形式的输入联合在一起。
他还期待,企业能把通义千问作为底座,在上面进行额外的开发,走进各行各业的场景里去。
走向产业
去年底,张勇亲自接管阿里云。他对大模型的重视,非同一般。
有消息称,张勇尽管忙着重组集团业务部门,但会亲自盯阿里云的AI项目。
他格外关注AI与场景的结合落地。
2月底的财报电话会议上,张勇提到,“最重要的,不是大家拥有了一个对话式的机器人,而是如何将它融合在各自的业务场景中”。
未来,阿里巴巴所有产品都将接入大模型,率先接入测试的钉钉、天猫精灵,将在评估认证后正式发布新功能。
目前,钉钉与大模型融合场景正在测试中,将在相关安全评估完成后上线。4月中旬,钉钉总裁叶军演示了四个场景:群聊、文档、视频会议及应用开发。
以群聊为例,新入群者无需爬楼,在对话框输入钉钉斜杠“/”,即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程;还可以用“/”在群聊中创作文案、表情包等。
“我们也在同步测试钉钉个人版、搜索、邮箱、AI助理、智能客服等产品,让客户和生态基于钉钉PaaS底座的能力,更好地对接大模型。”叶军说。
淘宝天猫的电商业务,也有大量场景适合大模型切入。例如,以文搜图、智能客服、卖点文案生成等。
接下来,通义千问将嵌入阿里电商、搜索、导航、文娱等场景。
AI大模型的商业落地,还在于开放API接口,按调用次数收费,这也是国外主流的商业模式。
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每家企业打造自己的专属大模型。”周靖人表示,每个企业都可以有自己的智能客服、文案助手、AI设计师等。
前景美好,挑战也多。
大模型开发和训练一次的成本,介于200万美元至1200万美元之间,相当昂贵。
刚经历拆分的阿里,各业务单元独立经营、自负盈亏,大模型相关的成本开支压力不小。
行业来看,距离普惠化、规模化应用,大模型还需要走很长一段路。
天使投资人、互联网专家郭涛向《21CBR》记者表示:“AI大模型产业尚处于早期探索阶段,存在关键核心技术发展不成熟、算法模型不完善、训练数据缺乏及偏差、产业生态体系不健全等突出问题。”
问题多,机会更多。
张勇认为,智能化时代,大家都站在同一条起跑线上。