阿里瞄准大模型

“所有产品都值得用大模型重做一遍。”台上的张勇，语气笃定。

4月11日的阿里云峰会，张勇来了，一起亮相的，还有他的新身份。

这是他兼任阿里云智能集团CEO的第15天。

40分钟的演讲，张勇反复提及“人工智能”这个关键词。

他透露，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造。

业务重塑，阿里云打响关键的一枪。

高调参战

人实在太多了。

可容纳几千人的会场，几乎没有空位。张勇演讲的半途，工作人员不得不临时增加了几列座椅。

所有人关注的重头戏，是阿里大模型的进展。

几日前，阿里突然上线“通义千问”，与ChatGPT类似，它是达摩院自研的超大规模语言模型，能回答问题、创作文字，表达观点、撰写代码。

《21CBR》记者使用邀请码，体验了多轮对话。

在功能上，它能生成散文、故事、文案等各种类型文本，做简单的数学题，也能编写代码。此外，对“鸡娃”等中文语境的词句，也有不错的理解。

阿里云智能CTO周靖人特别提到，通义千问还具备多语言能力，可以使用英语、法语等语言进行交流。

不过，它并不支持文生图、图生文等多模态功能。

对记者“是否能生成图像”的提问，通义千问的回答列举了OpenAI的GPT-3、DALL-E等工具，表示自己并不具备这个能力，“只能提供算法和模型，不能直接生成图像”。

不同于百度、360在现场演示对话，通义千问主要以周靖人的PPT展示+三个视频介绍来展现具体功能。

现阶段，该模型主要定向邀请企业用户测试，尚未向公众开放。

一位行业人士向《21CBR》记者分析称，阿里云没有直接推C端产品，而是先从企业级别开始，在于企业更容易接受新技术，且企业级别的应用场景更复杂，需要更高级别的技术支持。

在深度科技研究院院长张孝荣看来，阿里采取了谨慎务实的策略。

“GPT模型最先进，但出现不少bug。阿里云大模型技术完善度有限，面向企业市场测试，在舆论层面比面向大众安全，阿里云也可提早定位潜在客户。”

中间形态

负责研发迭代大模型的，是周靖人团队。

周靖人在微软工作多年，于2016年加入阿里，曾负责阿里云、淘宝和支付宝的搜索、推荐等业务。

周靖人表示，不是来凑热闹。“我们在这方面一直在积累，是国内最早探索大模型方向的公司之一。”

在他眼里，“通义千问”是一个中间态产品。“千问是我们既定路线上的一个节点。”

换言之，在阿里，这是一个承上启下、持续发展的大模型。

要训练出GPT-3.5这样的大模型，至少需要1万张英伟达A100的芯片集群，光硬件投入就需要20亿元。

只有大厂，才拥有这个硬件实力。

近日传出的一份交流纪要里，阿里云AI专家提到，阿里云在云上就有上万片的A100，整体能够达到10万片，集团体量应该是阿里云的5倍。

大规模应用，成本也高。“ChatGPT完成一个推理任务，需要5张A100在2秒钟之内做一次推理。”上述AI专家提道。

数据方面，阿里在电商、搜索、办公领域，有相应积累。算法方面，达摩院在NLP领域深耕多年，较早就确定了多模态方向。

达摩院于2019年启动大模型研发，2021年4月，发布语言大模型“PLUG”；2021年10月，训练出多模态M6大模型，参数规模10万亿。2022年9月，阿里发布“通义”大模型；今年4月，通义千问发布。

国盛证券分析师刘高畅测评后指出，通义千问具备基础常识与初步的逻辑思考能力，有代码书写能力，但在复杂理科计算方面仍有提升空间。

“当前未能达到GPT4的水平，但处于国内领军水平”。他评论道。

周靖人也承认，“GPT4，目前是非常领先的。”

阿里将在多模态大模型的路径上继续探索。

“难的是把各个模态的模型能力融入一个模型，比如怎么把视觉能力融入到语言模型里面。”

周靖人表示，这就像大脑，可以把视觉、语言、听觉等不同形式的输入联合在一起。

他还期待，企业能把通义千问作为底座，在上面进行额外的开发，走进各行各业的场景里去。

走向产业

去年底，张勇亲自接管阿里云。他对大模型的重视，非同一般。

有消息称，张勇尽管忙着重组集团业务部门，但会亲自盯阿里云的AI项目。

他格外关注AI与场景的结合落地。

2月底的财报电话会议上，张勇提到，“最重要的，不是大家拥有了一个对话式的机器人，而是如何将它融合在各自的业务场景中”。

未来，阿里巴巴所有产品都将接入大模型，率先接入测试的钉钉、天猫精灵，将在评估认证后正式发布新功能。

目前，钉钉与大模型融合场景正在测试中，将在相关安全评估完成后上线。4月中旬，钉钉总裁叶军演示了四个场景：群聊、文档、视频会议及应用开发。

以群聊为例，新入群者无需爬楼，在对话框输入钉钉斜杠“/”，即可自动整理群聊要点，快速了解上下文，并生成待办、预约日程；还可以用“/”在群聊中创作文案、表情包等。

“我们也在同步测试钉钉个人版、搜索、邮箱、AI助理、智能客服等产品，让客户和生态基于钉钉PaaS底座的能力，更好地对接大模型。”叶军说。

淘宝天猫的电商业务，也有大量场景适合大模型切入。例如，以文搜图、智能客服、卖点文案生成等。

接下来，通义千问将嵌入阿里电商、搜索、导航、文娱等场景。

AI大模型的商业落地，还在于开放API接口，按调用次数收费，这也是国外主流的商业模式。

“未来所有软件都值得接入大模型升级改造，我们将开放通义千问的能力，为每家企业打造自己的专属大模型。”周靖人表示，每个企业都可以有自己的智能客服、文案助手、AI设计师等。

前景美好，挑战也多。

大模型开发和训练一次的成本，介于200万美元至1200万美元之间，相当昂贵。

刚经历拆分的阿里，各业务单元独立经营、自负盈亏，大模型相关的成本开支压力不小。

行业来看，距离普惠化、规模化应用，大模型还需要走很长一段路。

天使投资人、互联网专家郭涛向《21CBR》记者表示：“AI大模型产业尚处于早期探索阶段，存在关键核心技术发展不成熟、算法模型不完善、训练数据缺乏及偏差、产业生态体系不健全等突出问题。”

问题多，机会更多。

张勇认为，智能化时代，大家都站在同一条起跑线上。

高调参战

中间形态

走向产业

经典小说推荐

杂志订阅