AI新纪元

作者: 王锐

AI新纪元0

当地时间2023年2月7日,微软正式发布了自己的“新必应”,一个集成ChatGPT 的新版搜索引擎。“新必应”最值得关注的技术突破就是它运行的是 OpenAI 专门为搜索服务定制的下一代大型语言模型,比ChatGPT 更强大。这个名叫“普罗米修斯”的模型可以提高回答的相关性,进一步注释答案,更新搜索结果等等。

由人工智能研究实验室OpenAI推出的ChatGPT横空出世,在全球掀起了人工智能(AI)的新浪潮,开启了AIGC(AI Generated Content,人工智能生成内容)新纪元。

上线仅5天,ChatGPT就收获了100万用户;推出不到两个月,ChatGPT的用户日活量就突破1000万。而根据瑞银集团研究报告显示,ChatGPT在2023年1月末月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。

2月1日,OpenAI推出ChatGPTPlus订阅计划,每月价格为20美元,增值服务包括高峰时段免排队、快速响应、优先获得新功能访问权等,订阅计划的推出进一步打开商业空间。同时,OpenAI仍将继续向消费者提供ChatGPT免费试用。

与其他AI交互机器人不同,ChatGPT可以更好地理解人类意图,并进行专业性回答,这得益于ChatGPT在GPT3.5的基础上增加了人类反馈强化模型,引入“人工标注数据+强化学习”来反复训练模型。

当前,微软、谷歌、百度等国际国内互联网巨头纷纷入局AIGC产业,微软CEO纳德拉称“AIGC堪比工业革命”,比尔·盖茨评价ChatGPT的历史意义重大甚至不亚于PC或互联网诞生。随着AI技术的迭代发展,AIGC在变革内容产业的同时,将与搜索、办公、教育、金融、医疗、工业、影视、游戏等行业结合,进一步拓宽AI应用场景,加速AI商业落地。

随着AI与下游场景加快融合,同时叠加政策对行业支持,国内AI市场规模有望持续高增。据工信部的相关数据,截至目前,中国AI核心产业规模超过4000亿元,企业数量接近4000家,带动相关产业规模超数万亿元,并将持续快速增加。

招商证券表示,从ChatGPT的流行AIGC已经成为AI技术发展的新趋势,与传统AI技术变现困难不同,ChatGPT采用SaaS订阅的创新收费模式打破了人们对于AI技术大多应用于嵌入式项目的固有印象,拓宽了AI企业的商业模式。AIGC商业空间将进一步打开,不仅B端用户对AIGC技术存在高需求,未来C端用户对AIGC技术的付费有望成为常态化,产业链相关企业将迎来价值重估。

颠覆性变革

根据长江证券的研报,人工智能的发展经历了三次“浪潮”起伏。

第一次浪潮(20世纪50-70年代):人工智能起步阶段,首次提出人工智能概念及少数成果,但由于算法理论薄弱及计算机性能缺陷导致无法支持应用推广。

第二次浪潮(20世纪80-90年代):以专家系统和日本第五代计算机为代表,专家系统的出现推动人工智能从理论走向部分实际应用,例如医疗、气象、地质等领域。但由于专家系统推理方法单一、数据量匮乏导致人工智能发展受限,再度进入停滞。

第三次浪潮(2000年以后):信息技术的蓬勃发展带来了行业数据量的爆发以及新型人工智能芯片的进阶,为人工智能的发展提供基础条件。同时理论算法不断沉淀,以机器学习、深度学习为代表的算法,在互联网、工业等领域取得了较好的应用效果,并且在图像识别、语音识别、自然语言处理等细分领域取得巨大进步。

深究人工智能技术发展的驱动力,由算法、算力和数据三大要素构成,学习算法的设计,决定设计出的“大脑”够不够聪明(模型的革新);要有高性能的计算能力,可以训练一个大的网络(芯片的革新);必须要有大数据(信息技术的发展)。

而以ChatGPT为代表的AIGC兴起,在内容创作成本、创作效率、模型计算消耗、用户流量基础等维度实现了重大突破,有望推动AI商业化进程的大幅加速。

AIGC是继专业生产内容(PGC)、用户生产内容(UGC)之后诞生的,利用AI技术自动生成内容的新型生产方式,其特点是高效性和自动化生产。随着自然语言生成技术NLG和AI模型的成熟,AIGC开始受到大规模的关注,如微软、谷歌、英伟达等多家科技巨头纷纷布局AIGC技术和应用。

在AIGC场景下,AI可以灵活运用于写作、编曲、绘画和视频制作等创意领域。据TBanicDate估计,到2025年人工智能生成数据占比将达到10%。目前AIGC技术可以自动生成文字、图片、音频、视频,甚至3D模型和代码,在搜索引擎、艺术创作、影音游戏,以及金融、教育、医疗、工业等领域的应用前景十分广阔。

兴业证券认为,AIGC反映出AI的角色正在改变,即从“效率工具”到“生产工具”的颠覆性变革。AIGC能够以类似人类甚至优于人类的知识水平、制造能力承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求。长期来看,AIGC在提高各行业内容创作效率的同时,更有可能孕育出更多的新业态、新模式。

华西证券表示,尽管此前StableDiffusion、Midjourney等AI绘画应用已经落地,但注册及使用门槛仍相对较高。而ChatGPT的对话机器人属性及免费试用窗口期使其能够广泛触达用户,瑞银数据显示上线两月用户数已突破1亿,系目前用户增长最快的消费应用,2023年1月推出付费订阅版,每月价格20美元。ChatGPT之于OpenAI,可以对标AlphaGo和AlphaFold之于DeepMind,开启了AIGC认知普及的一大步,是AIGC内容批量规模化生产的起点。

ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新一代聊天机器人模型,使用的模型与两年前发布的GPT-3底层数据和参数规模一致。

华西证券认为,GPT-3是GPT系列第三代语言预测模型,ChatGPT是从Instruct GPT(GPT-3.5)系列中的一个模型进行微调,相较于Instruct GPT,ChatGPT效果更加真实(拥有非常强的泛化能力和生成能力),模型的无害性实现些许提升(生成带有有害、歧视、偏见等情况的有问题样本的概率本身就会很低),编码能力更强(在GPT-3积累的大量Coding代码基础上,部分OpenAI内部员工参与了数据采集工作)。

图1:各应用达到1亿用户所需要的时间(单位: 月)

AI新纪元1
数据来源:澎湃,中泰证券研究所

图2:生成式AI 的市场规模(十亿美元)

AI新纪元2
数据来源:Precedence Research,中泰证券研究所

相较于进一步扩大原有的数据规模,ChatGPT采取了升级训练方式的办法,利用人类反馈的知识,对模型进行强化修改,同时对原有数据略作改良,优化语言模型,对AI的回答方式及答案存在的局限性进行更新,实现了计算机“数据”与人类“知识”的突破性结合。

ChatGPT可通过自然对话方式交互,也可完成生成文本、自动问答等复杂语言任务,在各类AI文字处理的任务中表现出色,体现出较高的实用价值。放眼未来,ChatGPT产品有望通过不断迭代逐步实现人机协同,核心技术的投入、算力、算法的通用化、更专业的人为标注(行业know-how)可以使得新场景的应用更加快速,能够加速各个行业的智能化升级,边际效用实现增长。

中泰证券表示,ChatGPT的爆火一方面是AI经历多年技术沉淀后的里程碑式事件;另一方面它的影响力已经满足革命性技术的一个重要标志,可能引领大量的应用重做已经生活方式的变革。如AI接入设备,释放大量的生产力,或是改变使用传统搜索引擎的习惯,对内容产业进行革新。

OpenAI 首席执行官称,GPT-4有望成为多模态的人工智能,根据OpenAI 创始人Altman消息,参数预计更大,计算模型优化有望实现更优化,且GPT-4将是纯文本模型(不是多模态)。华西证券认为,GPT-4的推出潜在商业价值巨大,模型更具备“拟人化”的功能,文本生成和内容创作有望更加丰富,并有望进入文字工作的相关领域,例如新闻、金融等相关行业。

大模型时代

根据目前学界的观点,一个理想的语言模型,应该具备以下性质:具备强大的自主学习、消化知识的能力,其学习过程不需要人为介入;能够很好地理解人类指令,习惯人类的表达方式;能够正确、清晰地给出问题的回答。

可以说,ChatGPT在这三个方面的综合水平上,相比它的前辈们,取得了突破性的成就。GPT-3模型诞生于2020年6月(Language Modelsare Few-ShotLearners),此前自然语言处理(NLP)领域的主流技术是深度学习模型。但是随着GPT和BERT等两阶段预训练模型诞生后,NLP领域的研究范式出现了快速切换,海内外大量科技公司选择了以BERT为代表的双向预训练+Fine-tuning的模式。但与此同时,还有另一条技术路线,那就是OpenAI选择并坚持至今的自回归预训练语言模型+Prompting的模式。

ChatGPT成功的背后离不开数据、模型和算力。数据方面:从2018年的GPT到2020年的GPT-3,算法模型上没有太大的改变,主要的改变在于参数量和数据量。模型的参数量从1.17亿个增加到1750亿个,预训练数据量从5GB增加到45TB。

模型方面:ChatGPT在GPT-3.5的基础上增加了人类反馈强化模型,引入“人工标注数据+强化学习”来训练模型,可以更好地与人类进行专业性交流。

算力方面:GPT-3.5在AzureAI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。

兴业证券认为,大模型的算法复杂度、高训练成本造就较高的进入壁垒。模型是AI的灵魂,本质上它是一套计算公式和数学模型,“参数”可以看做是模型里的一个个公式,这意味着,参数量越大、模型越复杂,做出来的预测就可能越准确,目前业界主流的AIGC模型都是千亿级参数量的水平。据Gartner技术成熟度曲线,当前生成式AI仍处于技术萌芽期,新进入者若希望在类ChatGPT产品上做布局的话,在大模型设计、模型训练、应用场景落地等维度均需要加大投入。

申万宏源表示,相比小模型,首先大模型最核心区别在于参数量,例如GPT-3参数量达到了1750亿个,是传统深度学习小模型参数量的至少一万倍以上。通过模型的扩大,可以带来提升包括:

一是GPT-2等大模型舍弃了小模型中常见的调参Fine-Tuning过程,转向容量更大、无监督训练。

二是在自然语言理解NLP中,常见任务包括翻译、问答、文本填空等,常见小模型需要对不同的任务使用不同模型分别训练解决,而GPT-3等大规模预训练模型不再规定任务,而是对以上不同任务都有较好效果;可以理解为,一个饱读诗书的人,应该会写作、对话、阅读理解等多种技能,而不需要对单独技能训练。

上一篇 点击页面呼出菜单 下一篇