ChatGPT 类生成式人工智能对数字内容产业的影响研究
作者: 韦萧霞 章亦菲 付新阳 钱涵沁 贾明艳
摘要:【目的/意义】ChatGPT 是新时代的生成式人工智能,对我国的经济生活产生深远影响。【方法/过程】基于知识管理内涵,依据部分ChatGPT 类生成式人工智能以及数字内容产业的深入调查,采用文献调研法对其在数字内容产业方面进行探索分析。【结果/结论】加快推进AI 背景下我国数据安全监督、探索多技能路线、建立新型风险监测机制,成为新形势下在数字内容平台上合理有效地运用生成式人工智能的必然选择。
关键词:数字内容;生成式人工智能;ChatGPT
中图分类号:TP37 文献标识码:A
文章编号:1009-3044(2024)06-0014-04
0引言
ChatGPT类生成式人工智能是能够自动生成内容的智能模型,它是人工智能1.0时代进入2.0时代的重要标志,对多个领域产生了深远影响,包括传媒、艺术、设计等。学者们对于生成式人工智能的界定与分类,因研究视角和研究目标的不同而有所差异,借鉴已有文献并结合发展实践,本文认为研究ChatGPT类生成式人工智能可以深入了解技术发展趋势,促进产业创新以及探讨人工智能与人类创造力的关系等。通过文献梳理分析发现,当前生成式人工智能在数字内容平台上应用上面临着数据泄露、生成内容滥用等突出问题。因此加快推进AI背景下我国数据安全监督、加大对数据质量评估的关注成为新形势下在数字内容平台上合理有效运用ChatGPT类生成式人工智能的必然选择。
1 文献综述
1.1 生成式人工智能相关研究
2023年8月31日,“生成式人工智能”一词首次在第52次《中国互联网络发展状况统计报告》[1]出现,定义为“指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。”综合《中国互联网发展状况报告》《新媒体发展研究报告》对生成式人工智能的定义及对其研究现状的分析可知,生成式人工智能采取“大数据预训练+小数据微调”的训练模式[2],基于海量数据语料,以实现深层挖掘与价值模仿。其次,多模态加工技术是生成式AI创建广泛内容的基础[3],使人工智能在不同类型的信息模态之间进行转换、映射和生成,包括图像、视频、音频、文本、合成数据乃至元宇宙[4]。目前,生成式人工智能在多个领域都展现出了巨大潜力,其基于深度学习技术创造性和多样性生成能力为人工智能的发展开辟了新的方向。然而,生成式人工智能也面临着一些挑战,如生成内容的真实性、多样性和控制性等问题,这些问题也将是未来的重要方向。
1.2 数字内容产业相关研究
我国台湾地区在《2004台湾数位内容产业白皮书》中将数字内容产业定义为:“将图像、文字、影像、语音等内容,运用信息技术进行数字化并加以整合运用的产品或服务。”数字内容产业变革了传播业态,实现内容传播的数字化转型,增添市场动能,增强用户体验。周志平[5]认为我国数字内容产业起步虽晚,但发展势头很猛。数字内容产业在发展中遇到资金短缺、人才匮乏等问题,并提出加强管理理念创新、牢固树立“内容为王”的创新理念等对策。张立、吴素平[6]认为数字内容产业发展趋势为市场规模持续增长,提升现有用户价值或新的增长动力等方面。熊澄宇、孔少华[7]认为数字内容产业的发展动力包含:技术创新、传播扩散、资金流转和政策推动等4个方面。未来产业竞争重点将集中在国际化、版权保护以及高端数字内容企业扶持等方面。
1.3 生成式人工智能与数字内容产业应用的现状研究
在数字内容产业中,生成式人工智能的应用已经非常广泛。曼纽尔[8]认为NLP和AI的发展,为传媒产业带来了新的机遇和挑战。目前全球拥有生成式人工智能初创技术的大型公司有6家,共持有23项生成式人工智能模型。郭小平、段琳杉[9]认为生成式人工智能将提升新闻生产效率、生成全新写作风格、重构媒介形态、助力内容筛查和审核,同时也存在着著作权制度框架遭遇冲击等风险。王渝博、李泰然[10]阐述了生成式人工智能技术工具的特点:Midjourney可应用于影视作品创作前期,Dramatron能帮助创作者构建初步剧本框架,Gen-2能通过AI技术来驱动整个视频创作流程,同时还具有在复杂场景中抠像等多元功能。赵瑜、张亦弛[11]提出生成式人工智能运用在影视行业存在缺乏连贯性、需要人机互补、触犯法律风险等突出问题。
2 生成式人工智能与数字内容产业的发展现状
2.1 生成式人工智能的发展现状
1)应用市场广泛。随着自然语言处理等方面性能的提升和,生成式人工智能的应用逐渐落地,推动AI技术迎来加速发展的新时代。目前生成式人工智能已经在学术研究和技术应用上取得了突破性进展。在自然语言处理领域,生成式人工智能已能覆盖较多领域,包括生成质量较高的自然语言文本,以及在对话系统、机器翻译、文本摘要等领域得到应用。例如OpenAI 公司于2020 年提出的第3 代文本生成模型(Generative Pre-trained Transformer, GPT-3)。凭借其非凡的模型能力、多任务的泛化表现以及小样本学习能力,入选了2021年MIT Technology Review的“全球十大突破性技术”。其发布的ChatGPT自然语言处理模型自公开发布以来,在5天内就吸引了超过百万用户,在一个月内拥有了超5 000万活跃用户,引发了生成式人工智能的研究热潮。
2)市场规模与经济价值提升。生成式AI重塑了人机交互实践与协同发展的路径,依靠大模型、大训练数据模型的进步与突破,降低人力成本,提高生产效率,带来不可估量的经济价值。2022年中国生成式人工智能市场规模约为660亿元人民币,2020—2025 年的复合增速将近84%,中国的生成式人工智能正处于高速增长期,预计2025年中国人工智能市场将占全球市场规模的13%。
2.2 数字内容产业发展的发展现状
1)市场规模保持快速稳定增长。《报告》显示,截至2023年6月,我国网民规模达10.79亿人,较2022年12月增长1 109万人,互联网普及率达76.4%。数字内容产业是随着信息技术和数字经济发展催生出的一个快速发展中的产业。全球数字内容市场规模快速增长,根据市场研究公司(Research and Markets)的预测,2020—2024 年,全球数字内容市场将增长5198.3 亿美元,其间年复合增长率为15%。而近10 年,中国数字内容产业市场规模不断增长,且持续保持在10%以上的水平。据中国信息通信研究院(简称“中国信通院”)发布的《中国数字经济发展白皮书(2023)》报告数据显示:中国数字经济增加值规模已由2005年的2.6161万亿元,扩张到2022年的50.2万亿元,同比增长10.3%,已连续11年显著高于同期GDP 名义增速,数字经济占GDP比重达41.5%。
2)内在结构与业态模式不断发展完善。中国数字内容产业正不断优化完善内在结构。网络新闻媒体和网络游戏作为当前中国数字内容产业核心业态,市场规模占比较大,近年来保持稳定发展。同时,新生细分业态的增长也呈现出强劲态势。我国以网络购物、网络直播、网络短视频、在线教育、在线医疗等为代表的新型业态模式正迅猛发展。
2.3 生成式人工智能应用于数字内容产业的发展现状
1)生成式人工智能应用层多模态。数字内容产业是生成式人工智能融入的典型行业和场景之一,如图1所示。生成式人工智能通过自然语言处理和机器学习技术,自动化、智能化地编辑数字内容,检查文本错误、自动排版、识别图片等,提高内容生产的效率和质量,降低数字内容生产的门槛,使更多的人能够快速、高效地创造数字内容。在传媒和影视方面,生成式人工智能带来的人机协同生产实现智能新闻写作、海量数据分析归纳、快速生成剧本,赋能智能视频剪辑、场景创作空间等。在娱乐方面,通过生成式人工智能技术扩展辐射边界,实现趣味性图像或音视频生成。或以AI换脸为代表的生成式人工智能应用在很大程度上满足了用户的好奇心和猎奇心理,成为行业中的破圈利器。或打造虚拟偶像,释放IP价值。除此还有开发C端用户数字化身,布局消费元宇宙。百度在2020年世界互联网大会上展示了基于AI技术设计的动态虚拟人物能力,包括3D虚拟形象生成和虚拟形象驱动等。
2)生成式人工智能或将成为数字内容生产新引擎。随着数字经济的快速发展,其与实体经济的深度融合提升了网民对数字内容总量和质量的要求。面对持续快速增长的国内数字内容的消费需求端,PGC、UGC数字内容生产模式逐渐无法满足。而生成式人工智能的注入,作为供给端的有效工具,赋能数字内容生产的各类场景和内容创作者,辅助用户执行信息采集、复刻编辑等任务,同时推动数字内容与其他产业的多维度交互、融合,对数字内容生产产生积极影响。
2.4 挑战
2.4.1 对生成式人工智能的认知偏差侵犯人的自主性权利
生成式人工智能需要大量训练数据,如果数据不足或偏差,输出结果可能偏移,甚至会对某些群体产生歧视。只是从海量数据中训练生成的文本只是数据组合,不应被视为知识产生者。可能引发不当认知,将其视为知识道德权威的风险。因为生成式人工智能不能真正认识到其生成的文本内容的含义,也不能对是非对错进行判断,所以有时会出现荒唐的文本组成的错误。导致错误的引导。人类在使用生成式人工智能时若未意识到其是建立人与人之间智能生态系统,全球智慧社会体系之上,便无法看到人类智慧自动产生的根本和先决条件。这不仅涉及知识与智慧的再界定,还涉及生态环境、社会与个体重建。若缺乏反思,可能陷入图灵陷阱,无条件采用自动化生成知识,过度取代人类智能,导致生态环境不堪重负。图灵陷阱源于智能与自动化系统未将人放在第一位,而是强迫人接受它,剥夺人的自主性。
2.4.2 行政监管风险对国家及公民带来的不利影响
1)数据合规风险。我国的数据合规体系由网络安全法、数据安全法和个人信息保护法共同构建。生成式人工智能数据合规风险包括数据来源不稳定、个人权益受影响、数据爬取涉及侵权行为、泄露商业信息、构成不正当竞争。
2)生成内容滥用风险。生成式人工智能可以通过运用本身强大的算力,制造虚假的文章、新闻等造成与事实违背的错误。例如2023年4月,澳大利亚一市长因ChatGPT在聊天过程中诽谤其在一桩贿赂丑闻中有罪,侵犯了个人权益,扰乱网络传播秩序和社会秩序,给当前的网络治理工作带来了极大的困难。
3)人格权侵权风险。根据过去的案例,GPT二代曾因换脸换声的欺诈、人格权侵权、隐私泄露等案件引发了广泛的安全挑战。在以ChatGPT为代表的生成合成类应用中,用户在进行对话的过程中,个人信息如身份信息、地理位置、偏好等也会被收集。尤其是当用户与机器进行交互时,个人隐私的风险会更大。这些个人信息可能被用于创建用户画像并训练模型,因此,在收集、使用和传输个人信息的过程中,安全问题必须得到充分重视。
4)著作权侵权风险。生成式人工智能是一种重组式创新,它还不具备真实的创造性,所以它并不是著作权的主体,同时对于那些拥有独创性的人工智能产品也不能忽略,可以参考关于职务作品或雇佣作品的规则,在创作过程中,对那些确实进行了人工干预、人为编排或创造出这个算法的人,都被认为是作者。就生成式人工智能而言,要视有没有人利用人工智能进行创作,以及他们在创造过程中是否投入了智力劳动或创造劳动。
2.4.3 关键技术及企业核心能力有待发展
1)关键技术不够完全成熟,大规模推广落地尚存痛点。AI算法仍存在缺陷。在透明度方面,黑箱运作机制的存在使得人工智能算法的生成机理不易被人类理解,算法出现错误时,将阻碍外部观察者进行纠偏错误。而在鲁棒性方面,其容易受到数据、模型以及其他因素干扰,出现非鲁棒性特征。生成式人工智能内容编辑与创作技术不够完善。文本生成方面,模板式生成导致文本结构雷同。语音合成方面,语音表达不够流畅、声音机械。视觉生成方面,精准度、还原度、仿真度不周全,需后期人工标注。