大数据和人工智能技术背景下文科生数据思维培养研究
作者: 陈春凤 李荣远
关键词:人工智能;大数据;数据思维;终身学习
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2024)18-0111-03
0 引言
随着大数据、云计算、互联网及人工智能的飞速发展,新兴产业技术正引发行业变革。特别是近年来,2022年11月,OpenAI公司发布了ChatGPT[1](Chat Generative Pre-trained Transformer:聊天生成预训练转换器)。ChatGPT具备模仿人类对话的能力,能根据不同文人风格创作诗歌和歌词,进行音乐和小说创作、代码生成等,其功能在某些方面甚至超过普通人类[2]。ChatGPT已经在学术界、政府、企业和教育界等广泛应用。2023年3月14日,OpenAI发布了更强大的GPT- 4,GPT-4在准确性和创造力上优于ChatGPT[3]。而在2024年2月15日,OpenAI进一步发布了Sora(一种新的人工智能模型),能够通过文字描述生成高质量、一分钟长的多种高清视频[4],展示了在视频生成的质量、连贯性和细节方面的显著进步。这些新兴技术正在颠覆传统行业,并在2022年至2023年间导致许多行业出现失业问题。新兴技术的核心驱动力在于大数据的积累,这场技术变革的本质由数据思维能力主导。早期大数据和人工智能技术的积累已经为今天的变革奠定了基础。人类必须积极拥抱变化,才能适应社会的发展。
当前,新兴技术的发展对文科生专业的变革带来了巨大影响。文科生的培养理念——“新文科”,早在2017年由美国希拉姆学院提出。随后,2020年,教育部发布了《新文科建设宣言》,标志着高等院校新文科建设的正式启动。新文科建设的目标是将新理念、新思维、新技术、新方法融入传统文科教育,以提高学生的科学素养、逻辑思维和系统分析能力[5]。新文科建设强调技术的应用,实现多学科交叉,为解决知识教育中传统文化知识与科学文化知识冲突的问题提供了契机[6]。文科生如何将新文科理念与大数据技术结合起来,已成为未来发展的刚需。
数据思维的核心在于数据,尤其是大数据,只有在大量数据的积累下,数据思维才能可靠。当前互联网5G技术的快速发展产生了海量数据,这些数据对于互联网公司来说是一笔巨大的财富,挖掘其中的潜在价值是关键。然而,目前大数据领域的人才需求严重短缺。根据2020年的《中国大数据产业发展报告》,我国从事大数据领域的人员约为131.6万人,但对于大数据领域的稀缺职位需求多达数百万人。
当前人工智能(Artificial Intelligence:AI) 朝着通用人工智能(Artificial General Intelligence:AGI) 的方向发展,新文科建设必须拥抱AGI,数据思维是通向AGI的前提。培养学生的数据思维能力有助于培养更符合行业需求的创新型人才[7]。相比理科生,文科生更具语言优势,掌握数据科学思维能力为国家未来发展战略提供建设性指导。抓住大数据发展的契机,提高文科生的数据思维能力,为高校培养高质量人才,实现新文科发展具有重要意义[8]。
1 文科生教学普遍现象——以中国现当代文学为例
1) 教师教授及教材内容滞后。相比于理科生的教学,文科生的教材更新较为滞后。理科课程由于技术迅速更新迭代,相应的教材也随之更替。然而,文科教材多年来沿用相同的书籍。虽然这些经典文学作品具有重要意义,但其学术性较强,学生在学习过程中往往感到枯燥乏味,缺乏兴趣[9]。此外,教学内容也相对陈旧,教师缺乏对新思想和新理论的学习,几十年来始终如一,未能跟上时代的发展。
2)“ 填鸭式”教学[10]。整个教学过程以教师为主导,许多资深文学教师已经形成了“填鸭式”的教学模式,即教师满堂灌输知识,而学生被动接受,忽视了学生的主体地位和主动性[11]。
3) 教学模式落后。传统的教学模式缺乏现代科技教学手段的辅助。许多教师和学生不懂得使用先进的人工智能技术来辅助学习,例如,不知道如何使用ChatGPT等人工智能工具来辅助完成任务。
培养文科生教师和学生的数据思维能力至关重要。在教学环境中融入数据科学思维,培养日常生活中运用数据思维的习惯,是教师和学生终身成长的关键要素,使他们能够主动适应时代变革,及时做出响应。
2 文科生数据思维模式形成
本文将通过具体的人口数据实例来探讨数据思维的形成过程。在此基础上,通过数据驱动引导文科生学习新知识,预测文科生未来的发展方向,并通过可视化的方式呈现数据思维的形成过程,使抽象的理论变得更加直观和易于理解。
2.1 数据驱动文科生学习新知识
“数据科学”和“大数据”是随着数据积累而产生的新名词,可以理解为人工智能时代的一门新科学[12]。数据科学和大数据本质上都是以“数据”为研究对象,涵盖的内容相似,都是以数据为中心,通过数据统计、数据挖掘、机器学习、深度学习、数据可视化等理论方法,主要研究数据存储、数据挖掘、数据产品开发等活动的交叉学科[13]。
数据思维指的是在数据基础上,学会如何使用工具处理数据、提取有用信息、进行分析或问题解决的能力和思维方式[14]。要培养文科生的数据思维,首先要学会应用工具收集可靠数据,接着根据数据提取关键信息,进行可视化分析,形成自己的知识体系,从而实现知识更新。
1) 数据收集。如图1所示,我们首先从中国人口十年图谱中收集历年人口出生率的统计情况;其次,从中国历年高考人数及录取率统计表中收集1997—2022年的录取人数及招生高校数。
2) 数据提取。我们将收集的信息进行整理,提取出关键信息,选择有用字段,如人口出生率、录取人数、招生高校数,并进行单位对齐。
3) 数据可视化。我们将以上数据使用可视化工具进行展示,使其更加直观便于分析。
4) 获取知识。根据图1中的信息,我们了解到,最近10年人口出生率在逐渐降低,而高考录取人数及招生高校数在不断上升。
5) 预测未来。基于这些数据和知识,我们可以对未来做出预判:中国的高等教育,将从精英教育转变为大众教育。
2.2 数据驱动文科生预测未来
数据驱动文科生预测未来是国家发展战略的制高点,是推动国家发展和创新人才培养的关键手段。我们通过3个案例来说明数据驱动文科生预测未来的过程。
2.2.1 人口出生率对高校教师发展的影响
根据图1数据信息获取的知识,我们可以使用一些人工智能工具预测未来人口出生情况,预测结果如图2所示。
如图2所示,根据历史信息做出的预测来自育娲人口研究([https://www.yuwa.org.cn/](https://www.yuwa. org.cn/)) 。其预测基于2010、2020年的全国人口普查数据以及2021年的中国统计年鉴数据。预测分为三种情景:低预测表示没有任何鼓励生育政策;中预测表示中等程度的鼓励生育政策;高预测表示出台有效政策鼓励生育。根据低预测曲线图以及近10年人口出生率下降的趋势,可以预见,到2030年若不采取干预措施,人口出生率将持续下降。根据这一数据信息,如果国家不出台有效措施提升人口出生率,那么在未来10到20年间,很多高校将面临招生困难,落后高校可能面临倒闭。
2.2.2 文科专业就业岗位缺失
图3的数据来自2023年智联招聘发布的《大学生就业调研报告》。从图3可以看出,工科生毕业后获得工作岗位的比例最大,而人文学科毕业生获得工作岗位的比例较低。这也间接反映了当前文科领域的市场需求较少,导致产能过剩。因此,文科生具备工科生的思维方式,即掌握数据思维能力,显得尤为重要。
2.2.3 各行人员面临裁员风险
图4中的数据来源于国外网站[layoffs.fyi](https:// layoffs.fyi/)。我们统计了2022、2023年全国各行业的裁员情况。自2022年以来,各大型科技公司公布了相应的裁员人数。例如,亚马逊两次裁员总数超过2.7 万人,微软和谷歌也分别裁员超过1万人。甚至文科生所没有选择的教育行业也面临裁员危机,2022年裁员8 728人,2023年裁员5 885人,其他行业也相继出现裁员现象。这个现象主要受制于人工智能技术的飞速发展,如AI作画、机器自动化、代码生成、数字人等技术。这些技术可以替代大部分工作,如画家、流水线工人、程序员、主持人、翻译员等。
在数据驱动下,文科生需要时刻反思哪些能力会被AI取代,及时调整自己,学习新兴领域的知识,以面对产业变革的挑战。
2.3 文科生数据思维框架的形成
文科生数据思维框架的形成至关重要,可以参考工科生的数据思维模式[15]。数据科学的DIKUW 模型[16]从数据(Data,D) 到信息(Information,I) ,然后到知识(Knowledge,K) ,通过知识形成理解(Understanding,U) ,最终转化为智慧(Wisdom,W) 。如图5所示,数据科学DIKUW实例转换模型展示了这个过程。文科生的思维模式应当以金字塔的形式从数据到智慧逐步提升和优化,由过去的数据直接预测未来。以文学就业实例为导向,逐一分析未来需要具备哪些知识,从而适应国家的发展。DIKUW模型的思考过程如下。
3 基于数据思维能力的文科生课程体系建设
在大数据背景下,文科生课程融入人工智能技术已经成为不可改变的趋势。由于人工智能技术更新迭代快,文科生课程体系的建设可以参考人工智能时代的新文科建设[17]。表1列出了培养过程及核心必备课程内容,供参考。
3.1 理论学习
需要开设人工智能前沿讲座和计算机通识课程,这需要由应用型人才或前沿学者有一定经验的教师授课。特别是要掌握数据挖掘、机器学习、深度学习核心理念的人工智能前沿技术。在传统文科生教学中,应当使用新兴的多媒体技术来辅助教学。
3.2 实践巩固
以现实案例为导向,开设数据挖掘实践课程,并要求学生掌握一门编程语言,如Python,实现从数据抓取到数据可视化的全流程。还需要掌握调用一些经典的机器学习包,如线性回归、决策树、支持向量机、随机森林、多层感知器等模型。Python中有很多这样的安装包,可以直接调用,文科生只需一台电脑就能轻松学会。
文科生必须懂得人工智能的先进工具,这对于提升自身能力至关重要。在人工智能课程中,涉及的实践课应该包括如何使用像ChatGPT这样的聊天工具;以及文字生成图片的“Stable Diffusion”模型。使用这些工具可以快速提升自身的工作效率。
3.3 终身学习能力
具有数据思维的理论和实践是不够的,还需从数据模型的结果中不断反馈自身知识,保持学习精神。大数据的价值随着时代的变化而变化,模型也需要不断更新数据,以保持其预测的准确性。对于文科生来说,终身学习成长的能力至关重要。培养学生在解决问题的同时,反思其背后的原因。让学生保持好奇心,同时具备批判性思维,是他们终身学习的动力。
4 结束语
未来社会逐渐走向智能化,注重文科生数据思维能力培养至关重要。各校必须在文科课程中涉及大数据、人工智能相关课程,以培养国家未来的创新人才。为在人工智能时代中不被淘汰,教师和学生都必须掌握这一门技术,要时刻跟随科技和时代的变革需要,才能立于不败之地。