群体智慧视角下师范生教学技能训练智能问答系统设计与实现
作者: 郭海希 解敏 武辰臻
摘要:随着ChatGPT和国内外各类GPT模型的飞速发展,其背后的技术日新月异,很多企业或机构都拥有自己的私有大模型(或自主开发或基于开源模型定制开发、微调) ,同样地,生成式人工智能也为教育事业注入了动力。该研究基于群体智慧视角,为辅助信息科技师范生教学技能实训课程教学,基于Langchain+LLM构建本地知识库问答系统,在概述ChatGPT、智能问答系统原理和特点的基础上,分析了“信息科技师范生教学技能训练”问答系统的设计需求,从系统架构、问答流程及功能模块等部分设计了问答系统,旨在研究如何将 ChatGPT技术融入师范生教学训练过程中以提高学生的学习兴趣,改进教师的教学方法,进而提升教育教学质量。研究结果表明,训练出的基于本地知识库的教学问答助手,能有效解决传统问答大模型的“幻觉问题”(即专业性和针对性不强、“答非所问”误导性回答等) ,进而为师范生提供更精确的教学技能训练指导。
关键词:ChatGPT;信息科技师范生;智能化问答;大模型;预训练模型
中图分类号:TP18 文献标识码:A
文章编号:1009-3044(2025)05-0001-06 开放科学(资源服务) 标识码(OSID) :
0 引言
教师承担着传授知识、培养人才的重要使命,需要接受系统教育和专业训练,以获得必要的专业知识和教学技能。对于师范生而言,掌握扎实的教学技能是其成为合格教师的关键,这不仅关系他们自身的职业发展,也直接影响到教育事业的长远发展。而教学技能需要在日复一日的有效训练中得到培养。
然而就现阶段来看,师范生教学技能培养仍存在许多问题。本文以师范生中的信息科技师范生作为研究对象,探讨其教学技能培养过程中存在的问题并寻求解决办法。信息科技师范生是信息技术与教育教学相结合的专业人才,也是未来教育的关键力量,其教学技能不仅关乎个人职业发展,更影响到未来教育的质量和学生信息素养的提升。因此,培养具备高水平教学技能的信息科技师范生,在推动教育信息化和提升全民数字素养方面具有重要意义。
通过课堂观察与访谈得知,当前信息科技师范生教学技能培养面临着如下挑战:教师指导存在局限性;教学组织形式标准化的问题极大可能地限制教学的灵活性与创造性;当前的教学技能培养难以满足学生个性化学习的需求。
针对以上挑战,本研究结合群体智慧和ChatGPT智能问答模型的关键技术,设计并实现基于群体智慧视角的信息科技师范生教学技能问答系统,旨在为信息科技师范生教学技能的训练提供帮助。本问答平台包含用户模块、问答学习模块、后台管理模块。
本文首先分析了信息科技师范生教学技能培养的重要性,紧接着阐述了师范生在教学技能培养时面临的挑战,针对这些挑战,本研究在论述了相关理论和技术的基础之上,设计并实现了信息科技师范生教学技能问答平台,并对问答平台进行使用,评估使用后的效果,发现该问答平台能对信息科技师范生教学技能训练产生帮助。
1 信息科技师范生教学技能培养面临的挑战和应对策略
1.1 挑战
1) 教师指导的局限性。注重实践和反思的教学技能训练模式要求教师提供精细、及时的反馈与指导,而教师的时间和精力有限,难以为每个师范生提供个性化的指导和反馈。这一局限性在班级制的大规模教学环境中尤为明显,影响了教学技能培养的质量和效果。
2) 教学组织形式标准化的问题。常规课程标准化的教学流程有助于保证教学的基本质量,但也可能限制教学过程的灵活性和创造性。这种形式难以适应不同学习者的个性化需求,不利于师范生个性化创新教学方法的探索。
3) 难以满足学生个性化学习的需求。从教育心理学的角度来看,每个学生的知识背景、学习风格和职业发展目标都有所不同,这就要求教学技能培养须提供更加个性化的学习路径和支持。然而,由于资源、技术和方法的局限,满足这种个性化需求在实际操作中存在较大难度[1]。
本研究访谈了部分信息科技师范生,发现他们的学习风格和兴趣点存在较大差距,比如有的学生擅长编程课的教学,有的学生喜欢理论课的教学,有的学生喜欢操作课教学,他们各自有擅长的领域但同时也存在薄弱领域。因此,传统的课堂教学即一名教师对多名师范生,将难以满足其个性化需求。
1.2 应对策略
针对上述问题,教育界和学术界已经开始探索多种解决方案。例如,利用教育技术提供个性化学习资源,开发在线教学平台以支持远程指导和同伴互助,以及采用案例教学和问题导向学习等方法来提高教学的互动性和实践性等。
2 群体智慧
关于群体智慧,美国作家Surowiecki在2010年出版的The Wisdom of Crowds 一书中使得Collective Intel⁃ligence即“群体智慧”得到广泛关注,作者指出群体智慧生成的4个基本前提:观点和思维的多样性;参与人群的独立性;无核心人物的分权性;群体观点高度整合的集成性[2]。群体智慧可以理解为在混合式协作学习活动过程中涌现出的高级智慧,这种智慧比学习共同体中的每个成员都要高明,旨在帮助学习者学习如何产生新的知识和运用新的智慧[3]。在教学技能培养中,群智视角意味着利用群体知识的多样性和协同效应,促进师范生在教学实践中提升创新思维和综合能力。
2.1 群体智慧运用于师范生教学技能训练
如前文所述,就师范生教学技能训练存在的挑战,本研究提出将群体智慧运用于师范生教学辅助。将具有多样群体智慧的信息科技师范生作为研究群体,以信息科技师范生的提问数据作为实验数据来源之一,结合师范生教学的教案、课件等进行进一步的提问与分析。
本文结合群体智慧的特点和前人的应用研究,分别将群体智慧应用于问答平台模型搭建(语料库收集:来自网络语料库和本地语料库的群体智慧) 和学习支持平台的研究中(来自师范生群体的群体智慧) 。
本问答平台系统具有交互性,有知识问答、认知诊断、个性化内容推送的功能。师范生除了可以在问答模块进行学习提问,还可在用户模块将自己的讲课视频、课件、教案上传到班集体中,其他用户可以在里面进行点评,上传材料的用户在看到他人点评反馈后不断更新完善自己的教学技能;教师可以上传、补充资料,更新完善提问语料库资料。用户可以发表自己的内容,通过网络交互实现知识的共享,从而在问答平台上形成群体智慧。
2.2 群体智慧在师范生教学技能训练中的优势和局限性
2.2.1 优势
多维度学习:群体智慧可以为师范生创造多维度的学习环境,通过平台的互动,师范生能够从多角度获得全面的教育视角和教学策略。这种学习方式促进了不同观点和经验的共享,从而提升了教学方法的丰富性和有效性。
资源共享:通过群体智慧,师范生可以访问并共享丰富的教学资源和案例,从而快速提升教学设计和实施的能力。
问题解决:通过集体讨论和协作,师范生能够深入探讨教学中遇到的问题,从而找到更有效的解决方案。
2.2.2 局限性
依赖性:过度依赖群体智慧可能导致师范生缺乏独立思考和解决问题的能力,影响他们的自主性。
信息过载:在群体智慧的环境中,信息量巨大,师范生可能会感到信息过载,难以筛选和吸收对自己最有用的知识。
实践机会限制:虽然群体智慧提供了丰富的理论支持,但可能限制了师范生在真实课堂环境中实践教学技能的机会。
因此,群体智慧运用于师范生教学技能训练有其优势和局限性,可以运用群体智慧来不断完善自己的教学技能,但是也应该辩证地看待,不能过于依赖。
3 智能问答系统概述
知识问答技术研究最早可以追溯到20世纪50年代的图灵测试[4]。由于当时的技术能力限制,知识问答能力并未取得显著突破。20世纪60、70年代,数据库技术的出现,专用问答系统应运而生,如Baseball[5]和REQUEST[6]等。这类系统主要用于特定领域事实性问题的回答,覆盖范围和回答能力有限。20世纪90 年代后期,互联网的出现,大量的文本信息如网页、邮件等开始涌现,自然语言处理技术,如关键词提取[7]、文档检索[8]、文本分类[9]等开始在问答系统中得到应用,且初步具备交互式问答对话能力。21世纪以来,知识图谱采用结构化的图数据库来存储和展示各种知识,能有效地表达知识,具备强大的知识检索、推理和应用能力,在智能知识问答系统中得到了广泛应用[10-11]。但知识图谱也面临挑战,如成本较高、更新和维护困难等,这些因素限制了基于知识图谱技术的知识问答的进一步发展。2023年以来,以ChatGPT为代表的大模型技术成为热点话题[12],基于大模型的知识问答系统极大地提升了问题的语义理解能力,且支持上下文理解和多轮对话,给用户带来智能化的知识问答体验。
然而,大模型在知识问答的应用中也存在着巨大的挑战:它的知识主要来源于训练数据,知识的更新周期长、迭代成本高昂。此外,在面对没有“见过”的问题时,容易出现“答非所问”的误导性回答,即“幻觉”问题。针对该问题,本文基于RAG(检索增强生成) 技术,有效解决了大模型问答系统的幻觉问题,从而为设计专业知识库问答系统奠定基础。本平台基于文本自动生成式系统,使用预训练的神经网络模型,通过对科学数据集的训练,快速生成对用户问题进行语义和内容分析后的文本答案。
4 基于检索-读取-生成的问答平台的实现
4.1 平台用户群体
本问答知识平台的主要用户群体为在读的、尚未进入工作岗位的信息科技师范生,本平台旨在为其提供精准化的个性化问答学习支持服务,有助于解决前文所述的挑战。
4.2 编程语言和环境选择
本文实验编程语言采用JavaScript 和node,编程环境借助Node.js和各种云服务,利用好前后端同构的优势,部署应用。
4.3 模型
大模型采用OpenAI的ChatGPT模型,其提供向量化API和提问API。大模型使得技术成为工具,可以迅速搭建大模型知识库问答机器人应用呈现给用户,然后收集反馈、持续迭代,进而搭建出基于本地知识库的问答平台系统,使其成为专业领域的AI问答助手。
4.4 框架——Langchain
Langchain是一个面向LLM应用的框架,包括:基础层、能力层、应用层;LLM的API只是提供了一个非常基础的调用方式,因此,当要构建一个复杂的Chat⁃Bot时,要考虑如何保存聊天的上下文、如何进行网络搜索、如何加载PDF等工程问题,可应用Langchain框架帮助解决。它具有如下优势:1) 提供统一的LLM接口;2) 快速将本地知识导入大语言模型;3) 将连续多次任务的关键词进行存储,让大模型有“记忆”;4) 集成大量的工具:数据加载、数据库、支持多种模型;5) 定义组件接口:数据加载、数据库请求、模型调用等。
4.5 平台数据来源
本平台数据来源主要是粤教版高中信息科技教材八本,以及本研究中某师范院校大三信息科技师范生的教案50个和课件50个,此外还有部分数据来自百度百科等。
4.6 伪代码实现
伪代码实现如表1所示。
4.7 平台功能模块
问答学习平台的主要功能模块设计图如图1所示,主要由用户模块,问答学习模块以及后台管理模块组成。其中用户模块包括最基本的登录和个人中心功能,此外还有个性化学习模块,利用平台对知识点的问答辅助来提升师范生的教学技能学习,用户通过小测来进行自身的学习诊断,后台将收集到的用户数据传至问答学习模块中。在问答学习模块中,用户可以输入具体问题进行查询,平台将基于用户的认知诊断进行答案推送,提供最适合用户的解答。