国际基于语料库的西班牙语教学研究

作者: 孔祥雯

国际基于语料库的西班牙语教学研究0

[摘           要]  随着计算机技术的迅速发展,在线网络资源中的语料库因其独特优势日益受到语言教学关注。通过分析在Web of Science检索到的国际西班牙语教学语料库应用研究方面的32篇文献,得出结论:国际基于语料库的西班牙语教学研究呈现多元化,但成果数量有限,尚处于萌芽阶段。在此基础上,以高校西班牙语词汇和语法教学为例,探讨DDL教学的思想和具体实践方式。

[关    键   词]  数据驱动;语料库;西班牙语;教学;词汇;语法

[中图分类号]  G642                   [文献标志码]  A                   [文章编号]  2096-0603(2024)06-0029-04

一、研究背景

数据驱动学习(Data-Driven Learning, DDL)是Tim Johns 和 Chris Tribble于 20 世纪 90 年代初提出的一种基于语料库数据学习外语的教学模式。[1]主要思想是通过指导学生观察语料库数据,由学生自己概括、归纳、提炼出语言现象的特征、意义等。语料库(corpus)是具有一定结构和规模,具有代表性的语料集合,并且可以通过计算机程序被检索。随着计算机网络技术的迅速发展,语料库语言学逐渐成为语言研究的重要方法和内容,在词典编纂、翻译、外语教学、语言研究等多个应用领域发挥了重要的作用。

根据王翊等人(2022)的统计,近二十年来,语料库在外语教学中的作用不断显现。[2]语料库在我国外语教学中的应用主要分为直接应用和间接应用两个层面。直接应用是指将DDL方法应用在课堂教学、测试等实践环节,主要研究领域有词汇教学、写作教学、翻译教学、语法教学、学习者语料库、专门用途外语教学等。不少学者提出词汇在外语教学中的重要意义,要改变以往轻词汇重语法的教学模式。传统的词汇教学,忽视词汇搭配知识和预制词块的教学,而实际使用中,搭配知识很重要,实际上比单个词汇用法更为重要。Hunston等(2000)研究认为,学习者口语流利的程度取决于对预制多词词组的掌握。[3]濮建忠(2003)提出要重视词汇学习的深度,词块教学应该是词汇教学的重点,要从地道的目的语中学习词块,从而解决学习者搭配和类联接方面的问题。[4]而语料库正是能够帮助教师从语料库证据归纳最频繁使用的类联接型式、最频繁使用的词语搭配、最频繁表达的意义和功能,进而帮助学生掌握语言事实和用法模式[5]。梁茂成 (2009)提出将基于课本和课程内容的“微型文本”应用于外语课堂教学,既便于检索,又提供了适用性。[6]吴军(2010)认为将语料库应用于语法教学,有助于使语法和词汇得以联系,对语法现象的分布和频率提供全面可靠的统计,有效帮助学生提高交际能力。[7]以上研究都说明数据驱动教学(DDL)在外语教学中的应用发展迅速,特别是在英语教育方面得到了大量支持。然而通过检索,我们发现目前国内对DDL应用于西班牙语教学讨论量很小,有必要探讨在西班牙语教学中的可能性。

我国高校的西班牙语教学处于西班牙语作为外语 (ELE)的教学环境下,师生缺乏接触真实语言环境的条件,利用语料库数据驱动学习具有更为重要的意义。那么,当今国际应用语料库进行数据驱动的西班牙语教学进展到了什么阶段,呈现何种特点,如何将国内外语料库资源引入大学西班牙语课堂,应成为我们的关注点之一。本文通过分析国际基于语料库的西班牙语教学研究现状,讨论如何在高校西班牙语课程中,应用语料库促进教学实践。

二、国际基于线上语料库的西班牙语教学研究

为进一步了解国际学界对语料库在西班牙语教学领域的研究现状和发展趋势,本研究选取 Web of Science 核心合集中的 SSCI 和 A&HCI,以“语料库”“数据驱动学习”“西班牙语”“教学”等作为主题词进行搭配后检索,研究领域限定在“Linguistics”“Language Linguistics”和“Education Educational Research”,为进一步确保数据的准确性和完整性,又对所有数据进行人工筛选,去除基于自建语料库研究以及其他不符合研究条件的文献,共得到32篇文献。可见,国际上针对西班牙语教学的语料库使用研究成果较少,研究还处在萌芽阶段。接下来,我们从发文量历时变化、高产作者、主要期刊、研究领域分布等方面对这些研究进行统计分析。

国际语料库西班牙语教学研究基本可以划分为两个阶段。第一个阶段是从2010年到2018年的起步阶段,论文总数为14篇,占全部论文数量的44%。自2010年第一篇研究发表之后,每年有1~4篇文献进行相关研究。第二个阶段是从2019至今的发展阶段,论文总数为18篇,占全部论文数量的56%。除2020年有3篇文献外,每年均有5篇研究,说明自2019年之后相关研究进入快速发展阶段。

发文量排名前列的学者有Marcos García Salido,共计发文5篇。该学者来自西班牙拉科鲁尼亚大学语言文学系。其研究范围较广,涉及语料库工具使用、学习者中介语研究、学习者的搭配问题、语料库搭配检测等。另外还有Hui-Chuan Lu(5篇),其研究兴趣主要是利用语料库进行中介语研究。Nausica Marcos Miguel(3篇)主要关注语料库资源课堂使用的有效性。Narciso Contreras Izquierdo和Fermín Martos Eliche(2篇)主要研究利用语料库检测固定词块频率及其教学情况。Anita Alejandra Ferreira Cabrera和Jessica Elejalde Gómez(2篇)的兴趣在于语料库资源建设和相关工具开发。这些学者的发文占到总数的53%,足以说明他们在基于语料库的西班牙语教学研究方面做出了一定贡献,值得我们在今后持续关注。

刊载语料库西班牙语教学研究论文的期刊主要有:Círculo de Lingüística Aplicada a la Comunicación(5篇),Revista de Lingüística Teórica y Aplicada(5篇),Porta Linguarum(3篇),Corpus Linguistics and Linguistic Theory(2篇)和International Review of Applied Linguistics in Language Teaching(2篇)。这些期刊上发表论文的研究领域分布较为广泛,难以总结其主要发表的领域。这些期刊发表的语料库相关成果最多,占到总数的53%,应该在今后被重点关注。

根据语料库应用于西班牙语教学的情况,本文将所统计的论文分为四类:第一类是语料库资源建设,第二类是语料库应用于课堂教学,第三类是利用语料库进行中介语研究,第四类是其他研究。结合表1的统计对语料库应用于西班牙语教学的研究情况逐一进行分析。

(一)语料库资源建设

语料库资源建设占到整体研究成果的25%,主要体现在两个方面:一是专业语料库的不断建设。学习者语料库在推动二语习得研究方面取得了重大进展,例如,Lozano (2022)的论文CEDEL2: Design, compilation and web interface of an online corpus for L2 Spanish acquisition research,专门介绍了西班牙语学习者书面语语料库CEDEL2(Corpus Escrito del Espa?觡ol)的设计情况,以及该在线语料库在今后西班牙语二语习得研究方面的应用前景。Canales (2012)注意到语音在西班牙语教学中未受到应有的重视,设计并开发了西班牙语语音习得语料库AACFELE(Adquisición y aprendizaje del componente fónico del espa?觡ol como lengua extranjera / segunda lengua)。第二个研究热点是基于计算机技术的语料库工具开发,占全部研究成果的12.5%。Lu (2021)等人介绍了一个名为“西班牙语搭配工具(SCT)”的软件程序及其在相关语料库研究中的应用,Chacon-Beltran(2019)介绍了拼写和语法检查工具Correctme的设计理念与工作方法,将用户的文章与规范语料库进行比较后,根据搭配出现频率的综合数据,在写作时向用户提供其拼写和语法错误的信息。

(二)语料库课堂教学研究

语料库课堂教学研究的成果占到整体的37.5%,是所有关于语料库教学研究中比例最大的领域,其研究领域呈现多元化。其中,课堂教学方法研究、语法和词汇教学受到最多关注。在课堂教学方面,Miguel (2020) 通过实证研究,发现基于语料库的任务确实在二语课堂中产生了交流、解释和参与。Benavide(2015)研究考察了学生使用西班牙语料库Corpus del Espanol(Davies, 2002)的有效性,通过实际语料库搜索,找到特定搭配和标记,观察真实示例,更好地理解和使用语法概念,从而说明语料库作为语言学习工具的有效性。在语法和词汇教学方面,Izquierdo (2017)将谷歌和西班牙语语料库(CREA 和 CORPES XXI)以及 Mark Davies 的语料库(西班牙语语料库)作为参照,以便为词块频率的分级和教学提供客观数据。最后,在写作、翻译教学和教师输入研究等方面也都有一定成果。Laursen(2012)阐释了在西班牙语和丹麦语翻译课堂上,可比语料库与搭配检索软件是翻译训练的高效工具,以帮助学生认识两种语言文体特征差异,提高翻译效率。

(三)中介语研究

借助语料库资源进行中介语研究受到了较多关注,中介语研究占比达到34.4%。Lu (2022) 使用学习者语料库考查了学生的词汇搭配问题。de Diego (2019)利用两个学习者语料库CAES和Corane,以及CORPES语料库中母语者语料,对haber使用情况进行对比研究。Blanco (2021) 利用学习者语料库Caele,研究了A2和B1级别学习者动名短语的产出情况,并提出二语教师应从初级学习阶段就注重对词汇搭配的教学。Salido(2016) 使用了CEDEL2和CORANE两个学习者语料库分别研究了母语为英语、瑞典语、日语和西班牙语学习者对SVCs结构习得情况,并对研制搭配词典和相关教学提出了建议。Schnur (2021) 使用犹他州双语浸入语料库中240万字书面西班牙语分库,从西班牙语二语学生写作语料中研究词汇复杂性,考量任务类型、语言水平等与词汇复杂性的关系。

经过统计分析,我们认为国际基于语料库的西班牙语教学研究呈现多元化发展,但成果数量相较于其他语种,特别是英语,相对较少,基于网络语料库的相关研究尚处于萌芽阶段。但对语料库的研究和应用分布不均,基于语料库的中介语研究占总研究量的34.4%。而语料库资源建设、课堂教学应用、具体课型应用等偏实践应用型研究较少。因此,我们对今后基于语料库的西班牙语教学研究提出以下建议: 进一步加强西班牙语语料库建设,利用语料库进行更多课堂教学研究,利用语料库研究成果进行教材编撰,加强利用语料库进行数据驱动学习的实践等。

三、语料库驱动学习应用路径

目前,语料库在外语教学中的应用成绩斐然,我国高校西班牙语教学也应当积极开展相关应用研究,以切实提高教学效率。下面,我们利用目前主流的西班牙语网络语料库资源,探讨其教学应用的路径。随着语料库语言学的迅速发展,西班牙语国家也相继建成了各种类型与规模的语料库,为语言教学和研究提供了丰富素材。其中,影响较大的语料库有西班牙皇家语言学院推出的一系列语料库:Corpus de Referencia del Espa?觡ol Actual (CREA), Corpus del Espa?觡ol del Siglo XXI (CORPES XXI), Corpus Diacrónico del Espa?觡ol (CORDE),以及Corpus del Espa?觡ol de Mark Davies(CdE)等。