《国际中文教育中文水平等级标准词汇表》与《台湾华语文能力基准词表》比较研究

作者: 冷雨航 曾毅平

《国际中文教育中文水平等级标准词汇表》与《台湾华语文能力基准词表》比较研究0

[关键词] 中文词表;海峡两岸;对比

[摘  要] 大陆《国际中文教育中文水平等级标准词表》与《台湾华语文能力基准词表》共有词约73%,差异词约27%。选词的情境类属有差异。情境主题下,共有词跨等交错分布,主要为日常生活类词语;情境主题外的独有词可据其典型特征分为“双方同类”和“单方独类”两种类型。独有词差异与两岸不同收词原则相关,词频在独有词增减整合中发挥重要作用。两岸词表存在融通趋势。

[中图分类号]H195.3  [文献标识码]A  [文章编号]1674-8174(2024)02-0048-11

1. 引言

本文“词表”指汉语作为第二语言教学的词汇大纲。词表是教学设计、教材编写、词典编纂和测试评估的重要参照。《国际中文教育中文水平等级标准词汇表》(简称“《标准》”)收词11092条,是《国际中文教育中文水平等级标准》体系下的新一代词表,由我国教育部国家语言文字工作委员会于2021年3月24日发布,同年7月1日正式实施。《台湾华语文能力基准词表》(简称“《基准》”)收词14470条,是我国台湾地区华语文教育八年计划(2013—2020)之“建置应用语料库及标准体系”代表性成果,于2020年随《台湾华语文能力基准》(TBCL)正式出台。本文从研制理念、收词量与等级分布等角度对比,分析其一致性和差异性。

《标准》出台后,大陆词表对比研究关注新旧词表异同,具体包括《标准》与《汉语水平词汇与汉字等级大纲》《汉语国际教育用音节汉字词汇等级划分》(简称“《等级划分》”)《新HSK词表》的比较,涵盖收词概况、等级调整、词量增减等。最新研究基于对比结果总结了《标准》改进后的特点及其教学意义,并就尚存问题提出若干修订建议(李华,2023)。两岸词表对比研究对象多为中文测试用词表,比如《新HSK词表》和基于华语能力测验(TOCFL)推出的《华语八千词词表》(简称“《八千词》”)。对比内容包括外围的研制理念、收词原则、词条设计、选词数量和等级划分;内部的词汇差异及其主要成因等。除词表间对比,杨惠媚等(2014)还借助两岸网络语料库高频词分别考察了双方词表与之对应和缺失的比例及内容,为词表修订补录提供参考依据。另有研究聚焦两岸阶段性词表异同,翟颖华(2015)选取了《等级划分》初级部分与台湾服务于初阶教学的《华语教学基础词库》对比,围绕词频、情境和对非词结构态度讨论两岸选词影响因素。大陆尚无与《基准》的比较研究,台湾相关研究(李诗敏,2020)不仅包括二语词表间对比,即《基准》与《八千词》《新HSK词表》比较;也包括二语和母语词表对比,即《基准》与《教育部学童常用词表》比较。该研究突出比较的方式和具体过程,重点呈现了数量对比结果。

综上,大陆《新HSK词表》与台湾《八千词》常作为两岸词表比较研究对象,目前还未见《标准》和《基准》对比研究成果。现有比较主要涉及选词依据、数量增减、等级变化等,词表内部共独有词梳理较为零散,较少做类型总结;从两岸国际中文教育交流合作看,两岸词表融通趋势未获较多关注。较之过往研究,本文比较对象分属两岸近年出台词表,内容较新,以期丰富相关研究成果。并以情境为切入点细致考察了两岸词表共独有词,总结其主要类型。透过词表不仅展现了两岸语言使用特色,同时还窥见词表融通趋势,为融通词表研制提供语言事实支持和参考。

2. 研制理念

2.1 选词依据

《标准》选词参考了已有等级词表、高频词表、常用词表、考试大纲和现代汉语语料库,按难度和词频将初等和中等词语细分为1-6级,高等词语未做分级处理。《基准》选词以华语文语料库(简称“COCT”)书面语语料为主,将词频、覆盖率、分布均匀度等作为选词指标,同时辅以口语语料词频、高频教材生词、常用词及已有词表来调整完善(吴鉴城等,2019)。在诸种参数中,两岸都将词频视为重要选词依据。

2.2 词条排列

《标准》词条按音序排列,由序号、词语、拼音三部分组成。《基准》词条则按笔画数量从少到多排列,大部分词条仅罗列词语,少部分附加注音符号和英文释意①。词条处理上,两岸词表同中有异:首先,都做了并词处理。《标准》将兼类词和同义词合并,前者如“分(名)”和“分(量)”合并为“分(名、量)”,后者如“弟弟|弟”“有时候|有时”;《基准》整并异体字词、同义词和用法相近且无地域方言之别的词,并用“/”区隔,如“什麼/甚麼”“维他命/维生素”“衣服/衣”。其次,都拆分了同形词。《标准》按异音、异义或异词性来拆分同形词,并在其后括注词性,比如“花”因词性和意义不同拆分为“花(名)”和“花(动)”;《基准》拆分同形多义词,后标数字区分,比如“行”拆分为“行1(读作xinɡ35)”和“行2(读作hɑnɡ35)”。再次,都用括号表可省略。比如《标准》的“有(一)些”,《基准》的“没(有)用”。此外,《标准》还用括号标注词缀例词或义项说明,前者如“家(科学家)”,后者如“称(称一称)”和“称(称为)”。

2.3 衍生产品

衍生产品辅助词表解读或补充词表内容。比如《国际中文教育中文水平等级标准(应用解读本)·第二分册:词汇》②(简称“《解读本》”)可辅助《标准》理解使用。《解读本》详述了收词原则、词语拼音、词类标注等重要信息,为各词条加注了词性③。《华语文能力基准应用参考指引》④ 详述了完整的华语文能力指标与词语、类词缀等分级标准,并提供基础词汇教学资料,区分了《基准》(1-4级)词语和类词缀难易度,便于教学操作和词典编纂。《基准》还编制了同形异义词表⑤、类词缀表⑥、情境分类词表(1~5级)⑦。

3. 选词数量差异

3.1 选词数量

《标准》共收词11092条,分3等9级:初等1~3级为普及水平,中等4~6级,高等7~9级。《基准》收词14470条,涵盖3等7级:1~3级为基础,4~5级为进阶,6~7级为精熟。两岸词表各等级词语数量及分布见表1。

由表1可知,《标准》从初等到高等词量逐级递增。三个等级词量比①约为2∶3∶5,符合国际中文教育规律(刘英林等,2022);而《基准》约为1∶3∶6,显然两者在初高等上存在差异。两个词表中等收词量都接近5500词,但到了高等,《基准》收词量远超《标准》,其词量比也突显了该阶段收词重心。各级新增词量变化趋势上,《标准》初等升级特征明显且增速较快,要求学习者快速打好词汇基础;中等增速放缓,助于词量稳步积累;高等因未细分等级暂不做讨论。《基准》基础水平新词增量变化趋于平稳,且入门词量要求低,但进阶水平新增词量迅速飙升,变化幅度随之增大。可见,两岸词表各水平收词总量及各等级新增词量变化均存在较大差异。

3.2 选词差异

进一步对比两岸词表收词情况,其共有和独有词数量分布见表2:

统计表明②,《基准》和《标准》共有词7977个,独有词6493个,分别约占词表总量55%和45%;《标准》和《基准》共有词8087个,约占总词量73%,独有词约占27%,共3005个。《基准》中独有词偏多,而《标准》中共有词占比更大。从各等级看,《基准》基础、进阶共有词数量占优势,独有词较多集中于精熟等级;《标准》各等级均以共有词居多,独有词数量随等级提升也有所增加。

为更好体现两岸词表各等级共有词交叉分布特点,现以《标准》为例,将其与《基准》对比,统计两岸词表各等级共有词数量及其分布,见表3。

从表3可知,两岸词表共有词等级与数量分布差异显著,除同等对应外,还呈跨等交错分布。比如“汉字”“认真”“中学”“知识”是《标准》1级词,但《基准》将其列为3级词;“耳朵”“鼻子”“餐厅”属《标准》5级词,《基准》定为1级词;再如《基准》中“黄瓜”“导游”“日历”“气球”为精熟7级词,而《标准》则为中等4级词。从《标准》各水平等级看,初等共有词主要对应分布在《基准》基础和进阶等级,说明大陆部分初级词在台湾词表中出现了升级现象;中高等共有词主要与《基准》进阶、精熟等级对应,但在基础等级中也占少量比例。

4. 共有词比较

《基准》将基础、进阶共5322个词做了情境分类②,处理后包括2519个核心词和2803个情境词。核心词为初学者必须首先学会或是横跨四类情境的词语;情境词涉及个人资料、日常起居、职业等17个类别。因共有词数量较多,结合实际和词表特色,现以情境分类为“抓手”比较两岸词表共有词。将《基准》情境分类词与《标准》同等水平(初、中等)词语对比,统计结果见表4。

据表4,情境分类词中共有词有3524个,其中核心词1895个,约占核心词总量75.2%,情境词1629个,约占情境词总量58.1%。两岸共有词中核心词数量略多于情境词,而《基准》独有词中情境词数量占优势。共有核心词在两岸词表中也呈交叉分布,《标准》以初级词居多,共1072个,约占共有核心词总量56.6%;而《基准》则是中级词占多数,共1176个,约占62.1%。可见,相同核心词在两岸词表中的学习顺序和分级有所不同。将共有情境词按不同主题归类有助于明确两岸词语共同聚焦的领域。两岸词表在17类情境中都有共有词,但比例存在差异,具体见表5。

统计表明,共有情境词数占比>50%的情境包括“日常起居”“职业”“休闲、娱乐”“交通、旅游”“社交、人际”“身体、医疗”“教育、学习”“购物、商店”“餐饮、烹饪”“公共服务”“安全”“社会”等12个类别。这些类别与《国际中文教育中文水平等级标准》(以下简称“《等级标准》”)各级话题相对应。以这12个情境类别为考察范围,《基准》情境与《等级标准》话题对应情况及共有情境词举例见表6。

从表6可知,情境与话题具一致性和相关性,是两岸情境词共现的基础。共有情境与话题主要属社会日常生活范畴,较少涉及政治、经济、科技等专业领域,这与情境话题所属等级和其交际属性有关。《基准》在分级基础上划分情境类别的做法值得借鉴,情境词有利于激活学习者心理词典,从便捷式记忆中提取相关词语用于交际(翟颖华,2015)。同时情境词教学能辅助构建课堂真实语境以及编写生活类中文教材。《标准》作为《等级标准》框架下的重要内容,可进一步据其话题范畴对词语做分类处理。两岸话题和情境的对照相通性以及共有情境词的存在对大陆词表情境分类也具有参考价值。

5. 独有词比较

5.1 情境主题下的独有词

从情境类别考察两岸词表独有词可以反映收词的领域差异。以17个情境类别为参照,将《标准》独有词加以归类,并将《基准》精熟等级的独有词补充到相应情境范畴中,两相对比,可从丰富性和特色性两方面来考察其差异。

5.1.1 丰富性

与《基准》相比,《标准》独用情境词更为丰富,表现为:

收词更具多样性。如“休闲、娱乐”情境的“体育”类词语,《基准》收录了“慢跑、溜冰、球赛”,《标准》则包含项目、场地、人员、赛事、奖励等分项,相关词语有:

杠铃、台球、羽毛球、举重、跳高、跳远、跳水、冲浪、滑冰、打球(项目类)

球场、赛场、体育场、体育馆、看台、起跑线(场地类)

队员、球员、运动员、球星(人员类)

大赛、联赛、半决赛、世界杯、亚运会、奥运会、竞技、单打、双打(赛事类)

奖杯、奖牌、奖品、银牌、铜牌(奖励类)

收词更具系统性。如“职业”情境的“求职”类词语,《基准》收录了“面谈、全职、薪资、绩效、职场”,同情境《标准》收词则覆盖了求职完整过程,且大多是同级词,教学时便于词语聚类和系统串讲,体现系统性和完整性(括号内为该词所属等级):

求职(6)、招聘(6)、应聘(高)、聘任(高)、雇佣(高)、试用期(高)、辞呈(高)、辞退(高)、下岗(高)、跳槽(高)