

柬语母语者汉语书面语句法复杂度研究
作者: 张欢 王衍军
[关键词]柬语母语者;句法复杂度;写作质量
[中图分类号]H195.3 [文献标识码]A [文章编号]1674-8174(2022)01-0079-07
句法复杂度作为二语写作教学与研究中的一个重要构念(陆小飞、许琪,2016),逐渐成为研究热点。从概念看,句法复杂度指产出的语言中句法结构的多样性及复杂性(Ortega,2003;Lu,2011;Bulté&Housen,2014);就重要性而言,句法复杂度既是语言质量研究的重要内容,也是衡量二语水平的重要维度。因此,本文聚焦句法系统,尝试揭示柬语母语者汉语书面语句法复杂度的发展特征。
1.研究背景
国外对二语书面语句法复杂度关注度高,成果较丰富,大致分为三类:(1)集中探讨句法复杂度的测量维度及具体指标(Wolfe-Quin⁃teroetal.,1998;Norris&Ortega,2009;Biberetal.,2011)。其中,Norris&Ortega(2009)强调句法复杂度为多维概念,应关注不同维度的“曲线关联”。(2)实证考察二语书面语句法复杂度的变化特征,包括对不同水平书面语句法复杂度差异的共时研究(Ortega,2003;Verspooretal.,2012)及针对句法复杂度动态发展的历时考察(Stockwell&Harrington,2003;Bulté&Housen,2014;Crossly&McNama⁃ra,2014)。(3)探寻二语书面语句法复杂度的影响因素。Wayetal.(2000)、Ortega(2003)、Lu(2011)讨论了文本体裁、学习环境、写作时长、任务类型等对二语句法复杂度的影响。
国内关于二语句法复杂度的研究多聚焦英语习得,现有研究可分为两类:(1)从共时面观察书面语句法复杂度的发展及与写作质量的关系(鲍贵,2010;赵俊海、陈慧媛,2012;徐晓燕等,2013;熊淑慧,2017)。该类研究从语言水平、文体、语体、写作任务、习得群体、写作环境等视阈细致考察了句法复杂度,但测量维度不同,结果不尽相同。(2)从历时层面跟踪二语书面语句法复杂度动态表现(纪小凌,2009;王海华等,2015;江韦姗、王同顺,2015;郑咏滟,2018)。此类研究表明:句法复杂度并非从“0”到“1”的线性变化过程,而是曲折发展,体现了句法发展的复杂性、动态性。
近年来,关于汉语二语书面语句法复杂度的实证研究不断涌现。Jin(2007)、Yuan(2009)探讨了汉语句法复杂度测量指标的信度与效度,发现T单位不是可靠指标。Jin(2007)提出将“话题链”“零形成分”纳入测量范围,但未考虑母语影响。曹贤文、邓素娟(2012)、吴继峰(2016,2018)、亓海峰、廖建玲(2019)实证表明:T单位对汉语句法复杂度具有敏感性,且受学习者母语影响。
综上,以上实证推动了关于句法复杂度的研究,贡献突出,但也发现:第一,关于汉语句法复杂度研究起步晚,成果少,发展相对滞后;第二,T单位作为常用句法指标,对汉语句法的有效性尚需不断验证;第三,现有研究多以英、韩母语者为观察对象,鲜以柬语母语者为被试探讨句法发展。鉴于此,本文重点探讨柬语母语者汉语书面语句法复杂度变化及与写作质量的关系,总结其发展模式,增补相关研究。
2.研究设计
2.1研究问题
(1)T单位、话题链、零形成分三个维度中,哪些指标能有效测量柬语母语者汉语书面语句法复杂度差异?
(2)哪些句法指标能同时区分语言水平并预测写作质量?
(3)柬语母语者汉语书面语句法复杂度如何发展?是否受学习者母语影响?
2.2研究被试
本研究共120名被试,均来自柬埔寨金边某公立华校。其中,柬语母语者90名,女生56名,男生34名,按照分班考试成绩,分为初、中、高三个等级,每级30人。30名汉语母语者均为广州某小学四年级学生,女生14名,男生16名。所有被试须限时、独立完成200字左右的作文——《我的妈妈/老师》(45分钟),不允许查阅辅助资料。
2.3测量维度及指标
2.3.1T单位
Hunt(1970)指出“T单位是在不留下任何句法不完整片段的前提下分割出的最小片段,一般包含一个独立小句及嵌套成分”。Jiang(2013)根据汉语句法特点,进一步阐明“汉语T单位指包含一个独立谓语和附属或嵌套成分的独立主句”,包括三种形式:
(1)我最喜欢我的老师。(1个T单位)
(2)在我的眼里,我的妈妈是了不起的。(1个T单位)
(3)妈妈给我买一只叫豆豆的小狗。(1个T单位)
以上例句均为1个T单位。例(1)为简单句,是1个T单位;例(2)有两个分句,“在我的眼里”是无谓语成分,第二个分句包含一个谓语成分“是”,属于1个T单位;例(3)为1个T单位,“叫豆豆的小狗”为嵌入成分,不是独立T单位。本文以T单位数量、T单位长度、T单位分句数为具体测量指标。其中,T单位数量指每篇作文中T单位总数;T单位长度指每篇作文中T单位的平均长度;T单位分句数指不同T单位包含的平均分句数。
2.3.2话题链和零形成分
汉语注重“话题”(CharlesN.Li&SandraA.Thompson,1984),Tsao(1979)最先提出了“话题链”术语。Jin(2007)指出“话题链”和“零形成分”可用于汉语句法复杂度测量。其中,话题链指包含两个及以上分句的单位,分句主题相同且只出现于第一分句,其余分句以零形式代替。如:
(4)她是我的新老师,ø是我的新班主任,ø教我们华文。
(5)老师性格很好,ø和蔼可亲,ø就像我们的大姐姐一样,ø和我们一起聊天、一起玩。
本研究将话题链数量、话题链长度、话题链分句数作为具体指标。其中,话题链数量指每篇作文中话题链总数;话题链长度指所有话题链的平均长度;话题链分句数量指不同话题链包含的平均分句数。
零形成分指作文中“零主语”现象,如例(4)、(5)“ø”处。文章通过计算零形成分总数测量句法复杂度。
2.4语料分析
综合考虑作文长度、语料分析的可操作性,本研究原则上选取每篇作文中前150字作为语料,具体步骤如下:第一,切分T单位、话题链,如切分未完结,适当增减;第二,计算每篇作文中T单位总数、T单位长度及T单位平均分句数;第三,计算每篇作文中话题链总数、话题链长度、话题链平均分句数;第四,计算每篇作文中零形成分数量;第五,统计T单位、话题链、零形成分三个维度的测量结果,然后利用SPSS进一步检测。
2.5写作质量评估
首先,选择两名汉语教师制定评分标准,包括词汇、语法、句式、结构等。两名教师均具有5年以上汉语教学经验,未承担被试所在班级教学任务。其次,作文语料一式两份,按照具体标准,教师评分,满分100分,取有效分数的平均值。如果分数差大于三分,请第三位教师评分,取三个有效分数的均值。
3.结果与讨论
文章检验了句法复杂度指标的效度,结果显示:效度系数KMO=0.743,p=0.000<0.05,表明各指标有效性较高,可以继续分析。
3.1柬语母语者汉语句法复杂度的测量结果
表1为不同水平被试汉语书面语句法复杂度测量结果。以语言水平为自变量、七项句法复杂度指标为因变量,对上述结果依次进行单因素方差分析,结果如下:
(1)T单位:T单位数量主效应显著,F=79.004,P=0.000<0.05,事后多重比较发现,L1、L2、L3、L4之间存在显著差异(P<0.05)。T单位长度主效应显著,F=30.430,P=0.000<0.05,除L3、L4差异不显著(P=0.090>0.05),其余任意两个水平差异显著(P<0.05)。T单位分句数主效应不显著,F=1.070,P=0.365>0.05,且L1、L2、L3、L4均无显著性差异(P>0.05)。
可见:第一,T单位数量能区分不同语言水平,为有效指标,这与Jin(2007)、Yuan(2009)研究结果不太一致。第二,T单位长度具有局限性,虽能区分不同水平二语者差异,但无法区分高级水平者与母语者差异。表1显示,高级二语者汉语T单位长度均值达11.83(SD=1.25),母语者为12.31(SD=1.26),二者非常接近。究其原因:高级二语者对本次写作话题熟悉度较高,相关知识丰富,能使用不同句式、多重定语等复杂形式,T单位长度自然较长,基本达到母语者水平。另外,受柬语影响,汉语初学者书面语T单位并不长(M=9.79),作文基本由简单句构成。随着学习的深入,汉语二语者水平不断提高,T单位变长(中级:M=10.87;高级:M=11.83),且呈现显著性变化。第三,T单位分句数既无法区分汉语二语者水平,也无法区分汉语二语者与母语者差异,完全无效,与前人考察结果相似(Jin,2007;吴继峰,2018)。
(2)话题链:话题链数量主效应显著,F=22.760,P=0.000<0.05,多重比较发现,L1、L2、L3、L4差异显著(P<0.05)。话题链长度整体差异显著(P=0.000<0.05),Krus⁃kal-Wallis①成对比较证明,L1、L2、L3、L4之间均存在显著差异(P<0.05)。话题链分句数总体差异显著(P=0.002<0.05),但成对比较发现:只有L1与L3(P=0.003<0.05)、L1与L4(P=0.016<0.05)差异显著。
综上,话题链数量、话题链长度可有效区分不同语言水平的差异。其原因有两点:其一,进入中高级阶段,汉语话题链的输入量不断增加,语篇衔接方式也频繁出现,如相同主题或显性连词的省略等;其二,语言样本中比喻、排比等修辞手法的使用,凸显了汉语“重意合而轻形合”的特点。因此,学习者对汉语的认知加深,话题链数量、话题链长度也显著提高。
然而,话题链分句数为无效指标。表1中,初、中、高三个等级的二语者话题链分句数依次为1.78、2.36、2.50,虽呈上升趋势,但数量偏少,涨幅小,导致该指标敏感度较差,无法区分二语者水平差异。此外,母语者话题链分句数为2.48,与高级二语者(2.50)相差甚微,再次验证,高级柬语母语者汉语水平与母语者基本持平。从语言类型看,柬语注重话题,突出主语,柬语母语者汉语作文均包含了一定数量的话题链分句,但差异较小,故话题链分句数无效。
(3)零形成分:零形成分数量主效应显著,F=33.528,P=0.000<0.05,多重比较发现,L1、L2、L3、L4差异显著(P<0.05)。因此,零形成分数量可以有效区分不同语言水平句法复杂度的差异,与吴继峰(2016,2018)实证结果一致。
综上所述,T单位数量、话题链数量、话题链长度、零形成分数量能成功区分不同语言水平句法复杂度的差异,为有效手段,而T单位长度、T单位分句数、话题链分句数为无效指标。其中,T单位各指标结果受母语影响较大,而话题链、零形成分及其指标主要体现了“汉语重视话题”这一特性。
3.2句法复杂度与写作质量的关系
为考察T单位数量、话题链数量、话题链长度、零形成分数量与写作质量的关系,本文进行了多元线性回归分析,自变量为上述4个指标,因变量为写作质量,即作文成绩,结果如表2、3所示。
表2显示,T单位数量、话题链数量、话题链长度、零形成分数量与写作质量有显著相关关系(P=0.000)。此外,任意两个自变量的相关性系数均小于0.7(r<0.7),表明本次回归模型出现多重共线性②的可能性小,结果较准确。