

《名词句法语义信息词典》知识内容说明书
作者: 袁毓林 曹宏
[摘 要] 本文首先介绍《名词句法语义信息词典》的内容结构与理论背景,然后介绍其所区分的5种名词小类的定义及其跟7种量词的选择限制,其为名词所设置的10种物性角色及其定义,由目标名词跟这些物性角色的不同配置而造成的10来种句法格式及其例句,其所考察的名词的8种主要的语法功能及其对于该词类的隶属度;最后给出《名词句法语义信息词典》中检索系统的界面截图。
[中图分类号] H06;H164 [文献标识码] A [文章编号] 1674-8174(2025)01-0022-09
1. 引言
《汉语名词句法语义功能信息词典暨检索系统》(简称《名词句法语义信息词典》),是袁毓林教授主持的《北京大学现代汉语实词句法语义功能信息词典》(简称《实词信息词典》)项目的一个子系统,收入常用名词2万多个,2.5万多个义项条目。下面主要介绍《名词句法语义信息词典》的知识内容和体系结构,包括:其所区分的5种名词小类的定义及其跟7种量词的选择限制,其为名词所设置的10种物性角色及其定义,由目标名词跟这些物性角色的不同配置而造成的10多种句法格式及其例句,所考察的名词的8种主要的语法功能及其对于该词类的隶属度。最后给出《名词句法语义信息词典》中检索系统的界面截图。
2. 《名词句法语义信息词典》的内容结构和理论背景
《名词句法语义信息词典》主要描写名词跟其他词语的搭配方式和相关语义成分的句型构造。通过语料调查,我们可以发现,名词在句子中主要作主语、宾语或定语,表示事物(包括:人、动物、植物或其他物品、以及时间、空间、属性、状态或事件等)的名称;跟它搭配的主要是动词和形容词等词语,表示跟这种事物相关的动作、行为、性质、状态或关系等语义关系;并且这些语义关系可以概括为数目有限的几种类型。比如:
施成:动词表示造成名词所指事物的动作、行为,如:做—椅子、生—小兔子;
功用:动词表示名词所指事物的功能或用途,如:坐—椅子、喝—啤酒、刀—切;
行为:动词表示名词所指事物的惯常性行为,如:河水—流淌、兔子—跳/跑;
处置:动词表示对名词所指事物的影响性动作、行为,如:修—椅子、卖—兔子;
评价:形容词表示对名词所指事物及其相关行为的评论,如:好—椅子、洁白—兔子、啤酒—可口、河水—清澈、拖把—好用,等等。
显然,这种名词和动词、形容词之间的施成、功用、行为、处置、评价等语义关系,是由名词所指事物的某种物质或社会属性、以及人们对此的主观经验所决定的。这种融合了客体特质(objective stuff)与主体认识(subjective cognition)两方面信息的事物性质(比如,刀是由钢铁制成的、有锋刃的、用来切/割/削/砍/劈/刺/刮/剐/铡的工具),可以抽象地称为“物性”(qualia)。① 为了从名词的视角反映这种词语搭配和语义选择关系,可以分别地称表示名词所指事物的施成、功用、行为、处置、评价等的动词、形容词为相应名词的施成角色、功用角色、行为角色、处置角色、评价角色等。由于这些语义角色都是由相应名词的物性所决定的,因而这种语义角色可以称为物性角色(qualia roles)。②
除此之外,名词跟与之共现的名词之间也可能存在着稳固的物性角色关系。比如:
形式:一个名词的所指事物表示了另一个名词的所指事物的种类或归属,如:水—液体、兔子—小动物、医生—人/职业、玫瑰—花卉/植物;
构成:一个名词的所指事物是另一个名词的所指事物的组成部分,如:靠背—椅子、客房—宾馆、尾巴—兔子、把手—车门;
材料:一个名词的所指事物表示了造成另一个名词的所指事物的原料或材质,如:塑料—椅子、电子—图书、青铜—雕像、柏油—马路。
有了诸如此类的名词的物性角色这种概念和理论工具,我们就可以方便地描写和分析汉语某些复杂的话题句的构成方式及其语义解释了。详细的举例和讨论,请看袁毓林(2014)。
从上面的讨论可见,一定的名词可预见地带有一定数量和种类的物性角色。因此,可以抽象地说,名词和它的物性角色构成了一种相对自足的语义结构。由于这种语义结构是由名词的物性决定的,因而可以称其为物性结构(qualia structure)。显而易见,名词的物性结构知识,对于分析复杂句子的句法-语义关系、对于说明复杂句子的语义推理和理解的机制,都有很强的解释力量。比如,有了这种名词的物性结构理论,我们还可以对有关名词性结构,甚至句型和构成的语义作出确定的预测和充分的解释。详细的举例和讨论,请看袁毓林、曹宏(2021)。
显然,了解一个名词跟什么样的物性角色搭配、它们怎样搭配、它们组合起来以后描述了一种什么样的情境,也就基本掌握了一个名词的意义和用法。美国著名的认知心理学家Steven Pink形象地说:“一个动词不仅仅是一个用于指称动作或状态的词,它实际上是句子的‘底盘’。它为该句子的其他成分提供了一个多槽的框架,在这里,无论主语、宾语还是各种介词宾语和从句等成分都可以各就各位,各司其职”(Pinker,2007)。相应地,我们也可以形象地说:“一个名词不仅仅是一个用于指称事物的词,它实际上是跟句子的‘底盘’相匹配的各种组件。不同的名词就是型号不同的组件,它们各就各位地插入由动词(或形容词)为该句子提供的多槽的框架,各司其职地充当句子的主语、宾语或介词宾语等成分”。有趣的是,配价语法理论曾经把动词想象成各种带钩子的原子,不同的动词所带的钩子的数量和形状不尽相同,结果它们的配价能力和论元结构不同。现在,我们也可以直观地把名词想象成各种带环的原子,不同的名词所带的环的数量和形状不尽相同,结果它们的组配能力和物性结构不同。于是,动词和名词之间就可预测地互相匹配、有条件地双向选择:带特定数量和形状的环的名词,让带特定数量和形状的钩子的动词勾住,一起构成在句法、语义上协调融洽的句子。因此,我们依然可以在配价语法的描写体系和理论视野之下,来看待和描述名词的物性结构及其相关的句法、语义功能。从动词的论元结构的角度看,动词是支配成分,名词是配价成分;从名词的物性结构的角度看,动词是名词的物性角色。但是,从整个句子的语义骨架(命题结构)的角度看,名词是动词性成分的配价成分,名词的动词性物性角色是支配成分。
《名词句法语义信息词典》就是从这样一种“情境语义学”(situation semantics)、“配价语法”(valence grammar)和“生成词库论”(generative lexicon theory)的角度,通过对大规模真实文本语料的调查和分析,来全面、准确、简明地描写名词在情境意义和搭配用法上的关键性特点,使读者“观其伴,会其意;明其性,知其用”;即让读者在查阅一个名词的条目以后,可以了解该名词通常跟哪些支配它的成分一起出现,从而从搭配关系上理解该名词的意义、明白其物性结构和配价组合方面的特点、并掌握其基本的常用组合方式;进而根据这些组合方式、模仿相关组合实例,可以依葫芦画瓢,万无一失地造出合语法、有意义的词组或句子来。
下面,介绍这部词典的名词小类、物性角色、句法格式和语法功能的描写体系。
3. 《名词句法语义信息词典》的名词小类及其定义
这里的名词是根据其用法(即语法功能)来定义的,指具有下面这些语法功能的词:(1)可以作主语、宾语或定语,(2)可以受数量词、形容词、名词或“的”字结构修饰,(3)不能受副词修饰、不能作谓语。我们按照语法功能,把名词分为下列五种:
<个体名词> <物质名词> <集体名词> <抽象名词> <专有名词>
下面介绍各种名词小类的功能定义。由于我们对名词划分小类的一个重要依据是它们跟不同小类的量词的选择限制和搭配关系,因而我们随后给出名词小类跟量词小类之间的搭配限制关系表。
各种名词小类的具体定义和判定标准如下:①
名词:可以作主语、宾语或定语,可以受数量词、形容词、名词或“的”字结构修饰,不能受副词修饰、不能单独作谓语的词。分为如下五种小类:
(1)个体名词:能够跟自己适用的个体量词或者通用量词“个”搭配的名词。例如:
一扇门 | 一头猪 | 两本书 | 三盏灯 | 一条口子 | 几位客人 | 八道大菜 | 一棵松树 | 一个小偷 | 两个草莓 | 三个问题 | 四个包子 | 五个笔袋
(2)物质名词:没有自己适用的个体量词,只能跟表示度量衡的标准量词、临时量词、不定量词搭配的名词。例如:
一斤油 | 三尺白布 | 五吨钢材 | 两桶水 | 一缸面粉 | 一些灰尘 | 一堆黄沙 | 一块塑料
(3)集体名词:不能跟个体量词搭配,只能跟表示群体的集体量词、不定量词或临时量词搭配的名词。例如:
一批枪支 | 一队官兵 | 一双儿女 | 一群子女 | 一些父母 | 一部分亲友 | 一屋子桌椅 | 一车纸张 | 一身病痛 | 一点儿痛痒
(4)抽象名词:不能跟个体量词或标准量词搭配,只能跟表示种类的集体量词、不定量词、专用动量词搭配的名词。例如:
一种礼节 | 一种风气 | 一类观念 | 一类情绪 | 一派胡言 | 一点儿成绩 | 一些交情 | 一场祸 | 一次灾难 | 一些火气 | 一点儿争执
(5)专有名词:一般不能受数量词修饰的名词。例如:
屈原 | 汨罗江 | 楚怀王 | 孔子 | 泰山 | 李冰 | 都江堰 | 范仲淹 | 岳阳楼 |洞庭湖 | 凤凰岭 | 长城 | 官厅水库 | 长江 | 黄河 | 唐古拉山 | 腾格里沙漠
需要注意的是,根据上述定义,少数名词可能会兼属于个体名词和物质名词两种类别。例如:
一个面包 ~ 一片/块面包 | 两个/颗石子儿 ~ 两堆/吨石子儿
但是,个体名词用表示容器的临时量词的场合,不必要认为是兼属于物质名词。因为,表示容器的临时量词可以用于所有的个体名词。①
上面关于名词小类跟量词小类之间的搭配限制,可以总结成下表:②
4. 《名词句法语义信息词典》的物性角色系统及其定义
我们借鉴生成词库论(generative lexicon theory)关于词项的语义表达,特别是物性结构的有关学说,同时根据汉语名词在文本中基本的组合方式、搭配习惯和语义解释,并且从服务国际中文教育和中文信息处理这种应用需求出发,来设计汉语名词的物性结构的描述体系。具体地说,我们不单独设立论元结构、事件结构、词汇继承结构,而是把相关的语义知识统统包含在物性结构中,特别是分别融入有关物性角色的描述中。
我们在语料调查的基础上,为汉语名词的物性结构设立十种物性角色,定义和例子如下:
(1)形式(formal,简写为FOR):名词的分类属性、语义类型和本体层级特征。
比如,“石头”是“有形物质、自然物”、“兔子”是“小动物、哺乳动物”,“沙滩”是“空间、处所、陆地、滩地”,“细菌”是“微生物、原核生物”,“椅子”是“家具、坐具”, “手”是“人体、上肢、身体构件”,“合同”是“抽象事物、法规、契约、文书”,等等。
(2)构成(constitutive,简写为CON):名词所指的事物的结构属性,包括:构成状态、组成成分、在更大的范围内构成或组成哪些事物、跟其他事物的关系,也包括物体的大小(magnitude)、形状(shape)、维度(dimensionality)、颜色(color)和方位(orientation),等等。
比如,“石头”的构成是“矿物;可以根据下列颜色、形状、作用等属性进行分类:彩色、黑色、红色、褐色、白色、圆形、柱形、棱角分明、保健,等等”;“细菌”的构成是“用显微镜才能看见的微生物,是原核生物的一个大类;形状有球形、杆形、螺旋形、弧形和线形等多种,一般都用分裂繁殖;在自然界中分布很广,存活在空气、水、土、植物和动物中;有的细菌对人类有利”;“椅子”的构成是“一般有靠背、腿儿、面儿、扶手等构件;可以根据颜色进行分类:白色、黄色、黑色、红色,等等”;“书”的构成是“一般由纸张、文字、图画,内容、信息等物质和文化因素组成;可以根据科目、内容或功能进行分类:语文、数学、历史、地理、化学、物理、生物、外语、经、兵、农、医、历、纬、佛、禅、辑佚、必读、参考,等等;也可以根据颜色进行分类:白色、黄色、绿色、黑色、红色、褐色、棕色,等等”。