论歧义结构的潜在性* 冯志伟 (国家语言文字工作委员会) 【摘要】本文把作者在科技术语结构研究中提出的“潜在歧义论”( PA论)进一步推广到日常语言,说明在汉语日常语言中也广泛地存在着潜在歧义结构,而在具体的语言文本中,许多潜在歧义都消解了。自然语言有歧义性的一面,又有非歧义性的一面,潜在歧义论正好揭示了自然语言的歧义性和非歧义性对立统一的规律。潜在歧义论指出了潜在歧义结构本身就包含了消解歧义的因素,因而这种理论可为自然语言处理提供消解歧义的方法和手段。 关键词:潜在歧义论(PA论)、PT-结构、实例化、歧义性、非歧义性、歧义消解 歧义是自然语言中普遍存在的现象。早在两千三百年之前,古希腊哲学家亚里士多德(Aristoteles)就在他的《工具论·辨谬篇》中,探讨了自然语言的歧义问题,亚里士多德对歧义的研究是为哲学辩论中的语言应用服务的。1930年,恩普森(W. Empson)发表了《歧义的七种类型》(Seven Types of Ambiguity)一书,开始从语言理论的角度研究歧义问题。1971年,科艾(J. G.Kooij)发表了专著《自然语言的歧义》(Ambiguity in Natural Language),更进一步系统地来研究自然语言的歧义问题。在现代语言学的发展史上,歧义问题总是成为某个新的语言学派崛起时向传统阵地进击的突破口。美国描写语言学和乔姆斯基的转换生成语法都非常注意歧义问题的研究。 自然语言的歧义问题,实质上是意义与形式之间的矛盾问题。同一形式与不同的意义相联系,就必然会产生歧义,这是自然语言不同于人工语言的特点之一。托马斯(L.Thomas)指出,自然语言与其他任何二值逻辑通讯系统的根本区别,就在于自然语言有歧义。 在自然语言处理中,同形歧义是一个不能回避而且也无法回避的问题。同形歧义往往使得自然语言的自动剖析进退维谷,成为自然语言计算机处理的巨大障碍。因此,深入地探讨同形歧义对于自然语言计算机处理具有重要的作用。 为了从理论上概括语言中同形歧义结构的类型,朱德熙教授在《汉语句法中的歧义现象》一文中[1],提出了“歧义格式”这个概念。他认为,句子的歧义“是代表了这些句子的抽象的"句式"所固有的”,因此,他主张用“歧义格式”来概括语言中的同形歧义结构。朱德熙教授的这种见解是很有价值的,因为语言中的任何一个有结构歧义的形式,都不是孤零零地存在的,它往往代表具有某种格式的许许多多形式。抓住歧义格式是研究歧义的必要途径。 但是,朱德熙教授的关于“歧义格式”的见解,还有不完全之处。我们在自然语言处理的研究中发现,歧义格式所反映的类别的歧义,在具体的语言中有时存在,有时并不存在。当我们把具体的单词代入到歧义格式内的范畴符号(也就是类别符号)中,而使歧义格式实例化(instantiation)为具体的句子和词组的时侯,有的句子或词组中仍然可以保持歧义格式原有的歧义,而有的句子或词组中,歧义格式原有的歧义却消失了。 例如,英语中最常见的一种结构歧义有如下的歧义格式: VP + NP1 + Prep + NP2 当我们把VP实例化为saw,把NP2实例化为a boy,把Prep实例化为with,把NP1实例化为a telescope时,得到的“saw a boy with a telescope”是有歧义的,它可以解释为“用望远镜看小孩”,也可以解释为“看带着望远镜的小孩”。 可是,如果我们把VP, NP1, Prep, NP2等范畴符号实例化为别的单词或词组的时候,这个歧义格式中的歧义却消失了。请看如下的例子: She sent the ticket to New York. (1) (她把票寄到纽约) She lost the ticket to New York. (2) (她把到纽约的票丢失了) He cooks dinner for the children. (3) (他为孩子们做饭) The company sells toys for children. (4) (公司卖小孩玩具) 在(1)中,动词sent表示传送,具有趋向性,介词词组to New York作它的状语,不作名词词组the ticket的定语,歧义格式中的歧义消失了;在(2)中,动词lost表示丧失,不具有趋向性,介词词组to New York作名词词组the ticket的定语,不作动词lost的状语,歧义格式中的歧义也消失了;同样地,在(3)中,介词词组for the children作动词cooks的状语,表示目的,而不作名词dinner的定语,歧义格式中的歧义也消失了;在(4)中,介词词组for the children作名词toys的定语,而不作动词sells的状语,歧义格式中的歧义也消失了。 这说明,在研究同形歧义问题时,学者们归纳概括出来的歧义格式中所反映的歧义,并不是永远保持不变的,当用具体的单词去代替歧义格式中的范畴符号时,在所形成的具体的句子或词组中,歧义格式中原有的歧义有可能继续保持,也有可能不再继续保持而消失得无影无踪了。在歧义格式的研究中,这是一个值得特别注意的、带有普遍性的语言现象。国内外对汉语和英语的歧义格式作了十分深入的研究,可惜不少学者都忽略这个重要的语言现象。他们只看到歧义格式的歧义性的一面,没有看到歧义格式的非歧义性的一面。这实在是歧义格式研究中一个很大的缺陷。 在汉语的歧义格式中,也同样存在着歧义格式原有的歧义性不再保持的问题。例如,“VP + 的 + 是 + NP”是汉语中的一个歧义格式,其中的VP是一个双向动词,“VP + 的”作主语,“是 + NP”作谓语,整个格式是一个主谓结构,由于主语部分的“VP + 的”可以是施事,又可以是受事,因而产生了歧义。例如,如果我们把VP实例化为“反对”,把NP实例化为“少数人”,得到“反对的是少数人”这一句子,可以理解为“提反对意见的是少数人”,这时,主语“反对的”是施事,表示反对者,也可以理解为“所反对的是少数人”,这时,主语“反对的”是受事,表示被反对者。 当歧义格式“VP + 的 + 是 + NP”实例化为如下的句子时,这种歧义都一直保持着: “看的是病人”可以理解为“正在观看某种情况的是病人” (“看的”是施事),也可以理解为“被看的是病人”(“看的”是受事);“关心的是她母亲”可以理解为“她母亲关心某人某事”(“关心的”是施事),也可以理解为“被关心的人是她母亲”(“关心的”是受事); “扮演的是一个演员”可以理解为“一个演员扮演了剧中某个非演员的角色”(“扮演的”是施事),也可以理解为“被扮演成一个演员”(“扮演的”是受事); “援助的是中国”可以理解为“中国援助了别国”(“援助的”是施事),也可以理解为“别国援助了中国”(“援助的”是受事); “相信的是傻瓜”可以理解为“相信某种情况的人是傻瓜”(“相信的”是施事),也可以理解为“所相信的人是傻瓜”(“相信的”是受事)。 但是,如果我们把歧义格式“VP + 的 + 是 + NP”实例化为“关心的是分数”时,只可以理解为“所关心的事是分数”,“关心的”只能是受事,而不可能是施事,因为“分数”不可能去关心什么东西,这样,歧义格式中的原有的歧义就消失了。 如果把歧义格式“VP + 的 + 是 + NP”实例化为“反对的是战争”时,只可以理解为“被反对的东西是战争”,“反对的”只能是受事,而不可能是施事,因为“战争”作为无生命的事物,不会去反对什么东西,这样,歧义格式中原有的歧义也消失了。 如果我们把歧义格式“VP + 的 + 是 + NP”实例化为“发明的是一个工人”时,只能理解为“一个工人发明了什么东西”,“发明的”只能是施事,而不可能是受事,因为“工人”是不能被发明的,这样,歧义格式中原有的歧义也消失了。 汉语中“N1 + N2 + N3”是一种歧义格式,它可以理解为((N1 + N2) + N3),也可以理解为 (N1 + (N2 + N3)),层次结构各不相同,因而产生歧义。如“北欧语言研究会”,可以理解为((北欧语言)研究会),研究会只研究北欧的语言,如北欧的丹麦语、北欧的挪威语等,也可以理解为(北欧(语言研究会)),研究会进行各种各样的语言研究,不限于研究北欧的语言,这时,歧义格式中原有的歧义在具体的这个词组中仍然保持着,可是如果我们把“N1 + N2 + N3”实例化为“地名语源词典”,其层次结构只能分析为((地名语源)词典),这时,歧义格式中原有的歧义就消失了。 汉语的“ADJ + N1 + N2”也是一种歧义格式,因为它可以理解为((ADJ + N1) + N2), 也可以理解为(ADJ + (N1 + N2)), 其层次结构各不相同,因而产生歧义。如“小学生字典”,可以理解为 ((小学生)字典),表示这种字典是专供小学生用的,不是供中学生、大学生或其他人用的,也可以理解为 (小(学生字典)),表示这是一种小型的学生字典,可以供所有的学生使用,这时,这种歧义格式中原有的歧义在具体的这个词组中仍然保持着,可是,当我们把“ADJ + N1 + N2”这个歧义格式实例化为“新英汉词典”时,其层次结构只能分析为(新(英汉词典)),这时,歧义格式中原有的歧义就消失了。 由此可见,当我们在自然语言的歧义研究中,把具体的歧义词组或歧义句子概括为某种抽象的歧义格式的时候,这种抽象的歧义格式中所包含的歧义并不会始终保持着。这样的歧义在该歧义格式被实例化为其他的词组或句子的时候,有可能继续保持,也有可能消失。这是自然语言歧义格式研究区别于自然语言的一般句法研究的一个重要特点,我们在自然语言的歧义格式的研究中,不可不注意这一个重要特点。 在传统语言学的研究中,学者们曾经提出“type-token”的理论来解释“类型”(type)及其“类例”(token)的关系,根据“type-token”的理论,“类型”的性质应该在“类例”中反映出来,而“类例”只不过是“类型”的性质在语言材料中的实际体现而已。用“type-token”的理论来研究上述的歧义结构,歧义格式相当于“类型”,而实例化之后的具体的词组或句子相当于“类例”,显而易见, 在上述的歧义结构中,“类型”原有的歧义性并不能始终在其“类例”中体现出来,歧义结构的“类型”原来具有歧义,而与该“类型”相应的“类例”在一定条件下却可以不再具有歧义,“类型”原有的歧义会在“类例”中消失,而使“类例”变为没有歧义的结构,这样,“类型”的歧义性与“类例”在一定条件下的非歧义性便发生了矛盾,传统的“type-token”理论在解释歧义结构的“类型”和“类例”关系时,遇到了严峻的挑战。因此,我们有必要另辟蹊径,建立新的理论来解释歧义结构中的这种特殊现象。 我们在研究汉语术语歧义问题时,曾经提出过“潜在歧义论”(Potentional Ambiguity,简称PA论)[2],PA论认为,中文词组型科技术语中,当一个PT-结构(词组类型结构)对应于一个以上的SF-结构(句法功能结构)时,就有可能对这个PT-结构作出一种以上不同的解释,这时,就说这个PT-结构是潜在歧义结构,之所以说是“潜在歧义”,是因为在PT-结构实例化(instantiation)的过程中,这种歧义有可能继续保持,成为真歧义结构,也有可能得到消除,成为歧义消除结构,因而这种歧义是潜在的而不是现实的,它只是具有了歧义的可能性,但是还不一定具有歧义的现实性。 这种为分析汉语科技术语而提出的潜在歧义论,是不是也可以用来解释日常语言中的歧义现象呢?是不是不仅可以用来解释汉语日常语言中的歧义现象,而且也可以用来解释英语日常语言中的歧义现象呢? 下面,我们试着用潜在歧义论的观点来分析我们在上面提到的那些英语和汉语的歧义结构,细心的读者不难看出,潜在歧义论比传统的“type-token”理论确实具有更加强大的解释力。 根据潜在歧义论,英语的“VP + NP1 + Prep + NP2”这个结构是一个PT-结构,这个PT-结构可以对应于一个以上的SF-结构,因此,它是一个潜在歧义结构。当这个潜在歧义结构实例化为saw a boy with a telescope时,由于with a telescope在语义上既可作a boy的定语,又可作saw的状语,潜在歧义不能消失,于是,这个潜在歧义结构转化成了现实的真歧义结构。当这个潜在歧义结构实例化为lost the ticket to New York,由于to New York在语义上不能作lost的状语,只能作the ticket的定语,于是,潜在歧义消失,这个句子只能解释为“丢失了到纽约的票”,而不能解释为“到纽约丢失了票”,变成了一个歧义消除结构。可见,潜在歧义论完满地解释了“类型”中原有的歧义与“类例”中在一定条件下原有歧义消失的现象。 同样地,汉语中的“VP + 的 + 是 + NP”也是一个潜在歧义结构,其中的“VP + 的”既可以是施事,又可以是受事。当它实例化为“看的是病人”时,潜在歧义转化为现实的歧义,得到一个真歧义结构,但是,当它实例化为“关心的是分数“时,“关心的”只能是受事,潜在歧义消失,得到了一个歧义消除结构,而当它实例化为“发明的是一个工人”时,“发明的”只能是施事,潜在歧义消失,得到了一个歧义消除结构。 汉语中的“N1 + N2 + N3”也是一个潜在歧义结构,其层次可以理解为((N1 + N2) + N3),也可以理解为(N1 + (N2 + N3)),有几何歧义。当这些潜在歧义结构实例化为“北欧语言研究会”时,可以理解为“北欧语言的研究会”,也可以理解为“北欧的语言研究会”,潜在歧义转化为现实的歧义,得到一个真歧义结构;但是,当这个潜在歧义结构实例化为“地名语源词典”时,潜在歧义消失,成为了歧义消除结构。 汉语中的“ADJ + N1 + N2”也是一个潜在歧义结构,其层次可以理解为((ADJ + N1) + N2),也可以理解为 (ADJ + (N1 + N2)),有几何歧义。当这个潜在歧义结构实例化为“小学生词典”时,可以理解为“小学生用的词典”,也可以理解为“小型的学生词典”,潜在歧义转化为现实的歧义,得到一个真歧义结构,但是,当这个潜在歧义结构实例化为“新英汉词典”时,潜在歧义消失,成为了歧义消除结构。 通过用潜在歧义论对上面的语言现象的解释,使我们认识到,潜在歧义是存在于自然语言中的一个普遍现象,它不仅存在于科技术语中,也存在于日常语言中,不仅存在于汉语中,也存在于英语等外语中。潜在歧义论加深了我们对于自然语言同形歧义问题的认识。 近年来,国内外学者对于汉语日常语言中的歧义问题,进行了广泛的研究,他们的研究涉及了不少的歧义格式[1,3,4,5]。不过,由于长期以来传统的“type-token”理论的影响十分深远,这些研究都有一个共同的缺点,他们只是非常详尽地说明了这些歧义格式的歧义性,而很少说明(或者“没有发现”)这些歧义格式的非歧义性,他们力图保持传统的“type-token”理论的模式,力图把“类型”的歧义性保持在“类例”之中,力图使“类例”成为“类型”的歧义性的说明或体现,因而这些研究都是不全面的。有时,虽然个别研究者也看到了某些歧义格式中的歧义会消失掉,但是,他们把这看成是歧义格式的例外,不能从理论上对这种例外作出完满的解释,感到困惑不解。下面,我们从“潜在歧义论”的角度出发,对日常汉语中常见的歧义格式作进一步的分析,不但指出它们歧义性的一面,而且着重指出它们非歧义性的一面,从而更加深化我们对于过去已经研究过的那些被认为只有歧义性的歧义格式的认识。 “VP + N1 + 的 + N2”是汉语研究中最早发现的一种歧义格式。在这个格式中,N1可作为VP的宾语,述宾结构“VP + N1”加上“的”之后,作名词N2的定语,整个结构是一个定中结构,N1又可与“的”结合在一起作N2的定语,“N1 + 的 + N2”这个名词词组再作为VP的宾语,整个结构是一个述宾结构,因此,产生定中—述宾潜在歧义。 当实例化为“咬死了/猎人/的/狗”时,可以理解为“咬死了一只猎人的狗”,“猎人的狗”作“咬死了”的定语,整个结构是述宾结构,又可以理解为“一只把猎人咬死的狗”,“咬死了猎人”是“狗”的定语,整个结构是定中结构,这样,潜在歧义就变成了现实的歧义。这是朱德熙教授在60年代初期就发现的一个歧义格式,朱德熙教授根据这样的语言现象,提出了汉语句法结构的新理论,对现代汉语语法的研究作出了重要贡献。可惜当时朱德熙教授没有注意到,在“VP + N1 + 的 + N2”这个歧义格式中还隐藏着非歧义性的一面。可喜的是,后来有学者发现,“VP + N1 + 的 + N2”这个歧义格式并不是始终具有歧义,在实例化时也有可能成为为非歧义的语言结构。 当实例化为“咬死了/猎人/的/鸡”时,“猎人的鸡”作为“咬死了”的宾语,整个结构只能理解为述宾结构,潜在歧义消失。 当实例化为“咬死了/狐狸/的/狗”时,“咬死了狐狸的”作“狗”的定语,整个结构只能理解为定中结构,潜在歧义消失。 当实例化为“卖掉了/猎人/的/狗”时,“猎人的狗”作为“卖掉了”的宾语,整个结构只能理解为述宾结构,潜在歧义消失。 这样的发现是可贵的,可惜这些学者没有把他们的发现推广到其他的歧义格式,没有看到这是一切歧义格式所共有的普遍的语言现象。 “潜在歧义论”认为,所有的歧义格式在一定条件下都有可能实例化为非歧义的结构。因此,我们还有必要从“潜在歧义论”的角度,来进一步研究其他歧义格式的非歧义性的方面,以弥补过去学者们在歧义格式研究中的不足,使我们对于歧义格式的性质,获得与传统的“type-token”理论不同的全新的认识。下面,我们继续对过去已经发现具有歧义的某些歧义格式进行分析,并指出其非歧义的方面。 “VP + ADJ + 的 + N”也是一种歧义格式。其中的ADJ可以作为VP的宾语,述宾结构“V + ADJ” 再加上“的”作名词N的定语,整个结构是一个定中结构,但是,ADJ也可以加上“的”之后作为名词N的定语,“ADJ + 的 + N” 整个名词词组作为VP的宾语,整个结构是一个述宾结构。因此,就产生了定中—述宾潜在歧义。 当实例化为“喜欢/干净/的/小孩”时,可理解为“喜欢某一个干净的小孩”(述宾结构),也可以理解“某一个喜欢干净的小孩”(定中结构),潜在歧义转化为现实的歧义。 根据潜在歧义论我们知道,这个歧义格式也可以实例化为“研究/困难/的/问题”,这时,这个语言片段只能理解为“研究/某些困难的问题”,“困难的问题”作为“研究”的宾语,形成述宾结构,潜在歧义消失。 同样的理由,当这个歧义格式实例化为“显得/宽阔/的/街道”时,“显得宽阔的”作为“街道”的定语,形成定中结构,潜在歧义也消失。 “N1 + 的 + N2 + 和 + N3”也是一种歧义格式。由于连词“和”管辖领域的不同,其层次可以理解为 “ (N1 + 的 + N2) + 和 + (N3)”,也可以理解为 “N1 + 的 + (N2 + 和 + N3)”,从而产生潜在歧义。 当实例化为“衣服/的/袖子/和/口袋”时,可以理解为“(衣服的袖子)和(口袋)”,也可以理解为“衣服的(袖子和口袋)”,潜在歧义转化为现实的歧义。 可是,当实例化为“衣服/的/袖子/和/拐杖”时,只能理解为“(衣服的袖子)和(拐杖)”,潜在歧义消失。 “N1 + 和 + N2 + 的 + N3”也是一种歧义格式。由于连词“和”管辖领域的不同,其层次可以理解为“ (N1 + 和 + N2) + 的 + N3”,也可以理解为 “N1 + 和 + (N2 + 的 + N3)”,从而产生潜在歧义。 当实例化为“桌子/和/椅子/的/腿”时,可以理解为“(桌子和椅子)的腿”,也可以理解为“桌子和(椅子的腿)”,从而产生潜在歧义。 可是,当实例化“地毯/和/桌子/的/腿”时,只能理解为“地毯和(桌子的腿)”,潜在歧义消失。 “V + N1 + N2”也是一种歧义格式。N1和N2可以分别作V的宾语, 形成双宾语结构, N1又可作N2的定语,组成“N1 + N2”的名词词组作V的宾语,这就产生了双宾语结构和述宾结构的潜在歧义。 当实例化为“赠/意大利/图书”,可以把“意大利”理解为“赠”的间接宾语,把“图书”理解为“赠”的直接宾语,整个结构是一个双宾语结构;又可以把“意大利”理解为“图书”的定语。“意大利图书”理解为“赠”的宾语,整个结构是一个述宾结构,这样,潜在歧义就转化成了现实的歧义。 可是,当实例化为“修理/木头/桌子”时,只能把“木头桌子”理解为“修理”的宾语,整个结构是一个述宾结构,潜在歧义消失。 当实例化为“交/老师/作业本”时,只能把“老师”理解为“交”的间接宾语,把“作业本”理解为直接宾语,整个结构是双宾语结构,潜在歧义消失。 “数量结构 + NP1 + 的 + NP2”也是一种歧义格式。“数量结构”可以限定NP1,作NP1的定语,又可以限定“NP1 + 的 + NP2”,作“NP1 + 的 + NP2”的定语,因而产生歧义。 当实例化为“三个/学校/的/实验员”时,可以理解为“(三个/学校)/的/实验员”(“三个”限定“学校”),又可以理解为“三个/(学校/的/实验员)”(“三个”限定“学校的实验员”),潜在歧义转化为现实的歧义。 可是,当实例化为“三所/学校/的/实验员”时,只能理解为“(三所/学校)/的/实验员”(“三所”限定“学校”,不能限定“实验员”),潜在歧义消失;当实例化为“三位/学校/的/实验员”时,只能理解为“三位/(学校/的/实验员)”(“三位”限定“学校的实验员”,不能限定“学校”),潜在歧义消失。 汉语中的“VP + 数量结构 + NP”也是一种歧义格式。数量结构可以作VP的补语,又可以作NP的定语,这就产生了潜在歧义。 当实例化为“发了/三天/工资”时,可以理解为“(发了/三天)/工资”(“三天”作“发了”的补语),又可以理解为“发了/(三天/工资)”(“三天”作“工资”的定语),潜在歧义转化为现实的歧义。 可是,当实例化为“(写了/两天)/文章”时(“两天”作“写了”的补语,但“两天”不能作“文章”的定语),潜在歧义消失;当实例化为“写了/(一篇/文章)”时(“一篇”作“文章”的定语,但“一篇”不能作“写了”的补语),潜在歧义也消失。 上面的例子是改变数量结构中的量词来消除歧义,有时,改变数量结构中的数词也可以消除歧义。例如,当实例化为“讲了/三年/历史”时,“三年”可以理解为“讲了”的补语,又可以理解为“历史”的定语,潜在歧义转化为现实歧义,但是,当实例化为“讲了/三千年/历史”时,“三千年”只能作“历史”的定语,不能作“讲了”的补语,潜在歧义消失。 在汉语日常语言中的潜在歧义结构还很多,以上只是举出常见的几种来说明,潜在歧义不仅是汉语科技术语中的普遍存在的现象,而且也是汉语日常语言中普遍存在的现象。 从上所述可以看出,尽管在自然语言中存在大量的同形歧义结构,但是,它们的PT-结构都是潜在歧义结构,在PT-结构实例化的过程中,由于词汇单元的插入,使得许多潜在歧义结构未能转化为现实的歧义结构,从而导致潜在歧义的消失。这说明自然语言的结构在其实例化过程中有一种自行消解歧义的功能,正是由于这种自行消解歧义的功能的作用,尽管在自然语言中存在大量的潜在歧义结构,但在具体的语言活动中,许多潜在歧义都消解了,也正是因为这个原因,自然语言仍然能够完成其交流思想的功能,不至于处处产生歧义,引起误解。可见,自然语言有其歧义性(ambiguousness)的一面,又有其非歧义性(nonambiguousness)的一面,自然语言中充满着潜在歧义,是其歧义性的表现,而自然语言的这种自行消解歧义的功能,又是其非歧义性的表现。我们提出的“潜在歧义论”,正好揭示了自然语言的这种歧义性和非歧义性对立统一的规律性。我们在自然语言处理中,有必要利用“潜在歧义论”的基本原理,克服自然语言的歧义性,增加自然语言的非歧义性,从而提高自然语言处理系统的效能。 既然潜在歧义结构体现了自然语言的歧义性和非歧义性的对立统一,这就意味着潜在歧义结构本身就包含了消解歧义的因素,我们在自然语言处理中,只要仔细研究潜在歧义结构中歧义消除的原因,就不难找到消解歧义的方法和手段。 在潜在歧义结构“VP + 的 + 是 + NP”中,只有当“VP + 的”既可以作施事,又可以作受事时,才会产生现实的歧义,可见,产生现实歧义的关键是NP与VP之间在语义上的施受关系,当NP在语义上可同时作VP的施事与受事时,必定会产生现实的歧义。因此,潜在歧义结构“VP + 的 + 是 + NP”转化为现实的歧义结构的条件有两个:①NP在语义上可作VP的施事,② NP在语义上可作VP的受事。只有同时满足①②两个条件,才会产生现实的歧义。“反对的是少数人”既满足条件①,又满足条件②,潜在歧义结构转化为现实的歧义结构。“反对的是战争”只满足条件②,不满足条件①,歧义得到消解。“发明的是一个工人”只满足条件①,不满足条件②,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解的手段是设法让NP在语义上不能同时作VP的施事与受事,只要实现了这样的手段,歧义必然消解。 在潜在歧义结构“N1 + N2 + N3”中,只有当N1在语义上既可以限定N2,又可以限定“N2 + N3”这个名词词组时,才会产生现实的歧义。只要N1在语义上只能限定N2或名词词组“N2 + N3”其中的一个,而不能同时限定两者,歧义就会得到消解。因此,潜在歧义结构“N1 + N2 + N3”转化为现实的歧义结构的条件有两个:① N1在语义上可以限定N2,② N1在语义上可以限定“N2 +N3”,只有同时满足①②两个条件,才会产生现实的歧义。“北欧语言研究会”既满足条件①,又满足条件②,潜在歧义结构转化为现实的歧义结构。“地名语源词典”只满足条件①,不满足条件②,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解的手段是设法让N1在语义上不能同时限定N2和“N2 +N3”,只要实现了这样的手段,歧义必然消解。 在潜在歧义结构“ADJ + N1 + N2”中,只有当ADJ在语义上既可以修饰N1,又可以修饰“N1 + N2”这个名词词组时,才会产生现实的歧义,只要ADJ在语义上只能修饰N1或名词词组“N1 + N2”其中的一个,而不能同时修饰两者,歧义就会得到消解右虼耍痹谄缫褰峁埂癆DJ + N1 + N2”转化为现实的歧义结构的条件有两个:①ADJ在语义上可以修饰N1,②ADJ在语义上可以修饰“N1 +N2”,只有同时满足①②两个条件,才会产生现实的歧义。“小学生字典”既满足条件①,又满足条件②,潜在歧义结构转化为现实的歧义结构。“新英汉词典”只满足条件②,不满足条件①,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让ADJ在语义上不能同时修饰N1和“N1 + N2”,只要实现了这样的手段,歧义必然消解。 在潜在歧义结构“VP + N1 + 的 + N2”中,只有当N1和N2两者在语义上都可以作VP的受事,而当N1为VP的受事时,N2又可作为VP的施事,并且N1与N2之间在语义上存在领属和被领属的关系(N1是领属者,N2是被领属者)的时候,才会产生现实的歧义,如果不能同时满足这些条件,歧义就会得到消解。因此,潜在歧义结构“VP + N1 + 的 + N2”转化为现实的歧义结构的条件有四个:① N1在语义上可以作VP的受事, ② N2在语义上可以作VP的受事,③ N1为VP的受事时,N2又可作为VP的施事,④ N1在语义上是N2的领属者,N2在语义上是N1的被领属者,只有同时满足①②③④四个条件,才会产生现实的歧义。“咬死了猎人的狗”同时满足条件①②③④,潜在歧义结构转化为现实的歧义结构。“咬死了猎人的鸡”只满足条件①②④,不满足条件③,歧义得到消解。“咬死了狐狸的狗”只满足条件①②③,不满足条件④,歧义得到消解。“卖掉了猎人的狗”只满足条件②④,不满足条件①③,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让上述的四个条件不能同时满足,只要不能满足上述四个条件中的任何一个,歧义必然消解。 在潜在歧义结构“VP + ADJ + 的 + N”中,只有当ADJ和N两者在语义上都可以作VP的宾语,而且ADJ在语义上又能修饰N的时候,才会产生现实的歧义,如果不能同时满足这些条件,歧义就会得到消解。因此,潜在歧义结构“VP + ADJ + 的 + N”转化为现实的歧义结构的条件有三个:① ADJ在语义上可以作为VP的宾语,② N在语义上可以作为VP的宾语,③ ADJ在语义上可以修饰N,只有同时满足①②③三个条件,才会产生现实的歧义。“喜欢干净的小孩”同时满足①②③三个条件,潜在歧义结构转化为现实的歧义结构。“研究困难的问题”只满足条件②③,不满足条件①,歧义得到消解。“显得宽阔的街道”只满足条件①③,不满足条件②,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让上述三个条件不能同时满足,只要不能满足上述三个条件中的任何一个,歧义必然消解。 在潜在歧义结构“N1 + 的 + N2 + 和 + N3”中,只有当N1在语义上可以同时限定N2和N3时,才会产生现实的歧义,当N1在语义上不能限定N3时,歧义就会得到消解。因此,潜在歧义结构“N1 + 的 + N2 + 和 + N3”转化为现实的歧义结构的条件有两个:① N1在语义上可以限定N2,② N1在语义上可以限定N3,只有同时满足①②两个条件,才会产生现实的歧义。“衣服的袖子和口袋”同时满足①②两个条件,潜在歧义结构转化为现实的歧义结构。“衣服的袖子和拐杖”只满足条件①,不满足条件②,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让N1在语义上不能同时限定N2和N3,只要实现了这样的手段,歧义必然消解。 在潜在歧义结构“N1 + 和 + N2 + 的 + N3”中,只有当N1和N2在语义上都可以限定N3时,才会产生现实的歧义,当N1在语义上不能限定N3时,歧义就会得到消解。因此,潜在歧义结构“N1 + 和 + N2 + 的 + N3”转化为现实的歧义结构的条件有两个:① N1在语义上可以限定N3,② N2在语义上可以限定N3,只有同时满足①②两个条件,才会产生现实的歧义。“桌子和椅子的腿”同时满足①②两个条件,潜在歧义结构转化为现实的歧义结构。“地毯和椅子的腿”只满足条件②,不满足条件①,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让N1和N2在语义上不能同时限定N3,只要实现了这样的手段,歧义必然消解。 在潜在歧义结构“V + N1 + N2”中,只有当N1和N2在语义上可以作V的双宾语,而且N1和N2之间在语义上又存在限定和被限定的关系(N1是限定者,N2是被限定者)的时候,才会产生现实的歧义,如果不能同时满足这些条件,歧义就会得到消解。因此,潜在歧义结构“V + N1 + N2”转化为现实的歧义结构的条件有三个:① N1在语义上可以作V的间接宾语,② N2在语义上可以作V的直接宾语,③ N1在语义上可以限定N2,只要同时满足①②③三个条件,才会产生现实的歧义。“赠意大利图书”同时满足①②③三个条件,潜在歧义结构转化为现实的歧义结构。“修理木头桌子”只满足条件②③,不满足条件①,歧义得到消解。“交老师作业本”只满足条件①②,不满足条件③,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让上述三个条件不能同时满足,只要不能满足上述三个条件中的任何一个,歧义必然消解。 在潜在歧义结构“数量结构 + NP1 + 的 + NP2”中,只有当数量结构中的量词既可以限定NP1,又可以限定NP2的时候,才会产生现实的歧义,如果数量结构中的量词只能限定NP1或NP2中的某一个,歧义就会得到消解。因此,潜在歧义结构“数量结构 + NP1 + 的 + NP2”转化为现实的歧义结构的条件有两个:① 数量结构中的量词可以限定NP1,② 数量结构中的量词可以限定NP2,只要同时满足①②两个条件,才会产生现实的歧义。“三个学校的实验员”同时满足①②两个条件,潜在歧义结构转化为现实的歧义结构。“三位学校的实验员”只满足条件②,不满足条件①,歧义得到消解。“三所学校的实验员”只满足条件①,不满足条件②,歧义得到消解。由此可见,这种潜在歧义结构的歧义消解手段是设法让数量结构中的量词不能同时限定NP1和NP2,只要数量结构中的量词只能限定其中的一个,歧义必然消解。 在潜在歧义结构“VP + 数量结构 + NP”中,只有当数量结构既可以作VP的补语,又可以作NP的定语的时候,才会产生现实的歧义,如果不能同时满足这些条件,歧义就会得到消解。因此,潜在歧义结构“VP + 数量结构 + NP”转化为现实的歧义结构的条件有两个:① 数量结构可以作VP的补语,② 数量结构可以作NP的定语,只要同时满足①②两个条件,才会产生现实的歧义。“发了三天工资”同时满足①②两个条件,潜在歧义结构转化为邮镜钠缫褰峁埂!靶戳肆教煳恼隆敝宦闾跫伲宦闾跫冢缫宓玫较狻!敖擦巳昀贰敝宦闾跫冢宦闾跫伲缫宓玫较狻S纱丝杉庵智痹谄缫褰峁沟钠缫逑馐侄问巧璺ㄈ檬拷峁共荒芗茸魑猇P的补语,又作为NP的定语,只要数量结构只能充当其中的一种句法功能,歧义必然消解。 由此可见,潜在歧义结构本身就包含了消解歧义的因素,我们只要为每种潜在歧义结构分别提供相应的消解歧义的条件,再通过适当的逻辑推理,就可以达到消解歧义的目的。在自然语言的自动分析中,由潜在歧义结构本身给我们提供的消解歧义的条件,可以帮助我们确定所分析的潜在歧义结构是否会转化为现实的歧义结构;在自然语言的自动生成中,由潜在歧义结构本身给我们提供的消解歧义的条件,可以帮助我们减少或避免现实的歧义结构的生成,从而提高自然语言自动生成的正确率。这就是潜在歧义的理论对于自然语言处理的实践的作用。 参考文献 [1] 朱德熙,汉语句法中的歧义现象,《现代汉语语法研究》,商务印书馆,1980年。 [2] 冯志伟,中文科技术语的结构描述和潜在歧义,《中文信息学报》,1989年,第2期。 [3] 孙茂松、黄昌宁,汉语中的兼类词、同形词类组及其处理策略,《中文信息学报》,1989年,第4期。 [4] Chao-Huang Chang, Gilbert K. Krulee, Resolution of Ambiguity in Chinese and Its Application to Machine Transaltion, Machine Transaltion, 6, 1991/1992. [5] 石安石,《语义论》,商务印书馆,1993年。 本文发表在《中文信息学报》 第9卷 第4期 PP14~32,1995年 -------------------------------------------------------------------------------- * 本文得到国家自然科学基金资助,项目号:69483003.