文档库 最新最全的文档下载
当前位置:文档库 › In_【战略管理】第四章典型的短语歧义格式举例及相应的排歧策略

In_【战略管理】第四章典型的短语歧义格式举例及相应的排歧策略

面向中文信息处理的现代汉语短语结构规则研究

第五章现代汉语短语结构歧义的消解策略分析

§5.1 现代汉语短语结构歧义消解策略概述

实际上在第三章介绍具体的短语结构规则和在第四章宏观地分析现代汉语短语结构组合的各种歧义类型时,已经涉及到了不少有关解决歧义结构分析问题的具体措施,并提出了一些原则性的看法。本章主要是在此基础上,更集中地来讨论短语结构歧义的消解策略。

概括而言,所有的短语结构歧义,都应该可以转化为两项成分的搭配问题来描述1。这包括:

(一)两项成分能否搭配2。表现在形式规则上就是,有没有一条关于某两个成分的组合规则。比如,假设一个规则集合中只有一条“vp->vp np”规则,那么关于vp跟np两项成分组合,不会有歧义,但如果再引入一条规则“np->vp np”,显然就会发生歧义,即vp 跟np组合,既可以理解为vp,也可以理解为np。

不难看出,向规则集中增加规则,提高了规则对所描述的语言对象的覆盖能力。但必须意识到,增加一条规则,就必然增加更多的歧义可能性。

(二)两项成分搭配时需要满足什么条件。这是看规则中有没有以合一等式表达的关于某两个成分搭配的限制条件。比如规则集中有规则“vp->vp np”和“np->vp np”,如果没有关于其中vp和np的任何限制,那么任何一个vp加上一个np就既可以理解为vp,也可以理解为np。但假如规定符合条件C1的vp加上符合条件C2的np才能形成vp,符合条件C3的vp加上符合条件C4的np才能形成np,那么对不同的具体的vp+np组合,就可能正确判断其到底应该理解为vp还是理解为np了(参见上文有关规则的条件说明)。

不难看出,给出两项成分的搭配条件,是提高分析的精度(降低歧义),但同时会导致规则的覆盖面降低,即本来应该能分析出来的结构,可能由于条件的限制分析不出来了。

很显然,(一)、(二)两方面也是关于规则集合的两个指标。前者可以大致表示规则对语言现象的覆盖能力,后者则决定了规则所能达到的对语言对象分析的精度。这两个指标间有制约关系。规则最终的整体表现,是在这两个指标间寻求一种平衡(参见3.6小结中相关说明)。

以上述认识为背景,再来看如何处理第四章中区分出的不同歧义类型,问题可以得到进一步的清晰化。这里以“外显型歧义格式”和“内含型歧义格式”两种歧义类型的区分为主,同时兼及“真歧义”和“准歧义”的情况,来展开说明。

(1)对“简单外显型歧义格式”,有可能在两项成分能否搭配的层面就可以解决歧义,或者可能在这个层面部分地解决。

(2)对“复杂外显型歧义格式”和“内含型歧义格式”,光在“能否搭配”这个层面不能解决歧义问题,只有准确描述了两项成分的搭配条件,才有可能解决歧义问题。但根据歧义是“准歧义”还是“真歧义”,又有所不同。

(3)对“内含型歧义格式”,同时又是“准歧义”类型的歧义情况,在短语结构层面通过描述两项成分的搭配条件,是可能解决歧义问题的。

(4)对“内含型歧义格式”,同时又是“真歧义”类型的歧义情况,不可能在短语结构层面,以规则加条件描述的方式完全解决歧义问题。

下面我们以三个歧义格式为例,分三个小节展开说明能通过短语组合规则加条件约束方式解决的歧义问题的情况。最后在“小结”中对在目前的分析框架下难以解决的歧义问题作些简单的说明。

104

第五章现代汉语短语结构歧义的消解策略分析

§5.2 现代汉语短语结构歧义的消解举例

5.2.1 “p<对> np 的 vp”格式歧义分析

这个格式的歧义主要是短语结构的定界歧义,具体来说,就是“p<对>+np+的+vp”排列格式可以有下面两种组合(层次切分)方式。

a. p<对>+np+的+vp 例:对爷爷的死

| | | |

b. p<对>+np+的+vp 例:对祖国的热爱

| || |

按a方式组合,“p<对>+np+的+vp”格式的整体功能类是pp;按b方式组合,“p<对>+np+的+vp”格式的整体功能类是np。虽然上面两例分别都是单义的,但在实际语言使用中,也很容易找到有歧义的实例,如“对王经理的批评”,既可以按a分析为pp,也可以按b分析为np。因此,这个歧义格式实际上是一个“绝对外显型”的“真歧义”格式。

从现代汉语短语结构的整体系统来看,pp跟np两个功能类基本不出现在同样的结构位置(类似与语音上互补的两个音位)。从搭配的角度就是,pp跟np基本没有共同的搭配对象。比如pp最典型的搭配是可以跟vp搭配形成一个状中式vp,而np没有这种搭配情况。同时,np的典型搭配是跟vp搭配形成主谓式dj(np+vp)或述宾式vp(vp+np),这也是pp所没有的搭配情况。因此当“p<对>+np+的+vp”格式出现在实际的句子中时,通常是很容易判别其应该按哪一种组合方式进行分析的。比如:

(1)A 小组长对王经理的批评产生了抵触情绪。 (按a切分,pp作状语)

B 对王经理的批评有点太过分了。 (按b切分,np作主语)

尽管“对王经理的批评”本身是歧义短语结构,但出现在例(1A)中时,只能理解为pp;出现在例(1B)中时,只能理解为np。因为如果把例(1A)中的“对王经理的批评”按b方式切分来理解为np,全句分析不出结构。而按a方式切分标记为pp,则恰好能分析为后面vp“产生了抵触情绪”的状语成分,全句可以分析成功。例(1B)也是如此。

需要指出的是,pp跟np有一个虽然结构位置不同,但在计算机看来也会被认为是同样的搭配的组合情况,即“pp+dj”和“np+dj”组合模式。这两个组合模式分别形成的更大组合体的功能类都是dj,差别只是前者为状中式dj(pp在状语位置),后者为主谓式dj(np 在主语位置)。但对计算机来说,当“p<对>+np+的+vp”格式出现在dj前时,既可能形成状中式dj,也可能形成主谓式dj。这种情况下,要做出准确区分,就只能诉诸搭配条件了。这个条件比较容易给出。我们可以在“dj->np !dj”规则中限制主语np不能是“p<对>+np+的+vp”格式,即这条规则有绝对条件:

IF %np.内部结构=定中,%np.中心语.cpcat=np,%np.定语.内部结构=的字,%np.定语.中心语.

cpcat=pp,%np.定语.中心语.原形=对 FALSE

有了这个限制后,当“p<对>+np+的+vp”格式出现在dj前时,只能分析为pp,不能分析为np。比如:

(2)对王经理的批评他们总是当耳边风。 (按a切分,pp作状语)

从上述对消解“p<对>+np+的+vp”格式歧义的分析中不难看出,要解决这个格式的歧义问题,基本可以不考虑格式内部组成成分的性质(如其中np和vp的句法语义性质),主要是关注这个格式所处上下文环境(搭配对象)的情况。这是消解歧义格式最简单的一种处理方式。当然,上述分析也只是能对“p<对>+np+的+vp”这个格式进行正确的层次切分而已,

105

面向中文信息处理的现代汉语短语结构规则研究

如果要确定内部组成成分np和vp之间的语义关系,仅靠上述手段是不够的。实际上,np 跟vp之间可以有多种语义关系,如“对英雄的牺牲”(主体 — 动作);“对这本书的出版”(客体 —动作);“对昨天的训练”(时间 —动作)等等。要能对这些语义关系作准确判断(解决语义分析的歧义),就必须对这个格式内部组成成分之间搭配的相对条件约束做更细致地描述。本章主要是探讨现代汉语短语歧义结构的层次分析和结构关系判定的问题,对结构成分间复杂的语义关系,就不展开讨论了。关于“P<对>+np+的+vp”格式中np 与vp间语义关系的更详细的说明,可参见詹卫东(1998a,1998b)3。

5.2.2 “mp mp 的 np”格式歧义分析

“mp+mp+的+np”格式也是结构定界歧义,它有两种分析方式4:

a. mp+mp+的+np 例: 两张五毛的邮票

| || |

b. mp+mp+的+np 例: 100元一条的裤子

| || |

无论是按上面a、b哪一种方式切分,这个格式的整体功能类都是np。同时在实际语言使用中,很难找到一个具体的实例既可以按a切分又可以按b切分,因此这个格式属于“内含型”的“准歧义”格式。

要解决这个歧义格式的分析问题,仅向外看这个格式跟其他成分能否搭配显然是不够的,必须向内看组成成分之间的搭配条件。具体来说,要考察三个搭配的情况: (1)最主要是看“mp+的”的搭配条件;

(2)其次要看“mp+np”的搭配条件;

(3)还要看“mp+mp”的搭配条件;

在3.2.2中讨论“的”字np时我们已经提到,不是所有的mp都可以嵌入“的”结构中。能够嵌入“的”字结构的mp,一般得是度量单位量词、时量词、容器量词等,其他像个体量词、动量词、成形量词等,不大能形成“的”字结构,如不说“*三条的”、“*五次的”、“*三堆的”等。有了这个搭配条件限制,如果上面这个歧义格式中的第二项mp位置出现的是个体量词、动量词、成形量词等,整个格式就不可能按a切分,只可能按b切分。

考察“mp+np”、“mp+mp”的搭配条件,都是为了对付这个格式的第二项mp位置出现度量单位量词、时量词、容器量词等时的情况。譬如上面的例子“两张五毛的邮票”,其中“五毛”是由度量单位量词形成的mp,出现在第二项mp位置。这时整个格式应该按a切分,而不按b切分。这是通过“dj->mp !mp”规则(见3.5.2相关讨论)来控制的,即有条件约束:IF %mp.量词子类=个体,%%mp.量词子类=度量 THEN $.zhxyu4=否 ENDIF

这个条件约束限制了“两张五毛”形成“的”字结构的可能性,从而避免了把“两张五毛的邮票”按b方式进行分析。

上面这个例子的第一项mp是由个体量词(“两张”)充任的。如果第一项mp不是个体量词,而是度量单位量词,譬如:“二十五元一米的电缆”,组合方式又得是按b切分,不能按a切分。对此,是通过描述“mp+np”组合的搭配条件来说明的,即对“np->mp !np”规则(见3.2.3相关讨论),有条件约束:

IF %mp.量词子类=度量,%np.内部结构=定中,%np.定语.内部结构=的字,

%np.定语.中心语.cpcat=mp,%np.定语.中心语.量词子类=度量 FALSE

这个条件约束限制了把“二十五元一米的电缆”按a方式进行分析,即不能分析成mp “二十五元”作定语修饰np“一米的电缆”这样的结构。同时,这个格式中的两项mp:“二

106

第五章现代汉语短语结构歧义的消解策略分析

十五元”、“一米”跟上面提到的“dj->mp !mp”规则的条件约束不冲突,因此整个格式可以按b方式进行分析,即:[[[二十五元 一米] 的] 电缆]。

不难看出,mp内部可以分出不同的小类,这些小类相互之间,以及各自跟“的”字、np等成分之间,在搭配组合的能力上都有不同的表现。条件约束实际上就是对这些不同情况的描写和记录。相关的条件约束共同发挥作用,就能够帮助判断一个具体的“mp+mp+的+np”格式该按哪一种方式进行结构分析。实际上,对计算机分析而言,要得到正确的结果,总是包含着两个方面,即得到的结果中有正确的,并且,得到的结果中没有错误的。相应地,描述两项成分的搭配条件,也总是包括两个方面,即可以搭配的,和不能搭配的。

此外,值得一提的是,度量单位量词可以加“的”形成“的”字np后作定语修饰另一个np(如“三斤的鱼”),也可以直接作定语修饰一个np(如“三斤鱼”)。这两种情况在语义上是有差别的,前者关注的是“鱼的重量属性”,后者关注的是“一定量的鱼”。这种差别实际上跟上述“mp+mp+的+np”格式切分的不同方式是密切相关的。比如“五元一斤的鱼”只能按b方式切分,从语义上可以就可以解释为,这个短语表达式关注的是“鱼”的重量属性与价格属性之间的对应关系,而不是“一定量的鱼”本身。对此我们不展开论述,更详细的讨论可以参见赵强(1998)5。

5.2.3 “pp<把> vp vp”格式歧义

就短语结构定界而言,这个格式有两种切分可能性:a. [pp [vp vp]];b.[[pp vp] vp];就内部结构关系而言,“pp+vp”只能形成状中结构关系;“vp+vp”共有五种可能性:(1)述宾;(2)述补;(3)连谓;(4)联合;(5)主谓。这样,整个格式一共有2×5=10种组合可能性6。当整个格式内部包含主谓关系时,整个格式的功能类为dj,其他情况下整体功能类都是vp。

pp因内部具体介词的不同,还有很多差别,为使讨论更集中,这里我们仅考察由介词“把”带宾语形成的pp后面出现连续两个vp(即构成“pp<把> vp vp”格式)面临的歧义分析问题。就这个格式对应的实例情况来看,基本上具体的实例都没有结构定界歧义和句法关系歧义,因此,这个歧义格式是“复杂外显型”的“准歧义”格式。

消解这个格式的歧义,可以从两个组合搭配的条件约束来寻求答案。一是pp<把>+vp 的搭配条件;一是vp+vp的搭配条件7。

关于“vp+vp”的搭配条件约束,实际上就是对上面提到的五种组合关系进行辨析,即需要回答这样一系列问题:两项vp满足什么条件时可以构成述宾关系;满足什么条件时可以构成述补关系;……等等。对此,我们在§3.4的有关规则中基本已经做了说明。

这里我们主要来看pp<把>+vp的搭配条件限制。为说明问题方便起见,我们进一步把“pp<把>+vp”展开写成“把+np+vp”8。对这个格式,需要从句法和语义搭配两个层面来描述其内部成分的搭配条件。如上文所说,这又可以分两方面来看,即可以搭配的情况和不能搭配的情况。下面先来看可以搭配的情况。

(一)从句法层面来看,可以跟“把+np”搭配的vp有如下一些类型。

(1)vp可以是单个动词。如:“把秘密公开”、“把灯熄灭”

(2)vp可以是附加式结构。如:“把药吃了”、“把弟弟抱着”

(3)vp可以使单个动词的各种重叠形式。如:“把那本书看了看”、“把脚抬抬”

(4)vp可以是“一+v”形成的状中式vp。如:“把手一松”、“把桌子一拍”

其他状中式vp。如:“把剩下的几页赶紧抄完”、“把三百级台阶一口气走完”

“把他往死里打”、“把那些木头都盖了房子”

(5)vp可以是“vp+mp”式述宾结构。如:“把他打了一顿”、“把书看了一遍”

107

面向中文信息处理的现代汉语短语结构规则研究

(“v了个遍”格式也可附在这里。如:“把北京逛了个遍”、“把北大食堂吃了个遍”) vp还可以是其他一般体词性成分作宾语的述宾式结构。

如:“把画挂在墙上”、“不把他放在眼里”、“把炉子生了火”、

“把黑板写满了字”、“把头撞了一个洞”、“把荒山变成绿林”

(6)vp可以是述补式结构。 如:“把饭吃光”、“把地扫干净”、“把车推进去”

“把他跑得气喘吁吁”、“把话说得越干脆越好”

(7)vp可以是连谓式结构。 如:“把衣服洗干净晾在院子里”、“把他捆起来带走”

(8)vp可以是联合式结构。 如:“同学们一定要把这道题理解并加以消化”。

(二)从语义层面看,可以跟vp搭配的np主要有下面这些语义角色类型。

(1)np可以是vp的客体成分9。如:“把饭吃光”、“把衣服送给了你弟弟”、

“把文章写完”、“把小鸟儿叠得更大些”、

“把驾驶证考到手”、“把书稿催回来”

(2)np可以是vp的主体成分。如:“把妈妈想得睡不着觉”、“把我累得进了医院”

(3)np可以是vp的工具成分。如:“把毛笔写秃了”、“把嘴都吃歪了”

(4)np可以是vp的处所成分。如:“把黑板画满了图案”、“把北京玩了个遍”。

再来看不能搭配的情况。

(一)从句法层面看,不能跟“把+np”搭配的vp有:

(1)有相当一部分动词无论以何种句法结构形式都不能跟“把+np”搭配。

金立鑫(1997)10给出了一个不能跟“把”字结构搭配的动词清单,共计181个动词。不过他没有交待他所考察的动词的范围。实际上在他的清单外,还有不少动词是不能跟“把”字结构组合的,比如“哀叹、爱好、遍及、濒临、搏击、企图、同意、姓、……”等等。

《现代汉语语法信息词典》中收有动词10283个,其中标记了能带体词性宾语的动词共5933个(“体谓准”属性值为“体”)。而这其中宾语语义类型是“受事”(属于我们的“客体”语义角色)的动词有3267个。词典中还标记了这些动词中有1803个动词的受事宾语可以提前做“把”的宾语。换言之,也就是在3267个可以带受事宾语的动词中,有55%的动词能跟“把”字结构搭配。而45%的动词没有标记能跟“把”字结构组合。但据我们抽样考察,实际上在没有标记能跟“把”字结构搭配的动词中,有一部分动词也是可以跟“把”字结构组合的,比如“颁发、更动、干洗……”等,即不能跟“把”字结构搭配组合的动词数量应该不到45%,还要再少一些。

理论上讲,我们可以列出能跟“把+np”搭配和不能跟“把+np”搭配的动词清单,但实际操作上,在判断具体的动词能否跟“把+np”搭配时,仍然难以做到全面准确。就以往的研究而言,通常在论述到哪些动词不能出现在“把”字句中时,一般是泛泛地概括为“不及物动词、非自主动词……”等等。这样概括虽然能说明一些问题,但实际上只是转化了问题,还是没有得到明确的答案。因为哪些动词属于“不及物动词”或者“非自主动词”,动词本身并没有显性的标记。仍然得根据别的形式或者意义条件来逐个甄别。金立鑫(1997)还提到可以用能否进入“V得”框架来判断一个动词是否能进入“把”字句,实际上,这也只是发现了“把”字句跟“V得”句之间的变换关系而已,并不是真正意义上的找到了判断动词能否进入“把”字句的条件。基于我们的语义分类,我们也可以说,不能跟“把+np”搭配的有“标记”类、“遭受”类的动词。而对其他语义类的动词,则不能保证同属一类的动词在跟“把”字结构搭配这个句法表现上都有共性。事实上,要回答哪些动词能跟“把”字结构搭配,哪些动词不能跟“把”字结构搭配,最直接的,也可能是唯一的方法就是对每个动词逐一进行鉴别11,并在词典中以一个属性项目(比如就用“把”作为属性名)来标记动词跟“把+np”的搭配性质。

(2)如果vp的“否定”属性值为“是”,则该vp不能跟“把+np”搭配(参见3.4.4 108

第五章现代汉语短语结构歧义的消解策略分析

相关规则的说明)。

(3)如果vp是状中式结构,则状语成分不能也是“把+np”形成的pp;不能是某些频度副词(如“常常”、“往往”、“总是”等);不能是某些时间副词(如“曾经”、“已经”等)。如不能说“*把孩子把母亲找回来”、“*把人常常记错了”、“*把拳王曾经打倒过”等。

(4)如果vp是述宾结构,则宾语不能是谓词性成分的。如不能说“*把篮球喜欢打了”。

如果vp是附加式结构、重叠形式、一般体词性成分作宾语的述宾结构、述补结构等,在句法层面不大有合适的条件来约束,就在语义层面进行约束。

如果vp是连谓结构、联合结构,条件约束基本参照对上面这些结构类型的vp的约束。

(二)从语义层面看,“把+np”跟vp的搭配限制主要有以下一些:

(1)“把”后np必须是vp的一个配价成分,否则“把+np”不能跟vp搭配。

比如,不能说“*把语言学举起来”,是因为“把”后np“语言学”的语义类型是一个“学科领域”,不是vp“举”的配价成分。相反,可以说“把杠铃举起来”,是因为“杠铃”满足“举”的配价要求。

(2)“把”后np不能是vp的广义配价框架中的与事、时间、空间等类型的语义角色。

比如,对三价动词“送给”,汉语中不能说“*我把他送给了一套红楼梦”,这种情况下,只有三价动词的“客体”配价成分可以出现在“把”后,如“我把一套红楼梦送给了他”。

汉语中也不能说“*我把上个月写完了论文”,即“时间”性的配价成分不能出现在“把”后位置。这种情况,只能让“客体”配价成分出现在“把”后,而把“上个月”这个时间配价成分“挤”到其他句法结构位置上,如“上个月我把论文写完了”、“我上个月把论文写完了”等。

需要特别说明的是,“把”后np可以是vp的“处所”配价,但不能是“空间”类型的配价成分。这是汉语表达系统的要求决定的,汉语选择“在”这个介词为标记,在“状语”这个结构位置上来标示动作(事件)发生的“空间”。而介词“把”加上处所性质的np,则只能标示vp的配价成分所在的“处所”,而不能标示vp整体所在的“空间”。比如,可以说“大家在电影院看电影”,不能说“*大家把电影院看电影”。因为这里的“电影院”只能是“空间”,而不是“处所”,排斥用“把”。当然,我们可以说“大家把电影院看了个遍”。这时“电影院”是“看”的“客体”对象,而不是“处所”,尽管它在语义上的确可以表示“处所”这样的概念。

(3)如果vp是述宾结构,并且其中宾语是实义的np,则中心动词的“客体变化”属性取值一般得是“性状”、“位移”、“领属”等,不能是“NONE”或只是“数量”。比如“吃”、“看”、“听”等动词,都不会造成“客体”配价成分的“性状”变化或“位移”变化等,就不能带宾语跟“把+np”搭配,如不说“*把碗吃了饭”、“*把这副眼镜看了书”等。如果这样的动词加“成”形成述补结构,再带宾语,就可以跟“把+np”搭配了,如可以说“把我吃成了大胖子”、“把小王看成了小李”等。对此,我们可以在述补式vp的规则中描述为:一个动词v加“成”后形成的述补式vp的“客体变化”属性值发生了改变。

到此为止,我们对“把+np”跟vp的搭配情况已经在句法和语义两个层面上进行了描述,这些可以表达为如下的规则条件约束:

vp->pp !vp :: …,IF %pp.原形=把 THEN %vp.把=是 ENDIF,

IF %pp.原形=把,%vp.否定=是 FALSE,

IF %pp.原形=把,%vp.配价数=3,%vp.与事=%pp.宾语 FALSE,

IF %pp.原形=把,%pp.宾语.语义类=空间 THEN %vp.处所=%pp.宾语 ENDIF,

IF %pp.原形=把,%vp.内部结构=述宾,%vp.宾语.cpcat=vp FALSE,

IF %pp.原形=把,%vp.内部结构=述宾,%vp.客体变化=-性状-位移-领属 FALSE,

IF %pp.原形=把,%vp.内部结构=连谓,%vp.后谓.内部结构=述宾,%vp.客体变化=-性状… FALSE,

109

面向中文信息处理的现代汉语短语结构规则研究

IF %pp.原形=把,%vp.客体=%pp.宾语 TRUE,

……

有了状中式vp规则的上面这些条件约束,再加上第三章描述过的关于“vp+vp”形成述宾式vp、述补式vp、连谓式vp、联合式vp、以及主谓式dj的那些规则,就基本可以分析“pp<把>+vp+vp”这个歧义格式的组合层次和内部结构关系了。下面看几个具体的例子。

例1 我能把这件事情想起来。

其中“想起来”是两个vp“想”跟“起来”连续出现的排列,并且有内部结构关系歧义,既可以分析为述宾结构,又可以分析为述补结构。但是在例1的语境中,只能理解为述补结构,因为这两个连续vp前面是“把”字结构,而在“vp->pp !vp”规则中则规定了,如果状语pp是“把”字结构,中心语vp不能是带谓词性宾语的述宾结构,即“想起来”不可能以“想 + 起来”构成述宾结构的形式再参与跟“把”字结构组合。

例2 A. 把猪肉剁烂包饺子

B. (赶紧)把文章写完看电视

例2A跟2B都是“pp<把>+vp+vp”的排列格式。从结构层次上讲,分别都既可能按a 方式切分,也可能按b方式切分。

先看2A,根据“pp+vp”规则中的条件描述,前项vp“剁烂”的中心动词“剁”在词典中的“把”属性值为“是”,它形成的述补式vp能跟“把+np”搭配;后项vp是述宾结构“包饺子”,中心动词“包”的“客体变化”属性值为“性状”,因此“包饺子”可以跟“把+np”形成的pp搭配。根据“vp+vp”的有关规则,“剁烂”跟“包饺子”只可能形成连谓结构。如果前项“剁烂”先跟pp组合形成状中式vp“把猪肉剁烂”,则不能跟“包饺子”形成结构,因此例2A就只能按a方式切分,整个格式分析为状中结构:

把猪肉剁烂包饺子

| pp || vp | 状中结构

|vp|| vp | 连谓结构

再看2B,根据“pp+vp”规则中的条件描述,前项vp“写完”是述补结构,,满足跟“把+np”搭配的条件;后项vp“看电视”是述宾结构,中心动词“看”的“客体变化”属性值既不是“性状”、也不是“位移”和“领属”,因此不能跟“把+np”搭配。根据“vp+vp”的有关规则,pp“把文章”跟vp“写完”构成状中结构后,可以再跟“看电视”形成连谓结构。这样,例2B就只能按b方式切分,整个格式分析为连谓结构:

把文章写完看电视

| vp || vp | 连谓结构

| pp ||vp| 状中结构

§5.3 小 结

总的来看,解决上面这三个歧义格式的分析问题,大致是从易到难、从简单到繁复的一个趋势。实际中碰到的短语结构歧义问题虽然像上一章统计结果所显示的那样,非常得多,但如果是跟本章列举的这三个歧义格式类似的情形,基本上也就可以通过类似的搭配限制方式来消解歧义。消解歧义的过程,无非就是减少分析结果的可能性。而要做到这一点,必然是依靠这样那样的条件限制来实现。一个歧义格式能否得到有效的消解,关键就在于,分化条件是否清晰明确,并能够以形式化的、易操作的范畴来表述(在词典中能以“属性:值”

110

第五章现代汉语短语结构歧义的消解策略分析

的方式描述,同时在规则中能以严格的逻辑语句来进行判断)。

像“踢破球”、“吃熟的”这样的歧义格式12,在本文的短语结构规则框架下,缺乏有效的制约条件来描述,因而目前计算机对这类短语结构歧义,就显得无能为力。此外,实际语言中的歧义更是远远不止我们在短语结构层面所概括的这些情况。像“跑步去”、“买多了”13这样的歧义,都已经超出本文的短语句法语义范畴的描述能力,更别说来消解它们的歧义了。而像“爬过山”这样的多义词歧义,理解时显然对现实情境有很强的依赖性,即解决歧义需要的知识更像是“常识”、“百科知识”等,而不是像分析本章的三个歧义格式例子时用到的那些“比较纯粹”的句法语义知识(实际上就是比较容易系统地形式化表述的知识),歧义就难以得到准确地辨识。

下面第6章我们例举了计算机基于本文提出的短语结构规则对具体的汉语句子进行句法分析的一些例子,通过这些例子,对目前的短语结构规则能够解决哪些分析问题,以及还有哪些歧义问题是无法解决的,可以有更为直观的感性认识。

附注:

1 上一章提到,不含终结符的歧义格式,一般可以通过三项排列显现出来,而包含“的”、“和”等终结

符的歧义格式,一般要通过三项以上的排列显现出来。这跟这里所说的任何短语结构歧义格式都可转化为两项成分搭配的歧义来描述并不矛盾。因为上一章的表述方式只是为了在显现歧义发生的情况时更为直观,这里所说的则应理解为造成短语结构歧义的最小元素一定是两项成分搭配时的多种可能性。

2 搭配是有顺序的。“np+vp”跟“vp+np”是两个搭配,尽管搭配的两项成分都是np和vp。

3詹卫东(1998a)《“NP+的+VP”偏正结构在组句谋篇中的特点》,载《语文研究》1998年第1期;詹卫东(1998b)《关于“NP+的+VP”偏正结构》,载《汉语学习》1998年第2期。

4 实际上,这是从人的眼光来看的结果。如果以计算机的眼光来看,不加任何条件限制,这个格式除了有

两种组合方式,整个格式都分析为np外,完全还可能被分析为dj:[[mp mp 的] np]。为简化分析,文中对这种实际使用中根本不可能发生的组合没有讨论。

5 赵强(1998)《复杂的数量结构》,发表在“98现代汉语语法学国际学术会议”(北京大学)上。还可

参见《语言文字应用》“中文信息处理中的语言难题征答”,1998年第4期,P74。

6 这是指不考虑任何制约条件的情况下,计算机可能分析出的所有的组合方式。实际上如果对结构条件的

制约稍加考虑,就很容易发现:按a切分,两项vp之间不可能是主谓关系,即整个格式不可能分析为状中式dj;按b切分,整个格式不可能分析为述宾结构和述补结构(因为“pp+vp”只能形成状中式vp,而状中式vp既不能再带宾语,也不能再带补语)。这样就只剩下7种组合可能性了。显然,排歧的过程,也就是利用各种可以利用的条件约束来减少组合可能性的过程。

7 实际上要对“pp<把>+vp+vp”格式进行全面分析还需要考虑“pp+dj”的组合规则,因为两项vp可以构

成dj。但正如我们在上面附注7中已经提到的那样,介词“把”形成的pp不能跟dj搭配形成状中式dj (可参见3.5.1中有关说明)。为简化分析,文中仅着重涉及了“pp+vp”的搭配条件限制情况。

8 实际上介词“把”后还可以带sp、vp宾语,如“把这里当作自己的家”、“把偷东西当成家常便饭”等,

为使问题尽量简化,文中仅以np作“把”宾语的情况来展开分析。关于“把+np+vp”的分析,基本思路完全适用于“把”后宾语是sp、vp等其他类型的短语。

9 本文的“客体成分”,包括一般语义范畴中的“结果”、“对象”等等格关系(可参见第二章有关说明)。

10 参见金立鑫(1997)《“把”字句的句法、语义、语境特征》,载《中国语文》1997年第6期。

11 笔者见到微软公司(Microsoft)正在研制的中文句法分析系统所用的词典中,就专门有一个属性项“把”,

来标记一个动词是否能出现在“把”字句中。微软公司词典的信息基本参考的是北大计算语言学研究所编的《现代汉语语法信息词典》。

12 “踢破球”的歧义情况第四章已经分析过。“吃熟的”既可以表示“吃熟的食品”,也可以表示“两个

人的关系是通过吃而熟起来的”。

13 关于“跑步去”的歧义情况,可参见3.6小结中的简要说明。这个歧义之所以难描述,是因为我们目前

仅仅以“连谓结构”来描述“跑步”跟“去”之间的关系,没有更细致的“范畴”来更准确地刻画“跑步”跟“去”之间的关系。关于“买多了”的歧义情况,可参见3.4.2中有关说明。“买”跟“多了”

之间的关系,也是仅仅有“述补结构”这个范畴来描述,但这个范畴远远不足以揭示“买”跟“多了”

之间丰富的语义联系。更严重的是,这两例歧义,都必须参照对上下文的意义理解来消解歧义。这在短语结构规则层面是很难描述的。

111

相关文档