文档库 最新最全的文档下载
当前位置:文档库 › 第三节 语义关系、语义指向和语义特征

第三节 语义关系、语义指向和语义特征

第三节 语义关系、语义指向和语义特征
第三节 语义关系、语义指向和语义特征

第三节语义关系、语义指向和语义特征

一、语义关系

语义关系是指隐藏在句法结构后面由该词语的语义范畴所建立起来的关系。小李吃了/ 苹果吃了

吃饭了/ 来人了

(一)动词和名词语义关系的类别

1.施事:指动作行为的发出者,也可用介词“被(叫、让、给)”引进。

小牛在吃草。/杯子被王华打碎了。

2.受事:指动作行为的承受者,也可用介词“把(将)”引进。

小花猫逮住了一只大老鼠。/他把书拿走了。

3.系事:指联系动词连接的对象。

他是学生。/陈伟成了一名画家。

4.与事:指动作行为的间接承受者,也可用介词“给”引进。

他们送母校一幅油画。/他还给我一支笔。

5.结果:指动作行为产生的结果。

她在房间里打毛衣。/我们学校盖了一幢教学大楼。

6.工具:指动作行为的凭借物,也可用介词“用(拿)”引进。

你吃大碗,我吃小碗。/王涛用毛笔在写字。

7.方式:指动作行为进行的方法、形式。

明天考口试。/他用蝶泳游完了全程。

8.处所:指动作发生的处所或起总、终点,也可用介词“在(从、到)”引进。我住二楼。/陈小玉去了师大。

9.时间:指动作行为发生的时间,可用介词“在(从、到)”引进。

他回家乡过春节。/我的课请排在星期五。

10.目的:指动作行为发生的目的,可用介词“为(为了)”引进。

他在筹备展览会。/刘玲为考大学在复习。

11.原因:指动作行为发生的原因,也可用介词“因为”引进。

他在外呆了一个月避避风头。/他爷爷因为肺病住了院。

12.材料:指动作行为所使用的材料,也可用介词“用”引进。

他在给青菜浇水。/地板用油漆涂了一层。

13.致使:指动作行为使动的对象,也可用介词“使”引进。

我们要端正学习态度。/我们要使环境更加漂亮。

14.对象:指动作的对象,也可用介词“对(向)”引进。

他在教育孩子。/向同学们表示感谢。

(二)语义关系的解释力

同一个动词,与不同的名词性词语搭配就可能产生不同的语义关系。

吃面条、吃大碗、吃食堂、吃低保

妈妈在包衣服、他们在包饺子、外头包牛皮纸、礼品包小包

同一个名词性词语,与不同的谓词搭配也可能产生不同的语义关系。例如:

买毛衣、织毛衣

打人、来人

二、语义指向

语义指向是指句法结构中的某一成分跟其他成分之间在语义上的联系。

月亮渐渐升起来了。

妈妈高兴地点点头。

(一)语义指向的类型

1.补语的语义指向

第一,指向动词。

你砍快了,慢一点!

我看完了《红楼梦》。

第二,指向主语。

我砍累了。

我学会了滑雪。

第三,指向宾语。

我们砍光了树再休息。

他一连发出界两个球。

第四,指向“把”的宾语。

砍树把刀都砍钝了。

他把牙都吃坏了。

2.状语的语义指向

第一,后指中心语。

血压急剧下降。

我经常打乒乓球。

第二,前指主语。

祥子青筋蹦跳地坐下。

四凤胆怯地望着大海。

第三,后指宾语。

花也很多,圆圆地排成一个圈,不很精神,倒也整齐。

七尺阔,十二尺深的工房楼下,横七竖八地躺满了十六七个“猪猡”。

第四,前指介词“把”的宾语。

我把王群满意地打发走了。

师傅们把楼板纵横交错地堆放在一起。

3.定语的语义指向

第一,后指中心语。

他昨天买了件羊皮大衣。

我要好好地逛一逛美丽的西湖。

第二,前指主语。

他做了一个惬意的梦。

我过了一个愉快的暑假。

第三,前指述语。例如:

陈小平看了一天的书。

孙静在家等了一上午的电话。

(二)语义指向的解释力

有些句法结构的情况比较复杂,语义指向可以合理地解释句子成分之间的关系王冕死了父亲。

苹果吃了三个。

孩子被奶奶抱进了大门。

奶奶哭瞎了眼睛。

一个句法结构中,语义上可能有多种指向的分析。

我答对了两道题。

语义指向的分析可以帮助我们解释某些歧义现象。例如:

陈斌最喜欢游泳。

她又买了一件毛衣。→

A.我买了一件毛衣,她又买了一件毛衣。

B.她已借了一件毛衣,她又买了一件毛衣。

C.她已买了两件毛衣,她又买了一件毛衣。

D.她已买了一件皮衣,她又买了一件毛衣。

三、语义特征

词语中符合某种组合选择的有区别性特征的最小语义成分就是语义特征。(一)语义特征举例

例1:动词“坐”与“跑”

别在这儿坐——别坐在这儿。

别在这儿跑——×别跑在这儿。

→坐 +附着 ;跑 -附着

屋里跑出来一个人。——×屋里坐出来一个人。

→坐 -位移 ;跑 +位移

例2:请概括下列两组的动词的语义特征

甲组:地上蹲着许多人。/墙上挂着画。/门上贴着广告。

乙组:门外敲着锣鼓。/电视里说着相声。/隔壁开着收音机。

甲: +附着 ;乙: -附着

例3:请概括下列两级动词的语义特征:

A组:买、调查、办、玩、看、

B组:失败、跌倒、漏、塌、到达、毕业

→A组 +自主 ;B组 -自主

可以用下列格式可以鉴定动词是否具有 +自主 特征:

来/去+动词+宾语+来/去

例4:概括下列两组形容词的语义特征

A组:快、慢、干脆、高兴、便宜、客气、公正

B组:富裕、孤独、急躁、肥胖

→A组 +自主 ;B组 -自主

具有自主特征的形容词一般用在“形容词+一点儿”的祁使句中。

如:小心一点/积极一点。

例5:概括下列两组形容词的语义特征

A组:成功、崇高、出色、丰盛、大方、端正、美丽

B组疼、狡猾、过分、愤怒、混乱、可怕、惊讶、害羞、悲伤→A组 +褒义 ;B组 -褒义

+褒义 不能进入“有点儿+形容词”

-褒义 的可进入“有点儿+形容词”

例6:概括下列两组形容词的语义特征

A组:热情、胖、得意、安心、不满、惭愧

B组:暗淡、薄弱、逼真、闭塞、灿烂、充足、抽象

→A组 +述人 ;B组 -述人

(二)语义特征的解释力

可以解释有些结构形式完全相同的句子却有不同的变换式A组:台上坐着主席团/身上盖着毯子

B组:台上唱着戏/外头下着雨

A组:主席团坐在台上/毯子盖在身上

B组:台上正在唱着戏/外头正在下着雨

→A组 +附着 ;B组 -附着

可以解释某些同形结构产生歧义的原因

倒了一杯水

把字句的语义特征

“把字句”的语义分析 孙志景 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+谓词性词语”。 在现代汉语中,句子是语言运用的基本单位,它由词、词组(短语)构成,能表达一个完整的意思,如告诉别人一件事,提出一个问题,表示要求或者制止,表示某种感慨,表示对一段话的延续或省略。句子和句子中间有较大停顿。它的结尾应该用上句号、问号、省略号、或感叹号。 我们这里所要讲的句式指的是一种比较有特色的动词性谓语句——把字句。把字句是用介词“把”将谓语动词支配关涉的对象提到动词前面的句子,它是现代汉语中很重要、很有特色的句式。其形式是“主语+(把+宾语)+ 谓词性词语”。把字句强调的是对某物的处理结果。把字句是一种有特色的句子,那么这种句式到底有什么特点呢?第一,谓语动词大多数是表动作的及物动词,并且在语义上能支配把字后边的词语。及物动词一般后面都可以接宾语。例如:他把书看完了。“看”是及物动词,在语义平面“书”是“看”的受事。当然,这里的“书”可以被“看”所支配。又例如:“我踩到了石头”一句就不能改成了把字句,这里的“踩”对“石头”没有支配能力。第二,谓语动词(特别市单音节词)的后面或前面通常都有一些别的词语。例如:他把作业做完了。动词“做”的后面加了“完了”一词,表示一种结果,作业完成了。同时,又例:我把论文认真地审查了一遍。这个句子中,谓语动词前面加了“认真地”修饰动词,表明一种态度;而谓语动词的后面也加了“一遍”表示一种频率或者一个量。当然,有些谓语动词本身含结果意义,如“采纳、接受、拒绝、说服”等,这类动词如果前面有某些状语,后面可以没有别的词语。例如:董事会已经把她的建议采纳了。“已经”一词表示一种完成的结果,同时 采纳也有一定的结果含义,那么动词后面可以不用加词语。第三,“把”字后面的词语所代表的事物一般是定指的,是上下文出现过或交际双方都知道的。上例中的“作业、话、论文”都是定指的。有时候“把”字后面的词语包含有“一个、几个”之类的词语,但说话人认为所指的对象或范围仍是明确的。例如:我们把一个强大的中国带入了二十一世纪。这里的“中国”这个当然是特指,而后面的“一个”也是特指的,是大家都知道的,所表示的物象是明确的。第四,如果句中有否定副词或助动词,则出现在“把”字前面。例如:他没有把话说清楚。这里的“没有”要放在把字的前面。其实,看到这个特点,我想起了英文中的一个词“think”,跟我们这个把字句的这个否定特点很相似,都是将否定词放在前面。 前面都是在讨论“把”字句一些特点,下面我们就要讲讲把字句的作用。首先,语用表达的需要:强调动作的处置结果。这种把字句有不用把字的相对格式。例如:他推翻了原计划。//他把原计划推翻了。把字句就是把大家的焦点聚焦在句末,聚焦在谓语动词上,是大家能够更好地理解句意。在这个例子中强调的是已然的处置结果推翻了。又例:我明天可以看完这本书。//我明天可以把这本书看完。这里强调的是未然的处置结果看完。当然,也有一些“把”字句强调动作的致使结果,这种把字句的谓语中心通常是不及物动词或形容词。例如:繁忙的工作把他累垮了。其次,是在使用过程中结构上的需要。同时它们没有其相对格式。这里,有三种情况:第一,动词紧接着补语,不允许宾语将它跟动词隔开,这种情况一般用把字短语。例如:他把自行车放在车棚里。(“放”与“在……”关系密切)。第二,动词带双宾语,其中的一个或两个宾语都比较复杂,放在一起累赘拖沓,这种情况一般用“把”字把直接宾语提前。例如:我们把那封最后的通牒式的信退还给了他们。第三,动词后有“为、

第三节 语义关系、语义指向和语义特征

第三节语义关系、语义指向和语义特征 一、语义关系 语义关系是指隐藏在句法结构后面由该词语的语义范畴所建立起来的关系。小李吃了/ 苹果吃了 吃饭了/ 来人了 (一)动词和名词语义关系的类别 1.施事:指动作行为的发出者,也可用介词“被(叫、让、给)”引进。 小牛在吃草。/杯子被王华打碎了。 2.受事:指动作行为的承受者,也可用介词“把(将)”引进。 小花猫逮住了一只大老鼠。/他把书拿走了。 3.系事:指联系动词连接的对象。 他是学生。/陈伟成了一名画家。 4.与事:指动作行为的间接承受者,也可用介词“给”引进。 他们送母校一幅油画。/他还给我一支笔。 5.结果:指动作行为产生的结果。 她在房间里打毛衣。/我们学校盖了一幢教学大楼。 6.工具:指动作行为的凭借物,也可用介词“用(拿)”引进。 你吃大碗,我吃小碗。/王涛用毛笔在写字。 7.方式:指动作行为进行的方法、形式。 明天考口试。/他用蝶泳游完了全程。 8.处所:指动作发生的处所或起总、终点,也可用介词“在(从、到)”引进。我住二楼。/陈小玉去了师大。 9.时间:指动作行为发生的时间,可用介词“在(从、到)”引进。 他回家乡过春节。/我的课请排在星期五。 10.目的:指动作行为发生的目的,可用介词“为(为了)”引进。 他在筹备展览会。/刘玲为考大学在复习。 11.原因:指动作行为发生的原因,也可用介词“因为”引进。 他在外呆了一个月避避风头。/他爷爷因为肺病住了院。 12.材料:指动作行为所使用的材料,也可用介词“用”引进。 他在给青菜浇水。/地板用油漆涂了一层。 13.致使:指动作行为使动的对象,也可用介词“使”引进。 我们要端正学习态度。/我们要使环境更加漂亮。 14.对象:指动作的对象,也可用介词“对(向)”引进。 他在教育孩子。/向同学们表示感谢。 (二)语义关系的解释力 同一个动词,与不同的名词性词语搭配就可能产生不同的语义关系。 吃面条、吃大碗、吃食堂、吃低保 妈妈在包衣服、他们在包饺子、外头包牛皮纸、礼品包小包 同一个名词性词语,与不同的谓词搭配也可能产生不同的语义关系。例如: 买毛衣、织毛衣 打人、来人 二、语义指向

机器学习与概念语义空间生成

机器学习与概念语义空间生成 何清 史忠植 摘 要 本文综述了机器学习在文本信息处理中的应用,特别对概念语义空间生成中的机器学习技术进行了详细分析和阐述。概念语义空间是针对关键词检索过程中,由于检索词的差异造成的检索结果差异的问题而建立的支持相关概念的索引机制。文中分析了这一技术产生的背景,阐述了与概念语义空间密切相关的文本检索技术、搜索引擎技术的发展,以及在知识管理中的应用情况。最后指出了概念语义空间进一步发展的基础和发展的方向。 1 引言 随着计算机的发展和互联网的普及,对海量文本信息处理的需求越来越迫切。这使得机器学习技术在基于语料的文本信息处理中获得了快速发展。基于统计和经验的方法已经超出了传统机器学习的范畴,发展了一些独特的方法和技术。在过去十来年,统计学习方法改变了依靠手工建立语法和知识库以及文本目录索引的状况,通过对大量已标注的和未标注的自然语料的训练可以部分或全部自动地完成上述过程。但是自然语言处理中仍然存在许多尚未解决的问题,甚至是影响到自然语言处理的基础性的核心问题。在文本检索过程中如果只使用关键词匹配技术往往会遇到词汇不匹配。这是因为存在表达差异。关键词匹配检索模式往往基于这样一种基本假设:仅在一个文档含有与查询完全相同的词汇时,它们才相关。这种相关性匹配实际上是基于表层的匹配(Surface-Based Matching)。然而,人类的自然语言中,随着时间、地域、领域等因素的改变,同一概念可以用不同的语言表现形式来表达。因此即使对于同一概念的检索,不同的用户可能使用不同的关键词来查询。例如当用户查询“计算机”和“电脑”两个词的时候其实是在查询同一件事情。而基于表层的匹配不可能检索到同一概念的多种语言表达形式。因此,词汇不匹配将导致系统的查全率降低。姚天顺教授曾经举了一个用“红苹果”、“红的苹果”、“红色苹果”、“红色的苹果”在网上检索,结果存在巨大的数量差异的例子,说明自然语言处理和信息检索在技术上没能很好地融合[1]。这一问题的产生有很多方面的因素。从根本上说是目前机器对自然语言不能完全理解。具体到这个例子来说,就是缺乏对红苹果这一概念的语义表达。从目前技术状况来看,尽管我们付出了大量努力,但是要达到使计算机对自然语言完全理解这一目标差得还很远。对于解决上述问题在目前可能达到的目标也许只能是通过机器学习对原始语料中概念之间的语义关联进行挖掘,对这些语义关联给出合理的表示,从而产生一些常识性的概念语义。 2 概念语义空间产生的背景 所谓概念语义空间,就是对文本集建立的能反映文本集中概念之间语义关系的一个索引。这是为克服关键词检索过程中,由于检索词的差异造成的检索结果差异而建立的支持相关概念的索引机制。概念语义空间与文本检索、搜索引擎、知识管理密切相关,它是基于目前自然语言处理技术的进展状况而产生的。 2.1 机器学习与自然语言处理 统计方法在语音识别方面的成功[2],促进了类似方法在自然语言处理其他方面的应用。现在各种机器学习方法几乎都应用到了自然语言处理的不同方面,包括词法、句法分析[3]、歧义消除和理解[4]、会话过程和信息抽取[5]以及机器翻译[6]。然而,传统的人工智能中的机器学习对计算语言学的研究贡献有限。这是因为基于机器学习和基于经验的自然语言处理需要通过相互交流、相互促进才能发展。 现在自然语言处理中大多数机器学习的研究都借助了语音识别中特定的统计技术如:隐马尔科夫模型(Hidden Markov Models, HMMs)、概率上下文无关语法(Probabilistic Context Free Grammars, PCFGs)。其它各种学习算法包括决策树、规则归纳、神经网络、基于示例的方法、贝叶斯(Bayesian)网络方法、归

现代汉语语义指向研究

现代汉语语义指向研究 语义指向研究发源于20世纪60年代,成型于80年代。所谓语义指向是指在句法结构中,句法成分之间有一定的方向性和一定目标的语义联系。通过分析句中某一成分的语义指向来揭示、说明、解释某一语法现象,这种分析手段就称为语义指向分析法。语义指向分析给我们揭示了句子成分之间,尤其是句法平面上间接成分之间的各种语义联系,证明了句法结构和语义结构之间的不一致性,从而可以帮助我们深入认识和解释语法现象。因此,对现代汉语语义指向进行研究,对于更好地了解、学习现代汉语以及从事汉语教学有重要的现实意义。 标签:语义指向类型研究意义 句法结构是句法形式和语义内容的统一体。对句法结构不仅要做形式分析,例如句法层次分析、句法关系分析以及句型分析等,还要做种种语义分析。对句法结构的语义分析越全面越深刻,就越有可能对句法形式的各种现象给以科学合理的解释。句法结构中的语义分析主要是指语义关系、语义指向和语义特征三种分析法。本文主要以现代汉语为例从语义指向的概念、语义指向的类型以及语义指向的研究意义等方面来论述语义指向分析法。 一、对有关概念的阐释及定性 所谓语义指向是指在句法结构中,句法成分之间有一定的方向性和一定目标的语义联系。成分所联系的方向叫“指”,成分语义联系所指向的目标叫“项”。如“我砍累了”中的“累”所联系的方向是“指”,所指的“项”是主语“我”。 “指”可以分为单指和双指。单指是指所联系的语义是一个,双指是指所联系的语义成分是两个。如:我们打赢了球。其中的“赢”只单指前面的“我们”。又如:这些电影我们都看过。其中这个“都”既指向前面的“这些书”,也指向前面的“我们”。 “项”分为单项和多项。单项是指语义成分只指向一个成分。多项是指语义成分指向两个或两个以上的成分。 二、语义指向的类型 (一)从“指”和“项”的角度来观察语义指向 1.单项单指 (1)学生们互相学习。(“互相”单指前面的“学生们”) (2)他一共卖了三本书。(“一共”指向后面“三本书”)

语义范畴及相关概念

语义范畴及相关概念 作者:高娟 来源:《现代交际》2013年第02期 [摘要]随着认知语言学和功能语言学的发展,语义范畴成为语言学者关注的对象。本文针对文章中与语义范畴相关概念如语法范畴、语义语法范畴、句法语义范畴等做了详细论述。 [关键词]语义范畴语法范畴语义语法范畴 [中图分类号]H14 [文献标识码]A [文章编号]1009-5349(2013)02-0065-02 一、范畴化与语言化 随着认知语言学的发展,与认知相关的语言现象越来越受到人们的关注。认知是人们主观经验对客体对象在人脑中的感知,这种感知认识即认知并非任意形成的,而是具有一定意义上的普遍性。它是与人类的主观经验密切联系的,建立在广泛认识基础上的主观感受。人们在认识世界的过程中,对客观世界中存在的客观事物或现象所具有的本质特征,会形成抽象概括的认识,这种思维能力我们称之为认知能力。人类要认识和把握世界,就需要对客观事物或现象所体现的本质特征进行分类,这个分门别类的过程就是范畴化。 认知范畴的语言化,即从认知世界投向语言世界,便形成各种各样的语义范畴。语义范畴是认知范畴的物质表现形式。认知范畴是存在于思维中的抽象概念,思维的东西不可能赤裸裸地存在,都需要借助一定的物质手段来表现才能使思维这一抽象的概念变为可以感知的。语言并非体现思维的唯一手段,动作、表情、神态等都可以成为表达抽象思维的物质手段,但是语言却是人们在交际活动中最常用的一种固定思维的手段。因而,认知范畴这一抽象思维活动的结果在语言中的投射,我们就称之为语义范畴。 二、语义范畴 在语言中,语义范畴是一个复杂的概念。有的称作语法范畴,有的称作语义语法范畴,还有的称作句法范畴,等等,这就需要我们弄清楚有关语义范畴的一些基本概念,以及它包含哪些内容?与语法范畴、语义语法范畴、句法范畴是何种关系? (一)语义范畴、语法范畴、语义语法范畴 我们之所以要区分语义范畴、语法范畴和语义语法范畴三个概念,一方面是在语言研究中不同学者采用的术语不同,容易使读者产生混淆。例如赵军在《现代汉语程度量及其表达形式研究》一文中使用了“语法·语义范畴”;李宇明在《程度与否定》中使用的是“语义·语法范畴”;胡明扬《语义语法范畴》、马庆株《语义语法范畴研究》、邵敬敏、赵春利《关于语义范畴的理论思考》、胡清国《否定观念和否定范畴》、文贞惠《现代汉语否定范畴研究》等文

现代汉语形容词语义指向研究

目录 第1章绪论 (1) 1.1研究对象及意义 (1) 1.2研究目标和研究内容 (2) 1.3研究现状 (2) 1.3.1 形容词作谓语 (3) 1.3.2 形容词作状语 (3) 1.3.3 形容词作定语、补语 (4) 1.4凡例及说明 (5) 第2章“NP1有NP2很AP”中AP 的语义指向 (7) 2.1七种语义指向 (7) 2.2七种语义指向的证明方法 (8) 2.3七种语义指向的成因 (10) 2.3.1 形容词的语义特征不同 (10) 2.3.2 存在三种同型异构格式 (12) 2.4理论思考 (14) 第3章 “N+A+VP”中A的语义指向 (15) 3.1空间形容词的“高”的基本义 (16) 3.2“高”的语义指向 (18) 3.2.1 挺立存现类 (19) 3.2.2 突出存现类 (21) 3.2.3 站立存现类 (22) 3.2.4 放置存现类 (24) 3.2.5 悬挂存现类 (25) 3.2.6 漂浮存现类 (27) 3.2.7 搭建制作类1 (28) 3.2.8 搭建制作类2 (30)

3.2.9 跳跃提升类 (31) 3.2.10 抛扔提升类 (32) 3.2.11 托举提升类 (33) 3.2.12 昂抬提升类 (34) 3.3“高高”的语义指向的判定 (35) 3.4理论思考 (38) 第4章 “V+A+NP”格式中A的语义指向 (41) 4.1A的语义指向 (42) 4.1.1 “做大生意”的两种歧义 (42) 4.1.2 “修好车”“演好戏”的三种歧义 (43) 4.2“V+A+NP”歧义原因探析 (44) 4.2.1 格式存在“兼语” (44) 4.2.2 V对A的方向制约 (45) 4.2.3 A的多种义项 (47) 4.3理论思考 (48) 第5章结语 (50) 参考文献 (52) 附录 (56) 致谢 (58) 攻读学位期间取得的科研成果 (59)

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法

现代汉语语法的五种分析方法 很有用,请好好学习之。 北语之声论坛专业精华转贴 现代汉语语法的五种分析方法是语法学基础里 很重要的一个内容,老师上课也会讲到,我在这 里把最简略的内容写在下面,希望能对本科生的专业课学习有所帮助 详细阐释中心词分析法、层次分析、变换分析法、语义特征分析法和语义指向分析的具体内涵:一. 中心词分析法: 分析要点: 1.分析的对象是单句; 2.认为句子又六大成分组成——主语、谓语(或述语)、宾语、补足语、形容词附加语(即定语)和副词性附加语(即状语和补语)。 这六种成分分为三个级别:主语、谓语(或述语)是主要成分,宾语、补足语是连 带成分,形容词附加语和副词性附加语是附加成分; 3.作为句子成分的只能是词; 4.分析时,先找出全句的中心词作为主语和谓

语,让其他成分分别依附于它们; 5.分析步骤是,先分清句子的主要成分,再决定有无连带成分,最后指出附加成分。 标记: 一般用║来分隔主语部分和谓语部分,用══标注主语,用——标注谓语,用~~~~~~标注宾语,用()标注定语,用[ ]标注状语,用< >标注补语。 作用: 因其清晰明了得显示了句子的主干,可以一下子把握住一个句子的脉络,适合于中小学语文教学,对于推动汉语教学语法的发展作出了很大贡献。 还可以分化一些歧义句式。比如:我们五个人一组。 (1)我们║五个人一组。(2)我们五个人║一组。 总结:中心词分析法可以分化一些由于某些词或词组在句子中可以做不同的句子成分而造成的歧义关系。 局限性: 1.在一个层面上分析句子,

层次性不强; 2.对于一些否定句和带有修饰成分的句子,往往难以划分; 如:我们不走。≠我们走。 封建思想必须清除。≠思想清除。 3. 一些由于句子的层次关系 不同而造成的歧义句子无法分析; 如:照片放大了一点儿。咬死了猎人的狗。 二. 层次分析: 含义: 在分析一个句子或句法结构时,将句法构造的层次性考虑进来,并按其构造层次逐层进行分析,在分析时,指出每一层面的直接组成成分,这种分析就叫层次分析。 朱德熙先生认为,层次分析不能简单地将其看作是一种分析方法,而是应当看做一种分析原则,是必须遵守的。(可以说说为什么) 层次分析实际包含两部分内容:一是切分,一是定性。切分,是解决一个结构的直接组成成分到底是哪些;而定性,是解决切分所得的直接组成成分之间在句法上是什么关系。

副词“才”和“就”的语义指向研究

副词“才”和“就”的语义指向研究 专业:汉语国际教育学号:2014134117 姓名:方皓玥指导老师:刘伶俐摘要:“才”和“就”是现代汉语使用频率较高且在用法上有所联系和区别的副词,因此针对“才”和“就”的义项作为切入点,进行语义指向分析,并进行对比,得出:副词“才”在表示“刚刚”、“量多”、“表示强调或肯定”、“表示只有在某种情况或者由于某种原因产生的结果”时为前指;表示“事情发生或结束得晚”、“只,仅仅”、“量少”时为后指。副词“就”在表示“强调事情很早已经发生”、作为范围副词时限制范围义和“就”前动词/名词有联系、加强肯定的“就+动/形”结构,强调主语已符合谓语所提要求时为前指;“立刻,马上”、作为范围副词(一般情况下)、加强肯定的“就+是(在)”结构和“就+动”结构,表示意志坚决,不容改变、表示“承接上下文得出结论”时为后指。副词“才”和“就”在限制范围量小时语义指向都为后指,而在其他情况下两者语义指向并不相同。 关键词:语义指向;副词;对比;才;就

一、“语义指向”的界定 汉语语法学界关于语义指向分析的产生有着比较一致的看法:语义指向分析产生于我国上个世纪八十年代,并且这对世界语言学来说是一个贡献。 那么什么是语义指向呢?这一点学术界亦有诸多论断,不过大体是一致的。以下三个说法从不同方面对语义指向进行了说明: 周刚(1998)在《语义指向分析刍议》中指出所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。即语义指向主要考虑句法上非直接成分之间所发生的语义上的直接联系。[1] 程树铭(2013)亦在相关论文中说明任何一个句子的组成成分之间总是同时并存着两种不同性质的关系:句法结构关系和语义结构关系。但这种关系并非一一对应:其一,相同的句法结构关系可以表示不同的语义结构关系;其二,不同的句法结构关系可以表示相同的语义结构关系。语义指向分析产生的缘由首先在于结构层次分析或者说直接成分分析的不足。[2] 陆俭明(1996)指出实际上,根据句法研究的需要,只有补语、修饰语(定语和状语)、谓语的语义指向值得考察。[3] 副词最主要的语法特征即副词都能做状语,有部分程度副词(很、极—好得很,好极了)还能做补语。因此在语义指向的研究中,副词是主要研究对象。本文便选择了“才”和“就”这两个副词进行语义指向的研究,选择这两个副词的原因是“才”和“就”在语义上对立,但在一定语境下也可以意义相同进行互换,这两个副词联系较为紧密。 二、副词“才”的语义指向研究 根据《现代汉语八百词(增订本)》(1999年)和《现代汉语虚词词典》(王自强主编,1998年1月第一版),“才”的副词语义大致可以分为:A.时间副词。(a)刚刚,表示事情在前不久发生;(b)表示事情发生或结束得晚。 B.范围副词。(a)表示“只”、“仅仅”;(b)表示数量少,程度低。 C.语气

义素分析法分析“看的方式”语义场

义素分析法分析“看的方式”语义场 摘要:“看的方式”的语义场可以归为同义语义场。通过义素分析的方法,并写出 每个词的基本义的义素表达式,来分析该语义场内的词之间的异同。词不仅有理 性意义还有感性意义,通过感性意义能更好的区别和运用同义词。 关键字:义素分析法,同义词辨析,看的方式 一、义素分析法在同义词辨析中的运用 同义词辨析一直以来都是语言研究的重要方面,不仅是在语言研究,还是在 语言运用中,甚至在语言的教学中都具有特殊的意义。义素分析法是准确描写和 掌握词义的有效方法。词义并不是一个整体,而是有若干层次的结构,义素是构 成词义的最小意义单位。将义素分析法引入对外汉语词汇教学,可以对词义的微 观层面进行准确有效的分析,把词义分割成若干个义素的组合,不仅有利于准确 掌握同义词之间的大同小异,还能提高人们对语言的运用能力,有利于第二语言 学习者在语言学习中理解两个及两个以上抽象的同义词,加深对汉语词汇的理解 和运用。 本文主要通过义素分析法来分析比较“看的方式”的语义场,来说明义素分析 法在同义词比较中的运用。运用义素分析法的表达式来研究“看的意义相同或相近的词”。本文研究的看的方式词有:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰。 二、“看的方式”的语义场义素分析的方法和步骤 1.确立语义场 语义场是通过不同词之间的对比,根据它们词义的共同特点或关系划分出来 的类。同义语义场相当于一些论著中讲的一组广义的同义词(即不包括等义词),它所包括的各个义位间大同小异。所谓的同,表现为基本义相同或者是基本义有 一部分相同。所谓的异,就是附加义不同,或者是基本义有一部分不同,又或是 不只是基本义有一部分不同附加义也不一样。“看的方式”语义场内的词是眼部动 作描写都有“用眼睛看”这一基本义项,因此,这些看的方式词都可以看作是“看” 这个词的同义词。那么“看的方式”就构成了一个眼部动作的同义语义场。根据义 素分析法的分析并通过表达式的比较,可以准确的辨析出同义语义场内各个词之 间的细微区别,有利于第二语言的学习。 2.通过义素的具体对比分析“看的方式:看、望、顾、瞪、瞥、瞅、盯、窥、伺、瞟、瞰”的异同。 这些字从现代汉语词典第七版中查到“看的方式”词的意义如下所示: (1)看: [动] 使视线接触人或物:~书|~电影|~了他一眼。 [动] 观察并加以判断:我~他是个可靠的人l你~这个办法好不好。 [动] 取决于;决定于:这件事能 不能成功全~你了|飞机能否准时起飞,要~天气如何。 [动] 访问;探望:~望|~朋友。 [动] 对待:~待|另眼相~|别拿我当外人~。 [动] 诊治:王大夫把我的病~好了。照料:照~l衣帽自~。 [动] 用在表示动作或变化的词或词组前面,表示预见到某 种变化趋势,或者提醒对方注意可能发生或将要发生的某种不好的事情或情况: 行情~涨|别跑!~摔着!|~饭快凉了,快吃吧。 [助] 用在动词或动词结构后面, 表示试一试(前面的动词常用重叠式):想想~I找找~|等一等~l评评理~先做几 天~。 (2)望: [动] 向远处看:登山远~|一~无际的稻田。观看;察看:~风!观~|~ 闻问切。探望:拜~|看~。盼望;希望①:~子成龙l~准时到会。盼头;希望②:

语义

一词多义(polysemy)作为语言中较为普遍的现象,指的是一个单一的语言形式具有两种或两种以 上密切相关的意义聚合的语言现象(Lyons, 1995)。英语也不例外,翻开词典,我们很容易发现大多数单 词都不止一个意义,有的英语单词甚至有几十个意义。这对于英语学习者来说,无疑是一种负担,有时 会是一种难以克服的困难。作为外语教师,如何帮助学生看透这种多义迷雾,揭开词语多义的本质,有 着极为重要的现实意义。 在现今的语言学领域,不少国外学者对多义性做出了很有意义的探索研究。他们运用认知语言学 中的理论解释涉及语言系统各层次的多义现象。就目前的研究成果而言,主要集中在词汇和句式层面。 国内学者对多义性的研究主要涉及多义词的认知理据、词汇习得及外语教学。 本文尝试从认知心理学家罗施(Rosch, 1975)提出的原型范畴理论(prototype theory)出发对多义词 汇语义延伸进行认知分析,探究多义词汇语义扩展的方式,揭示其深层的认知机制,以期给多义词汇教 学提供一些有益启示。 一、原型范畴理论的提出及其特征 原型范畴理论(prototype theory)产生于当代语言学界和哲学界对亚里士多德经典范畴学说(classi-cal category)的批判。经典范畴理论的基本假设是:范畴是由一组充分必要条件决定的;范畴的边界是清晰的;范畴所有成员的地位均平等。20世纪50年代,维特根斯坦(W ittgenstein, 1953)对游戏game范畴进行了研究,他认为在游戏game范畴中没有各种游戏的共同特征(common property),范畴成员之间具有一定的相似性,其相似性就像一个家族的成员之间在体形、相貌、眼睛的颜色、步姿、性情等等一样以类似的方式互相重叠和交叉,由此维特根斯坦提出了著名的家族相似性理论(family resemblelance)。20世纪60年代至70年代初,人类学家伯林和凯(Berlin&Kay, 1969)对颜色范畴进行了研究。他们调查了98种语言,发现了基本颜色范畴和焦点色现象。他们认为,颜色的范畴并不是任意的,而是以“焦点色”为基础的。由此说明虽然人们使用的语言不同,但对最典型的颜色的认知却是一致的,具有普遍性。到了70年代,罗施(Rosch, 1975)对焦点色的心理背景进行了探索,证明焦点色是源于前语言认知(pre-linguisticcognition),焦点色在感知和记忆中是突显的,比其他颜色辨认得更准确,学习和回忆得最快,因而更有利于识别和分类。之后罗施从对颜色焦点色的研究扩展到其他物体的研究。她在对其他鸟、水果、交通工具、蔬菜等10个自然范畴进行实验研究的基础上提出了“原型范畴理论”(prototype theory)。 原型范畴理论具有以下特征: (1)决定范畴的属性及数目是不确定的,相对于人的认知需要有所变 化; (2)特征也有中心的、重要的区别属性和边缘的、非重要的属性之分,其中心属性有更大的区别性, 其边缘属性与临近范畴属性交叉; (3)范畴成员之间具有互相重叠的属性组合,即所有成员享有部分共 同属性,形成家族相似性; (4)成员之间的地位不是平等的,具有中心成员和边缘成员之分,具有更多共

语义指向研究综述

摘要:考察了20世纪80年代中期以来国内学者对语义指向进行的理论研究和运用语义指向分析方法对具体语言事实的分析,对语义指向的定义、研究对象、内涵、表现形式、原则方法等问题进行整理、比较、归纳与综合。 关键词:语义指向;理论;实践中图分类号:H13文献标识码:A 文章编号:1671-6132(2008)10-0031-05 收稿日期:2008-05-08作者简介:徐洁(1979— ),女,河南南阳人,西南大学汉语言文献研究所硕士研究生。 语义指向研究综述 徐 洁 (西南大学汉语言文献研究所,重庆400715) 20世纪80年代中期以来,语义指向分析方法得 到学界的广泛接受,成为汉语研究的一个热门话题。学者们运用语义指向分析方法对具体语言从不同角度进行了较为广泛的考察。整体看来,对语义指向的考察贯穿着两条线索:一是从理论上对语义指向本身进行探讨,力求说明其产生的背景、研究的对象、表现形式、原则方法、理论和实践价值等;二是运用语义指向分析方法对具体语言事实的句法结构和语义结构的特点进行分析,力求探寻其句法和语义上的对应规律。本文试从这两方面对20世纪80年代以来学界关于语义指向研究状况进行梳理介绍。 一、理论上对语义指向的探讨(一)语义指向的定义 语义指向作为一种分析方法虽然在语法学界已有共识,但对什么是语义指向、语义指向的内涵是什么,语法界却意见不一。我们把学者对语义指向内涵的认识概括为以下几类: 1.语义直接联系论。 周刚(1998)认为:“所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。”陈保亚(1999)把语义指向看成和句法直接成分一样的初始概念,是语义结构中语义成分之间的直接的联系。陆俭明(2003)认为:“所谓语义指向指的是句中某一成分在语义上跟哪一个成分相关。”陈昌来(2000)认为:“语义指向是指句法结构中的某一成分跟另一成分或几个成分在语义上的直接关联性。” 2.句法间接成分语义组合论。 卢英顺(1995):“语义指向的定义就不能限定在句法结构中的直接成分之间。我们认为,语义指向指 的是句法结构的某一成分在语义上和其他成分(一个或几个)相匹配的可能性。”朱晓亚(1994)谈到语义指向时说:“它是探求语义结构关系的一种方法,能有效地揭示出句法上没有直接联系的成分间深层的语义关系,从而探寻表层句法关系和深层语义关系之间既相互对应又不对应的复杂关系。” 3.语义功能论。 沈开木(1996)认为:“名词‘语义指向’是指一个 词指向它的对象的能力或特性。”范晓、胡裕树(1992)说:“语义指向是指词语在句子里在语义平面上支配或说明的方向。”另外,胡树鲜(1982)在分析副词的作用点问题时说:“本文所说的‘作用点’指的是副词语义在哪个部位发挥作用,不是指语法结构上哪个成分作用于哪个成分。”黄国营(1985)也提出过“分射”“后射”“前射”“语义射及”的说法。陆俭明、沈阳(2003)也提出过“支配性语义指向关系”、“指派性语义指向关系”。 4.语义功能、联系论。 税昌锡(2004)从句法语义关系入手,指出:“语 义指向就是句法成分在语义平面上的动态指归性,它体现为由指向成分和被指成分一起构成的语义指向结构体。”周国光(2006)将语义指向作为一个初始概念对其下了严格的定义:“在句法结构中,句法成分之间具有一定方向性和一定目标的语义联系叫做语义指向。句法成分的语义联系方向称为‘指’,句法成分的语义所指向的目标叫做‘项’。” 以上各家对语义指向所下的定义虽然表述各异,但都认为语义指向的基础是句子成分间的语义联系。到目前为止,学界还没有一个严谨科学,并为大家公认的定义。 南阳师范学院学报(社会科学版) Journal of Nanyang Normal University (Social Sciences )第7卷第10期2008年10月Vol.7No.10Oct.2008

副词才和就的语义指向研究修订稿

副词才和就的语义指向 研究 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

副词“才”和“就”的语义指向研究专业:汉语国际教育学号:姓名:方皓玥指导老师:刘伶俐 摘要:“才”和“就”是现代汉语使用频率较高且在用法上有所联系和区别的副词,因此针对“才”和“就”的义项作为切入点,进行语义指向分析,并进行对比,得出:副词“才”在表示“刚刚”、“量多”、“表示强调或肯定”、“表示只有在某种情况或者由于某种原因产生的结果”时为前指;表示“事情发生或结束得晚”、“只,仅仅”、“量少”时为后指。副词“就”在表示“强调事情很早已经发生”、作为范围副词时限制范围义和“就”前动词/名词有联系、加强肯定的“就+动/形”结构,强调主语已符合谓语所提要求时为前指;“立刻,马上”、作为范围副词(一般情况下)、加强肯定的“就+是(在)”结构和“就+动”结构,表示意志坚决,不容改变、表示“承接上下文得出结论”时为后指。副词“才”和“就”在限制范围量小时语义指向都为后指,而在其他情况下两者语义指向并不相同。 关键词:语义指向;副词;对比;才;就

一、“语义指向”的界定 汉语语法学界关于语义指向分析的产生有着比较一致的看法:语义指向分析产生于我国上个世纪八十年代,并且这对世界语言学来说是一个贡献。 那么什么是语义指向呢?这一点学术界亦有诸多论断,不过大体是一致的。以下三个说法从不同方面对语义指向进行了说明:周刚(1998)在《语义指向分析刍议》中指出所谓语义指向就是指句子中某一个成分跟句中或句外的一个或几个成分在语义上有直接联系,其中包括了一般所认为的语义辖域。句法结构和语义结构既有联系又有区别,成分之间的句法关系和语义关系有一致又有不一致的现象。即语义指向主要考虑句法上非直接成分之间所发生的语义上的直接联系。[1] 程树铭(2013)亦在相关论文中说明任何一个句子的组成成分之间总是同时并存着两种不同性质的关系:句法结构关系和语义结构关系。但这种关系并非一一对应:其一,相同的句法结构关系可以表示不同的语义结构关系;其二,不同的句法结构关系可以表示相同的语义结构关系。语义指向分析产生的缘由首先在于结构层次分析或者说直接成分分析的不足。[2] 陆俭明(1996)指出实际上,根据句法研究的需要,只有补语、修饰语(定语和状语)、谓语的语义指向值得考察。[3]

网络新词的概念合成语义分析

网络新词的概念合成新创语义分析 摘要:随着网络的发展和普及,网络用语也随之发展起来。近年来无数网络新词开始突破网络媒体的使用语域,迅速向电视、广播、报纸等媒体的使用语域扩展。而这些网络新词之所以能以如此迅猛之势遍及我们日常生活的每一个角落,必有其可取之义。本文从概念合成理论的视角对现如今所流行的网络新词进行新创语义分析。 一、引言 随着网络技术的不断发展,网络新词越来越年轻化、口语化,各种新颖的表达方式层出不穷,病毒式的传播也让网络新词的威力越来越大,一个网络新词可以在24小时内蔓延到互联网的每一个角落,并迅速为人们所吸纳,成为新一轮的口头用语。本文运用概念合成理论对这类网络新词进行简要的语义分析。从20世纪80年代中期到90年代中期,Fauconnier及其认知语言学研究中心的同事们大大地发展和完善了其关于语言的认知理论,将心里空间理论发展到了概念合成理论。 二、网络新词 网络新词指“网络用语”,即多在网络上流行的非正式语言,多为谐音、错字改成,也有象形字词。网络新词负载了部分文化积淀的信息,同时又能及时的反映社会的变化,是语言发展的风向标。它们通常源于某一社会公共事件,经影视或网络等媒体的传播而被大众所认可和接受成为一种惯用说法。网络新词的传播途径不同于报纸、杂志等平面媒体,它改变了传统单一视觉、单一维度的信息传递方式。电

视和互联网等手段使得新词的衍生速度快,词性简洁生动而备受大众的青睐,认可度不断提高,并日益融入人们生活中。如近些年来我们常说的“拍砖”“坑爹”“蜗居”“软瘾”“僵尸粉”等等,这些词之所以能够为人们所接受,必有其可取之义。 三、概念合成理论概述 概念合成网络由两个输入空间和合成空间组成,它们彼此联系,相互作用产生层创结构;输入空间的对应联系由跨空间映射完成,其结构被选择性地投射到合成空间。合成空间通过组合、完善和扩展而不断发展,并可能逆向投射到推理与其他结构的输入。Fauconnier构建这个的概念合成网络是一个比较完整的理论框架,不但可以理解隐喻和类比现象,还可以解释大量的语言现象和意义建构的过程:虚拟事实、范畴扩展、事件整合、语法结构、概念变化、文学与修辞创新等。在Fauconnier看来,繁纷复杂的语言运用背后的认知冰山的基本认知过程—概念合成,是个核心的、有序的、强有力的、基础的、系统的、必不可少的,普遍的认知运作过程。第二代认知理论发展的成果“概念合成”理论所揭示的形式和意义的关系,对意义构建和理解具有普遍性的指导意义。在新意义的构建中,合成理论解释性更强,适用范围更广。 四、网络新词新创意义的概念合成理论阐释 形式是一样的载体,语言形式的变化反映人类头脑中“概念”的更迭。任何一种表达形式都涉及从语言单位到概念单位的过程,或有从概念单位到语言单位的过程。一般的合成是两个不同输入空间的输入

语义指向分析刍议

语文研究 1998年第3期(总第68期) 语义指向分析刍议 周 刚 80年代以来,我国汉语语法研究出现了一种新的语义分析方法,就是语义指向分析。随着语法研究从描写到解释不断深入和发展,语义指向分析已经越来越受到重视。但是,对这一方法的系统探讨和研究还不多见,本文旨在对语义指向分析的演进、类型、作用和语义指向的形式标志等问题加以探讨,以期起到抛砖引玉的作用。 1 语义指向分析的演进 1 1 语义指向分析的来源 关于语义指向分析的来源,语法学界已有两种说法:一种认为,(陆俭明1995)语义指向分析产生于80年代,胡树鲜(1982)在 两组副词的语义特点及其多项作用点 一文中已有萌芽,沈开木(1983)开始提到语义关系上的 指向 ,而第一次完整使用语义指向这个术语的是刘宁生(1984)。另一种则认为(沈开木1996),语义指向是由 指向 演化而来, 指向 是吕叔湘对沈开木(1983)一文审稿时提出来的,后来邵敬敏(1985)提出 语义指向 这一术语。 笔者有不同的看法。其实语义指向分析的源头还可以追溯到60年代,文炼(1960)就已指出汉语的句子在形式和意义上的不一致性,并且具体分析了这种语法现象: 他洗衣服洗得干干净净。 他看小说看得着了迷。 第 两句的格式相同,都是 主 谓 宾 谓(重用) 补 。但是表达的语义关系不完全一样:第 句的补语是说明宾语的,而第 句的补语是说明主语的。 文章虽然没有用到 语义指向 这一术语,但是使用了 说明 一词,相当于语义的指向。接着,李临定(1963)进一步讨论了有关补语跟其他成分的语义关系问题,却也没有使用 语义指向 这一术语,而延续使用 说明 一词。语义指向分析方法至此呈现萌芽状态。到70年代末,著名语言学家吕叔湘(1979)第一次明确地提出了 在语义上A指向C 的说法: 也有这种情形:论结构关系,A应该属于B,但是在语义上A指向C,例如:(a) 圆圆的排成一个圈 (圆的圈)|(b) 走了一大截冤枉路 (走得冤枉)|(c) 几个大商场我都跑了 (都总括几个)。 吕先生提纲挈领地分析了形容词状语、定语和副词状语三种成分的语义指向,为语法研究指出了一个新的方向。进入80年代,沈开木(1983)开始使用 指向 这一术语,分析了 也 字语义上的 多项指向 问题。刘宁生(1984)首次使用 语义指向 这一术语,论述了在句首的 在 介词结构的语义指向,指出 在 句法上是全句的修饰语,其语义指向却不一致,有时指向主语,有时指向谓语。此后, 语义指向 这一术语就使用开了,运用语

概念与文档的语义相似度计算

ComputerEngineeringandApplications计算机工程与应用2008,44(35)163 概念与文档的语义相似度计算 宋玲-,郭家义2,张冬梅-,汤晓兵I,高楠I SONGLingI,GUOJia—yi2,ZHANGDong—meiI,TANGXiao-bingI,GAONanl 1.山东建筑大学计算机科学与技术学院,济南250101 2.北京市信息资源管理中心,北京100082 1.SchoolofComputerScience&Technology,ShandongJianzhuUniversity,Jinan250101,China 2.BeijingInformationResourceManagementCenter,Beijing100082,China E-mail:song_ling@sdjzu.edu.cn SONGLing.GUOJia-34,ZHANGDong-mei,eta1.Semanticsimilaritycomputationofconceptsanddocuments.ComputerEngineeringandApplications,2008。44(35):163-167. Abstract:Anovelmethodthatintegratescoreontologyasbackgroundknowledgeintotheprocessofcomputingsimilarityofconceptsanddocumentsisproposed.Ontologyisrepresented鹪agraph-basedmodelthatreflectssemanticrelationshipbetweenconcepts.withwhichaconceptandadocumentareextendedtoasemanticfuzzyset.Thenfuzzysimilarity betweentwohl=ysetsiscomputed.Documentscomparisonisbasedonconceptscomparison.Asemanticsimilaritymatrixthatexploitssemanticrelationoftheontologyisdefined,andfuzzysimilaritymeagurebasedOnsharedinformationcontentisproposedintheprocessingofcon—eeptscomparison. Keywords:conceptsimilarity;documentsimilarity;ontology;documentsclustering 摘要:将本体作为背景知识引入到概念之间相似度和文档之间相似度的计算中。通过图模型表示本体中概念以及概念之间的语义关系,用来将一个概念和一个文档扩展为一个语义模糊集,并计算模糊集合之间的相似度。文档相似度的计算是在概念相似度计算的基础之上。在概念相似度的计算过程中引入了语义相似度矩阵以及基于共信息理论的模糊相似度方法。 关键词:概念相似度;文档相似度;本体;文档聚类 DOI:lO.3778/j.issn.1002—8331.2008.35.049文章编号:1002—8331(2008)35—0163—05文献标识码:A中图分类号:TP39 l引言 相似度在许多领域如信息检索、文档分类和聚类、推荐系统、问答系统领域都起着非常重要的作用。例如,在信息检索中,用户提供关键讧J进行查询,传统的枪索技术一般基于关键词匹配,往往存在查准率、查伞率较低的|.uJ题,然而用户实际上需要的是概念上的语义匹配,而不仅仅是关键词匹配。文档聚类作为一种无监督的机器学习方法,是将文档集合中的文档聚成—些有意义的簇。方便用户导航和浏览.是数据挖掘和知让泼现中的—个很活跃的研究领域。聚类算法很多,这些算法—般来说,可以被分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法(如神经网络方法模型),这些算法中均涉及到的—个关键I’UJ题是文档相似度的比较,因为文档聚类主要是依据聚类假设理论:同类的文档相似度较大,而不同类的文档相似度较小。文档相似度一般采用“向量空I、甘J模型+余弦相似度”的模式来进行计算,即在向量空I’日J模型(VectorSpaceModel)中,将一个文档面描述为关于特征词的一个向量((t,,毗。),(t:,%),…,(£。,蚋。)),每个特征词被认为是文档的—个潜在的属性,采用统计的方法计算特征词t。在d,中的权重ttJ。然后通过余弦函数等相似度汁算公式计算文档4,4之间的相似度: 基金项n:山东建筑大学本科生研究实践(SRP)计划项目。 收稿口期:2007—12—19修同日期:2008-03—31 ℃ 。加(4。巩):曼?虹:童!!!!!:竺(1) ”‘吲地I\侉×\/矗 然而一种好的文档相似度方法应反映文档中潜在的语义,并揭示隐藏在不I可特征词后面的相同概念语义,但是余弦相似度方法要求特征i司之间的语义关系必须是独立的,互不相交的,忽略了基于语义层次的概念之fbJ的语义关系,因此在计算文档的语义相似度方面存在欠缺。 本体以一种形式化的方法描述受控词表中概念以及概念之问的关系,通过特定的语法来描述—个特定领域中的语义,是共享概念模型的明确的形式化规范说明。所以本体为信息检索和文档文分类和聚类提供了语义关系和知识背景。概念作为描述信息最小的规范单位,它是信息资源匹配的基础,因此基于本体的概念之l’日J语义相似度计算以及在此基础上的文档之间的语义相似度的计算非常重要。 下面首先给出本体模型,以便在此基础上从语义层次角度计算语义相似度。研究者们在本体模型之下定义了—个框架系统,本文对OKBC(OvenKnowledgeBaseConnectivity)知识模  万方数据

相关文档