文档库 最新最全的文档下载
当前位置:文档库 › 基于句法结构分析的目标词识别研究

基于句法结构分析的目标词识别研究

龙源期刊网 https://www.wendangku.net/doc/096964501.html,

基于句法结构分析的目标词识别研究

作者:张立凡

来源:《软件工程》2016年第11期

摘要:对于一条给定的句子,目标词识别就是识别出句子中能够激起语义场景的目标

词。针对目标词识别中的特征选择问题,本文把目标词识别任务看作是一个分类问题,在传统的词法特征和上下文特征基础上,加入了句法结构特征设计特征模板,识别句子中的目标词。在汉语框架网的标注语料集上进行测试,实验结果表明,相比于传统的词特征,基于句法结构分析的目标词识别率有显著地提升。

关键词:框架语义分析;目标词识别;句法结构分析;汉语框架网

中图分类号:TP391 文献标识码:A

1 引言(Introduction)

框架语义分析的任务是从语义角度,在给定的文本中自动地识别目标词,为目标词分配框架,如果分配时有歧义,进行框架排歧,最终识别出框架中的论元,为论元标注语义角色。在整个任务中,首要解决的就是目标词的识别任务。例如,文本“根据周恩来的指示,贺龙等绕道香港去上海寻找党中央。”的框架语义分析结果如图1所示。要得到这个分析结果,首先要识别出文本的目标词“去”和“寻找”。

近年来,越来越多的学者关注框架语义分析在某些特定领域的应用[1-3]。目前,与目标词识别任务相关的研究,主要有目标词扩展和目标词识别两方面的工作。针对目标词扩展,Jahansson[4]与Das等[5]认为待识别的目标词包含在例句和训练集词表中,利用规则筛选目标词。文献分别利用WordNet和SIM[6]词典,识别和收集语义近似的目标词,实现目标词的扩展。针对目标词识别,文献[7]使用基于规则的目标词过滤方法进行判定,若判定为非目标

词,利用基于监督学习的方法予以修正。文献[8]利用分类模型,在特征模板中加入同义词词

林编码信息来识别句子中的核心目标词,但同义词词林信息的加入会导致识别性能下降。在上述文献中,大多数是把句子中与目标词相近的词都作为特征来进行分类,而没有考虑到句子结构特征对目标词识别的影响。事实上,句子中的很多词对目标词识别并没有帮助,反而会给目标词识别带来噪音,如何合适地选择句子中的某些词作为分类特征是目标词识别的一个研究重点。

本文利用句法结构来抽取目标词识别的特征,结合分类模型,提出了如何选择句子中合适的词语作为特征的方法。这种方法利用句法依存分析的结果,分析句子中各个词之间的依存关系和关系类型,去掉那些对目标词识别没有作用的词语,选择句子中关键的词作为特征来进行识别目标词。

相关文档