文档库 最新最全的文档下载
当前位置:文档库 › 提取关键词——高考试题的一个亮点

提取关键词——高考试题的一个亮点

提取关键词——高考试题的一个亮点

提取关键词——高考试题的一个亮点

2005年高考语文试题(全国卷一)首次出现“提取关键词”这个题型,2006年高考中这种题型再次受到高考命题者的青睐。那么什么是关键词呢?关键词是指一篇文章或一段文字中最重要的词语,常出现在文章篇名或文章正文中。要求考生从一段文字中提取出关键词,其目的在于考查学生概括思想内容、提取信息的水平。考生在解题时要大致把握关键词的意思,否则解题思路就会受阻。先来看一道高考题:

例1:(2005年全国高考卷)提取下面一段话的主要信息,在方框内写出四个关键词。

据报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。

分析:2005年的这道提取关键词的试题,从表面上看一些考生可能感到陌生,其实质这道试题的命题意图仍然是考查考生的阅读理解水平、概括综合水平和语言表达水平。这是近几年高考语文的一个热点,2005年以来则成为高考语文命题的一个亮点。原因是它紧扣时代的节拍:报纸、电视、网络等处处显示着关键词,同时又能更好地体现语文学科的工具性和人文性完美统一的特点。能够预测今后几年关键词的考查将更加频繁。

那么,如何准确地提取关键词呢?提取关键词,说到底就是要善于提取“核心信息”,是一种压缩信息类的题型,考查学生提取关键信息的水平。具体如下:

(一)明确陈述的对象或主要事件或议论的中心观点,文段的主要表述对象(主要概念或主要事件)“古籍”(“馆藏古籍”)、“人才”是主题词,不可不取。

(二)明确与主概念相对应的谓语动词或总结性的词语。如“修复”、“不足”就是对陈述的对象的陈述,不可不取。

(三)选定后,可将几个词语稍稍连缀,如能大体表达出文段的主要内容,即可敲定。如本题可连缀成:(馆藏)古籍(亟待)修复,(但这方面)人才(严重)不足。这有点像提取句子主干,能够利用语法分析的方法来做,基本程序为:压缩内容--提取主干--筛选比较--整合表达(一般能够表述为:“谁或什么怎么样了”这样一种主谓结构)。

方法二:先概括再提取

提取之前先概括语段内容,这应不是什么难事,平时语文课堂中的概括文章内容、提炼文章观点、归纳段落大意等,都是具体实践的过程。所给的材料一共两句话。第一句话又分为两个层次:先说国家图书馆馆藏古籍修复的专业人员不足;再说各地图书馆、博物馆同样面临古籍修复人才不足的问题,其中“不足百人”,表明这方面专业人才奇缺。第二句话是算了一笔账,同样说明了古籍修复人才短缺的问题。

这段话的中心能够概括为“馆藏古籍亟待修复,但这方面人才严重不足”。我们再实行提取,抓住主要信息就能找出“古籍、修复、人才、不足”这四个关键词。

例2:(2006年广东卷)提取下面一段话的主要信息,写出四个关键词语。(4分) 从甲骨文到草书、行书的各种书法艺术,间接的反映了现实某些方面的属性,将具体的形式集中概括为抽象的意象,通过视觉来启发人们的想像力,调动人们的情感,使人们从意象中体味到其间所蕴含的美。这也是一些讲书法的文章里常说的“舍貌取神”──舍弃客观事物的具体现象特征,而摄取其神髓。按照上面的解题步骤,很容易找出书法、意象、舍貌取神三个词来,因为题目要求是四个,所以可将“舍貌取神”替换为“体味”和“神髓”。

[强化训练]

1、提取下面一段话的主要信息,写出四个关键词。

“十五”期间,全国妇联与政府部门联手增强城乡妇女教育培训和推动妇女就业再就业工作,制定完成了三个目标,即培训200万下岗失业妇女,为200万妇女提供就业指导,多渠道协助200万妇女实现再就业。同时建立了国家创业示范基地,组织了妇女创业师资培训班,发放了妇女创业循环资金,总结推广妇女创业孵化器、小额贷款助创业等经验,在31个省、自治区、直辖市建立了妇女再就业信息指导中心,拓展了广大妇女的创业层次和创业领域。

参考答案:政府协助妇女就业

2、根据下面创维集团宣布消息的主要内容,提取四个关键词。

创维集团昨天对外宣布,正式进军半导体产业的晶圆项目。据介绍,该项目的产品方向为功率半导体器件,主要应用于绿色照明、充电器和家用电器领域,整个项目将于今年三季度开始基础建设,2006年下半年试产,其设计产能6英寸晶圆48万片,年产值4.3亿元。当前,国内分立器件市场中,进口产品依然占据了绝对多数,国内产品市场份额不足一成,需求缺口很大。国内半导体产业布局基本上以上海和江浙为中心,集中了全国约70%的生产水平。珠三角半导体使用量居国内首位,但能生产晶圆的企业却屈指可数,国内有晶片制造水平的企业也就十来家。市场需求给实力企业进入半导体制造领域提供了较好的机会。创维集团同时宣布,该项目首期投资2.4亿元已经到位。

参考答案:创维进军半导体产业晶圆项目

3、提取下面一段话的主要信息,写出三个关键词。

教育部、公安部国家安全监督管理局组成检查组,近日对河北、河南、辽宁、重庆中小学安全和管理工作情况实行了联合检查,发现中小学校安全工作状况有了很大好转,但仍存有一些问题。如学校体育运动场地普遍紧张,部分农村中小学校办学条件困难,学生食堂、宿舍等设施条件较差,亟需当地政府采取有效措施增大投入予以解决;有的学校教学楼或学生宿舍疏散通道不畅,存有安全隐患;部分学校食堂尤其是农村学校食堂管理不到位,安全隐患较多。

参考答案:中小学安全工作存在问题

4、提取下面一段话的主要信息,写出四个关键词。

中国人民大学的一位教授指出:在中国,最维护职工权利的组织莫过于工会;不过在很多民营和外资企业,普遍没有工会组织;即使有,也是由资方掌握,发挥不了维护职工权益的作用。

据调查统计,中国当前有一亿多民工游离于工会之外,其中绝绝大部分是在非国有企业的民工;他们没有加入工会组织,也没有规范的行业组织,权益无法得到维护。虽然很多民工认为协商是解决问题的好办法,但他们苦于缺乏维护他们权益的工会组织以及专业的法律顾问。因为法律程序时间过长等原因,民工通常不会求助于劳动监察机构;这时如果有工会组织提供义务法律咨询,或指导他们与业主谈判协商,民工的权益就能够得到维护。

分析:对这则消息的概括,我们能够采用这样的方法,先找出几个和中心信息密切相关的词语,经过筛选之后,一般同学都能找到“工会”、“维护”、“权益”、“民工”等几个词,对这几个词稍加变通就能成为一句话“工会维护民工权益”。当然这句话不能作为这则消息的中心内容,但这句话是这则消息的核心,概括中心必须围绕它,对它实行必要的修饰。修饰之后我们就会得到这样的句子,“工会应该承担维护民工权益的责任”,或者“民工需要工会来维护权益”。这基本上就是标准答案了。

在刚才的分析中,细心的学生就会发现,在找和中心信息密切相关的词语过程时,筛选出来的“工会”、“维护”、“权益”、“民工”等几个词不就是“关键词”吗?是的,就是“关键词”,提取“关键词”我们一直在练着。这样一来,“提取关键词”能算新题型吗?

高考语文专题复习:“提取关键词”解题指导与训练

高考语文专题复习:“提取关键词”解题指 导与训练 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

提取关键词 1、提取下面一段话的主要信息,写出四个关键词。 “十五”期间,全国妇联与政府部门联手加强城乡妇女教育培训和推动妇女就业再就业工作,制定完成了三个目标,即培训200万下岗失业妇女,为200万妇女提供就业指导,多渠道帮助200万妇女实现再就业。同时建立了国家创业示范基地,组织了妇女创业师资培训班,发放了妇女创业循环资金,总结推广妇女创业孵化器、小额贷款助创业等经验,在31个省、自治区、直辖市建立了妇女再就业信息指导中心,拓展了广大妇女的创业层次和创业领域。 2、根据下面创维集团宣布消息的主要内容,提取四个关键词。 创维集团昨天对外宣布,正式进军半导体产业的晶圆项目。据介绍,该项目的产品方向为功率半导体器件,主要应用于绿色照明、充电器和家用电器领域,整个项目将于今年三季度开始基础建设,2006年下半年试产,其设计产能6英寸晶圆48万片,年产值4.3亿元。目前,国内分立器件市场中,进口产品依然占据了绝对多数,国内产品市场份额不足一成,需求缺口很大。国内半导体产业布局基本上以上海和江浙为中心,集中了全国约70%的生产能力。珠三角半导体使用量居国内首位,但能生产晶圆的企业却屈指可数,国内有晶片制造能力的企业也就十来家。市场需求给实力企业进入半导体制造领域提供了较好的机会。创维集团同时宣布,该项目首期投资2.4亿元已经到位。 3、阅读下面一段文了,写出四个关键词概括文意。 美国能源部费米国家加速器实验室利用 Tevatron对撞机,成功发现两种罕见的粒子;一种由两个上夸克和一个底夸克组成;另一种由两个下夸克和一个底夸克组成。它们是最为常见的质子和中子的“远亲”,尾重子范畴,这也是夸克理论预测出的6种重子中的两种。该成果有助于人类完成重子周期表。 关键词: 4、提取下面一段话的主要信息,写出三个关键词语。引起小麦条锈病大流行的原因主要是病菌的变异速度比育种速度快。为了寻找新的抗源,李振声院士搜集鉴定了800多种牧草,发现野生的长穗偃麦草等对条锈病有很强的抗性。他大胆提出了通过远缘杂交,将草的抗病基因转移给小麦,选育持久性抗病小麦品种的投想。1964年,小麦成熟前连续40天阴雨,到6月14日天气突然暴晴,一天的工夫,几乎所有的小麦都青干了,只有小偃6号的祖父(小偃55—6)仍保持着金黄颜色,这是一个十分难得的材料!李振声带领课题组紧紧抓住这个机遇,又经过两次杂交,育成了一个具有相对持久的抗病性、高产、稳产、优质的小麦新品种——小偃6号。因其耐强光和干热风的特性,小偃6号作为陕西省小麦骨干品种长达16年以上,至今仍然有50多万亩的种植面积!1985年获得国家发明一等奖。小偃6号作为小麦育种的骨干体系,衍生出了50多个小麦品种。这些品种累计推广3亿亩以上,增产小麦超过150亿斤。

概括题提取关键词四法

提取关键词四法关键词本是网络中经常提及的词语,指的是人们输入搜索框中的文字。关键词的内容大多为网站名、网页名、新闻事件、人名、术语、软件名等。而高考常考语段压缩题型——提取关键词中的“关键词”实是关键信息句中的核心信息。 提取关键词,说到底就是要善于提取关键信息句中的核心信息,考查的是学生提取关键信息的能力。 2011年高考,有两个省(福建省和四川省)的语文试卷中出现了语段压缩题,具体试题内容如下: 福建卷: 阅读下面的材料,回答问题。 某翻译家在《文艺报》上撰文指出:有人说中国人称自己的国家为“中国”,表示自己是坐镇在世界中央的天朝,说明中国人自傲。但从国名的中文翻译来看,译名却能够表达中国人的感情。例如,“英国”为什么不译作“阴国”?“美国”不译作“紊国”?“德国”为什么不译作“歹国”?这是因为中国人要从同音字中选出具有最美好含义的字来命名这些国家。用什么字呢?用“英雄”的“英”、“美丽”的“美”、“道德”的“德”、“法律”的“法”、“芬芳”的“芬”、“祥瑞”的“瑞”……而外国,比如英国,用英文译别国的国名,只用音译,译名中不含有褒贬意义。 请用一句话概括该翻译家的观点。(3分) 答:_______________________________________________________ 此题虽不属提取关键词这类题,但与之有关,解答时要把握住该段文字的核心内容,即中文翻译较外文翻译更能表达美好的感情。答题时要强调中文翻译的感情色彩优势。另外,要注意句子结构的完整,不要把句子写成短语。参考答案为“对别国国名的翻译,中文能表达美好的感情,而外文不能” 四川卷 阅读下面的材料,概括要点回答中国建设世界一流大学缺少“什么”。不超过25字。(4分) 4月23日,“2011大学校长全球峰会”在清华大学举行。其中,“中国建设世界一流大学”成为热议的话题。多位大学校长接受记者采访时表示:目前,中国顶尖大学在吸纳拥有国际学术背景人才、借鉴发达国家的教学制度和成功经验等方面缺乏全球化视野;许多人安于现状,在科研方

面试技巧:如何提取答题关键词

给人改变未来的力量“关键词”法,就是考生在列举提纲的时候,采取“以点带面”的形式,以简短的词语列出答案要点,进入角色,快速反应,从容应对,轻重缓急,先公后私,迅速形成答案的方法。此法是解决情境应变题的高分法宝,具有快速、精准、干练、高效的特点,深受考官的喜欢和推崇。 下面以这道真题为例,共同探讨“关键词”法的高效之处。 【问题】 有家企业排污不达标,现要关闭,但工人反对,政府派你去解决,你该怎么办? 【参考答案】 企业排污不达标,对其关闭,体现了政府贯彻节能减排、可持续发展道路的力度和决心。但现在有工人反对,说明我们前期的宣传教育没有做好,对于出现的这一意外情况,我会高度重视,立即着手处理。 安抚情绪,讲明道理。我会安抚大家激动的情绪,向工人们说明关闭企业的原因,并耐心讲解污水排放的危害。企业排污不仅危害环境,更重要的是威胁生活在周围的群众的生命健康,从长远考虑,水遭受到污染,会产生一系列的连锁反应,全市的生产生活都会受到影响。通过摆事实,讲道理,以赢得工人们的理解。了解原因,解决问题。我会深入了解工人反对的原因,对大家关心的失业问题做好释疑解惑工作,向工人讲明企业关闭后可以通过排污整改,待符合国家标准后可继续生产,并耐心地讲解国家的政策、相关文件精神和解决方案,争取赢得工人的理解、信任。另外,如若有个别工人生活上确实有困难,我会在政策允许范围内,与企业领导一起商量给予适当的补助。 竭尽全力,圆满解决。节能减排确实是利国利民的大好事,在执行政策时要做好宣传、教育、解释、处理等工作,把这家企业的节能减排工作做好,坚决避免类似事件的再次发生。 在解答这道面试题目时,需要明确角色意识,更需要明确具体措施,采取“关键词”法,缩短思考时间,只要能够组词造句,自成一段就行了。 本题的答题思路是:首先,表明处理此事的态度;其次,以谦和负责的态度与工人进行沟通,争取达成共识;再次,从工人的角度考虑其反对的原因,有针对性地解决问题;最后,总结升华。本题的解决重在沟通,这是处理冲突性事件的基本方法。在沟通的过程中,建立起相互理解信任的关系,了解问题产生的原因,从而有针对性地解决问题。

百强重点名校高考备考_提取关键词(完美整理版)

提取关键词 基础知识 0310 1715 相关文章: 一.提取关键词的本质 1. 提取关键词本质上是对语段关键、主要、核心信息的集中。 2. 提取关键词本质上是压缩的压缩,精练的精练,关键的关键。 3. 提取关键词本质上是要淘汰掉次要的、支撑的、解说的信息。 4. 提取关键词本质上考查的语段信息筛选能力和梳理思路能力。二.提取关键词的三大原则 1. 首先通览语段寻找锁定有效信息:冷静取舍。 2. 其次筛选有效信息中的核心信息:再次取舍。 3. 提取而不是组合语段中的关键词:文中原有。 4. 主要用双音词或短语的形式表述:二字多字。 三.提取关键词的三个技法 1. 核心话题法:抓取语段核心话题词语 任何文体性质的语段都得围绕某个核心话题展开 这个话题词语在语段中出现的频率一般较多 承载语段核心话题的词语肯定是关键词之一 2. 关键语句法:筛选语段中的关键句 有的语段中会有针对核心话题的核心陈述句 有的语段中有或总领或总结的概括性中心句 抓住这类关键语句就易于筛选出关键词

3. 结构层次法:任何语段都表现为一定的思路层次 并列式语段关键词常散布在各层次中 递进式语段关键词常出现在最后层次中 总分式语段关键词常出现在总说句中 四.提取关键词的高考真题例析 1.提取下面一段话的主要信息,写出四个关键词。(2005年高考全国卷) 据报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共计3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。 [答案]古籍修复人才不足 [解析]这个语段谈论的核心话题是古籍修复的处境问题,“古籍”“修复”这两个词是我们在答题时首先要考虑的。文段通过一系列的数据告诉我们古籍修复这个核心话题的处境不好,最重要的具体表现是事多人少,这样,我们就又可找出另外两个关键词——“人才”“不足”。 2.提取下面一段话的主要信息,写出四个关键词语。(2006年高考广东 卷) 从甲骨文到草书、行书的各种书法艺术,间接地反映了现实某些方面的属性,将具体的形式集中概括为抽象的意象,通过视觉来启发人们的想象力,调动人们的情感,使人们从意象中体味到其间所蕴含的美。这也就是一些讲书法的文章里常说的“舍貌取神”——舍弃客观事物的具体现象特征,而摄取其神髓。 [答案]书法意象体味神髓 [解析]最后一个句子就是本段的中心句,而“舍貌取神”又是这个句子的核心。只要我们抓住这个句子,找出“貌”“取”“神”三字的各自所指,就能轻易套牢其中的三个关键词——“意象”“体味”“神髓”。再用“话题法”,找出本语段的核心话题对象——“书法”,另一关键词也便找出来了。 3. 下面是一篇科技论文的摘要,根据其信息内容提取四个关键词。(2014 年四川卷) 本文针对直接法和二步法合成聚乳酸的共性,从单体纯度、催化剂选择到共沸脱水、微波辅助、超临界流体介质,以及到固相聚合、反应挤出、扩链等

如何提取关键词(ziyu精心排版)

压缩语段之提取关键词 ■考点扫描 提取关键词在考纲里并不是一个单设的考点,它其实是信息筛选和压缩语段这两个考点的一个综合,主要考查学生概括思想内容,提取关键信息的能力。要求考生具有较强的理解、分析、筛选、概括、语言表达等各项能力。它首先要求考生在准确理解文段的基础上找到有效信息,并从中筛选出核心信息;然后用最简洁的语言加以概括,且概括时只能用词或短语。 ■能力提升指导 尽管这是近几年出现的一个新题型,但它涉及的能力要求在以前的相关考点中早有规定,只要大家掌握我们下面介绍的几种方法,解答起来,仍然可以得心应手。 一、研究语段话题 任何语段,无论是记叙、议论或说明,它总是围绕一个话题来展开的,体现话题的词语肯定是关键词之一。 二、寻找中心语句 三、明确具体要求 并不是每一道“提取关键词”的题的要求都是一样的,有的还根据语段的特点有具体要求,并且,有的要求可能还比较含蓄。对此,我们就一定要弄明确试题要求我们提取的是哪方面的关键词,以防泛泛去找,劳而无功。 四、分析构段特点 每个语段的构成都有自身的特点,或总分,或分总,或并列,或偏正,或解证,或承接,等等。不同的构成,就意味着关键词的位置不同。 五、关注层次(标点)变化 六、注意用词频率 ■提取关键词--备考训练 1、提取下面一段话的主要信息,在横线上写出四个关键词。 据新华社杭州2月22日电(记者余靖静)珍稀古籍文澜阁《四库全书》影印竹版今天在杭州文澜阁开印,已被预订掉三四十套。 据悉,影印本文澜阁《四库全书》由杭州出版社与浙江图书馆合作整理出版,投入经费约2800万元,其中民资占80%以上。杭州出版社总编辑徐海荣表示,影印本文澜阁《四库全书》将于2007年3月“出炉”,首印500套,每套约1700册,定价42万元。 此次文澜阁《四库全书》重印受到浙江商人及海外华商的青睐。一位在开印现场的华商说:“我起码要带10套去欧洲,让欧洲不仅知道中国文化,也亲眼看看我们的‘国宝’。” 答:____________________________________________________________。 2、提取下面这则新闻的主要信息,在横线上写出三个关键词。

“提取关键词”训练题

“提取关键词”训练题(教师用卷) 1. (05年全国卷)提取下面一段话的主要信息,在方框内写出四个关键词。 据报道,我国国家图书馆浩瀚的馆藏古籍中,仅万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共计3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。 答案:古籍、修复、人才、不足 2. (08年福建卷)阅读下面文字材料,从中提取三个关键词。 美国卡地夫大学的科学家近日起程,前往调查大西洋深处地壳失踪之谜。 通常情况下,地幔由数公里厚的地壳所覆盖,但科学家发现,在大西洋中部约有数千平方公里布置内的地壳似乎大面积失踪,地幔直接暴露在水下3000米左右的海底。卡地夫大学地球、海洋与行星科学学院的海洋地质学家克里斯认为,这有如发现了地球表面的伤口。他表示,该处虽不是地壳失踪的唯一之处,但可能是最有意义的一处。一般来说,当板块断裂后,地幔将涌出,形成岩浆。而这种通常的情况没有发生,说明一定存在某种原因。科学家希望了解该处的地壳是否从来就不存在,还是因为发生大规模地层断裂所致。如果事实果真如此,科学家希望搞清楚,这种现象是怎么形成的以及为什么会形成这种现象。 为了回答这些问题,克里斯将参加由特勒姆大学海洋地球物理系教授罗杰?塞尔所领导的研究小组,搭乘库克号科学考察船,前往停得角群岛和加勒比之间的区域通行考察。科学家将利用声纳技术形成海底声纳图像,并利用海下机器人钻取岩芯样本。科学家认为,这次考察将为深入研究和了解地幔提供一个难得的机会,并可能加深对板块构造的理解。 答案:地壳失踪考察(调查) 3.提取下面一段话的主要信息,写出四个关键词语。 北京奥运会的举办,为我们留下了丰富的物质遗产。一批体育场馆和基础设施,不仅为北京奥运会顺利举行提供了良好条件,更为中国未来发展,为中国人民继续美好生活提供了良好条件。同时,北京奥运会的精神遗产更为持久、更为宝贵。最重要的有三个方面。一是弘扬团结、友谊、和平的奥林匹克精神。二是实践绿色奥运、科技奥运、人文奥运理念。三是促进世界各国文化的相互交流、相互借鉴。 答案:北京、奥运、遗产、丰富 4.阅读下面的消息,提取出三个关键词。 据业内权威人士透露,世界碳酸饮料巨头可口可乐即将把北京市场从华北地区独立出来,升级为可口可乐中国市场的“北京区”。“北京区”专门下设奥运策划部。目前,北京市场有可口可乐散装现调机1600台,自动贩卖机650台。可口可乐、芬达、雪碧等可口可乐系列产品在北京饮料市场占据了2/3的份额。按可口可乐奥运计划,从今年至2008年,“北京区”将以每年10%的速度增加散装现调机可口可乐销售网点,并使价格较低的瓶装可乐全面占领“郊区市场”。将出任“北京区”的总经理说,2008年奥运会前,可口可乐产品将在北京“无处不在”,形成“买得到、买得起、乐得买”的局面。 答案:奥运、可口可乐、北京 5.阅读下面一段话,提取出四个关键词。

如何快速解决提取关键词的题目

如何快速解决提取关键词的题目 个考点的一个综合。 一、两压缩,两提取 由于“提取关键词”是“压缩语段”的变体,所以在答题思路上要借助“压缩语段”的解题思想。“提取关键词”正确的方法是:先整体把握材料,用压缩语段的方法对材料进行压缩,提取出一句话;然后再对这句话进行压缩,提取关键词。即:两压缩,两提取。 【例1】提取下面一段话的主要信息,在方框写出四个关键词。(全国卷Ⅰ) 据报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共计3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。 (1)第一步:对材料进行压缩和提取。 解答时,先通读全段,然后压缩语段,将原文压缩成一句话。 这是一段记叙性的文字,全文两句话,其中第一句话由两个分句构成。第一句话,第一层从国家图书馆的角度,以修复任务的巨大(5000余米)与修复人员稀缺(不过10人)之间的反差,表明古籍修复的专业人才极其缺乏;第二层,从全国的角度,说明古籍修复的专业人才短缺非个别现象(全国围都存在)。第二句话,以一种假设的结果强调古籍修复人才的不足。 所以,这段文字可以压缩为:我国古籍修复的专业人才极为不足。(15字) (2)第二步:对第一步压缩后的话进行提取: 有了这句话作基础,提取关键词就有了明确的围,确定的指向。以第一次压缩的文字为蓝本,最后提取的关键词是:古籍、修复、人才、不足。 二、分层寻找法 ..

提取关键词、概括主要内容练习

提取关键词练习 【学习目标】 1、掌握提取关键词类、概括主要内容类语言表达题的解题方法。 2、提升语段的理解、分析、概括能力。 【学习重点】 掌握提取关键词类、概括主要内容类语言表达题的解题方法。 【学习方法】 自主、合作、探究 【学习过程】 一、回顾复习 《考试大纲》规定:扩展语句,压缩语段,属于语言的表达应用能力,能力层级为E级? 关键词指的是一篇文章或一段文字中最紧要的词语。主要考查学生概括思想内容,提取关键信息的能力。 概括主要内容是将内容丰富的长语段,按要求浓缩成语言简洁、意思明了的短语段。一种是限字作答,规定不超过多少个字;一种是限句作答,要求只一句话表达。 二、自主合作探究 1、(1)用一句话概括下面这则消息的主要内容。(不超过15个字) 在许多民营和外资企业,普遍没有工会组织;中国人民大学的一位教授指出:在中国,最维护职工权利的组织莫过于工会;然而即使有,也是由资方掌握,发挥不了维护职工权益的作用。 据调查统计,中国目前有一亿多民工游离于工会之外,其中绝大多数是在非国有企业的民工;他们没有加入工会组织,也没有规范的行业组织,权益无法得到维护。虽然许多民工认为协商是解决问题的好办法,但他们苦于缺乏维护他们权益的工会组织以及专业的法律顾问。由于法律程序时间过长等原因,民工通常不会求助于劳动监察机构;这时如果有工会组织提供义务法律咨询,或指导他们与业主谈判协商,民工的权益就能够得到维护。

15 (2)提取四个关键词: 2、(1)提取下面一段话的主要信息,写出三个关键词 由教育部、公安部、国家安全生产监督管理总局组成的联合检查组,日前对河北、河南、辽宁、重庆等四省市的中小学安全和管理工作情况进行了联合检查。 在检查中也发现了一些隐忧:如许多学校体育运动场地普遍紧张;部分农村中小学校办学条件团难,学生食堂、宿舍等设施条件较差,亟需当地政府加大投入予以解决;有的学校应急预案内容不全面或过于笼统,缺乏可操作性,极个别的教育行政部门和学校甚至还没有建立应急预案,没有组织开展过紧急疏散演练活动;有的学校教学楼或学生宿舍疏散通道不畅;部分学校食堂尤其是农村学校食堂管理不到位,安全隐患较多。 中小学安全工作隐患多 (2)用一句话概括下面这则消息的主要内容。(不超过15个字) 15 3、提取下面一段话的主要信息,写出四个关键词 “十五”期间,全国妇联与政府部门联手加强城乡妇女教育培训和推动妇女就业再就业工作,制定完成了三个目标,即培训200万下岗失业妇女,为200万妇女提供就业指导,多渠道帮助200万妇女实现再就业。同时建立了国家创业示范基地,组织了妇女创业师资培训班,发放了妇女创业循环资金,总结推广妇女创业孵化器、小额贷款助创业等经验,在31个省、自治区、直辖市建立了妇女再就业信息指导中心,拓展了广大妇女的创业层次和创业领域。

提取关键词的方法

高考语言运用之提取关键词 2005年高考语文试题(全国卷一)首次出现“提取关键词”这一题型,2006年高考中这种题型再次受到高考命题者的青睐。那么什么是关键词呢?关键词是指一篇文章或一段文字中最重要的词语,常出现在文章篇名或文章正文中。要求考生从一段文字中提取出关键词,其目的在于考查学生概括思想内容、提取信息的能力。考生在解题时要大致把握关键词的意思,否则解题思路就会受阻。先来看一道高考题: 例1:(2005年全国高考卷)提取下面一段话的主要信息,在方框内写出四个关键词。据报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献共计 3000万册,残损情况也相当严重,亟待抢救性修复,但全国的古籍修复人才总共还不足百人。以这样少的人数去完成如此浩大的修复工程,即使夜以继日地工作也需要近千年。 分析:2005年的这道提取关键词的试题,从表面上看一些考生可能感到陌生,其实质这道试题的命题意图仍然是考查考生的阅读理解能力、概括综合能力和语言表达能力。这是近几年高考语文的一个热点,2005年以来则成为高考语文命题的一个亮点。原因是它紧扣时代的节拍:报纸、电视、网络等处处显示着关键词,同时又能更好地体现语文学科的工具性和人文性完美统一的特点。可以预测今后几年关键词的考查将更加频繁。 那么,如何准确地提取关键词呢?提取关键词,说到底就是要善于提取“核心信息”,是一种压缩信息类的题型,考查学生提取关键信息的能力。具体如下: 方法一:三步解题法 (一)明确陈述的对象或主要事件或议论的中心观点,文段的主要表述对象(主要概念或主要事件)“古籍”(“馆藏古籍”)、“人才”是主题词,不可不取。 (二)明确与主概念相对应的谓语动词或总结性的词语。如“修复”、“不足”就是对陈述的对象的陈述,不可不取。 (三)选定后,可将几个词语稍稍连缀,如能大体表达出文段的主要内容,即可敲定。如本题可连缀成:(馆藏)古籍(亟待)修复,(但这方面)人才(严重)不足。这有点像提取句子主干,可以利用语法分析的方法来做,基本程序为:压缩内容--提取主干--筛选比较--整合表达(一般可以表述为:“谁或什么怎么样了”这样一种主谓结构)。 方法二:先概括再提取 提取之前先概括语段内容,这应不是什么难事,平时语文课堂中的概括文章内容、提炼文章观点、归纳段落大意等,都是具体实践的过程。所给的材料一共两句话。第一句话又分为两个层次:先说国家图书馆馆藏古籍修复的专业人员不足;再说各地图书馆、博物馆同样面临古籍修复人才不足的问题,其中“不足百人”,表

提取关键词练习

中考语文提取关键词语类试题解析与演练 [考点聚焦]关键词指的是一篇文章或一段文字中最紧要的词语。提取关键词是近年来中考中出现的一种新题型,是一种压缩信息类的题型,主要考查学生概括思想内容、提取关键信息的能力。 解答此类试题要注意以下三点:一是筛选陈述的对象(主要概念或主要事件)或议论的中心观点。二是按照一定的程序提取关键词。先整体把握材料,用压缩语段的方法对材料进行压缩,提取出一句话:然后再对这句话进行压缩,提取关键词。三是要注意与归纳概括信息题的不同。提取的关键性词语的答案一般就在所给语段中,不需要我们自己去概括。 [典例解析]例l.(2013年江苏盐城)光伏产业是盐城经济开发区加快发展的新兴产业。阅读下面文字,提取关于“光伏发电”的三个关键词语。 光伏发电的主要原理是半导体的光伏效应,利用太阳能电池将太阳光能直接转化为电能。光伏发电应用广泛,任何需要电源的场合,上至航天器,下至家用电器,大到兆瓦级电站,小到玩具,光伏电源无处不在。光伏发电前景广阔,在21世纪会占据世界能源消费的重要席住,不但要替代部分常规能源.而且将成为世界能源供应的主体。 [解析]答题时,首先要认真阅读语段,明确陈述的对象,然后划分层次,明确各层次阐述的内容,最后提取出三个关键词语。此题的语段共三句话,分别从“主要原理”、“应用广泛”、“前景广阔”的角度对光伏发电进行介绍。因此,关于“光伏发电”的三个关键词语分别为“主要原理”、“应用广泛”、“前景广阔”。 例2.(2013年陕西)母亲节来临之际,多家媒体联合我省中小学校特别推出了“寻找最美妈妈”大型公益活动,请你参加这个活动。下面的宣传语中隐含着“最美妈妈”评选标准中的两个关键词,请将它们提取出来。 在社会转型、价值体乐重构的时代,“寻找最美妈妈”’活动表达了社会对道德价值回归的期待,反映了时代对真善关的呼唤。 [解析]答题时,要仔细研读宣传语,找出其关键内容“表达了社会对道德价值回归的期待,反映了时代对真善关的呼唤”,然后再从中提取出关键词。参考答案:(1)道德价值(2)真善美。 例3.(2013年新疆鸟鲁木齐)阅读下面的材料,完成后面的题目。 材料一:今年6月5日是第42个世界环境日,联合国环境规划署确定今年的主题是“思前,食后,厉行节约”。我国确定的主题是“同呼吸,共奋斗”。 材料二:据统计:①2012年乌鲁木齐市空气质量达到优良天数共计292天,达标率80%。优良天数比201 1年增加16天,三级以上污染天数比2011年减少15天,刷新了17年来优良天数的记录。2013年前五个月,与去年同期相比,我市空气中主要污染物浓度大幅下降。 材料三:201 2年,②乌鲁木齐市区域环境噪声监测共224个点、224平方公里,平均等效声级为54.3分贝。 材料四:目前,乌拉泊水库水质状况为“优”,满足饮用水源地一级保护水质功能要求。③全市以地下水和地表水为水源的8个水厂中有6个水源达标,2个不达标。 材料五:最新监测显示,柴窝堡湖的水质属劣V类水质,不符合渔业养殖用水水质要求,红雁池水库水质为Ⅳ类轻度污染水质,可以满足一般工业用水的水质功能要求。水磨河联丰桥、米泉桥河段均属劣V类水质,不能满足农业灌溉用水区的功能要求。 材料六:据了解,今年起乌鲁木齐执行新的《环境空气质量标准》,新标准对二氧化碳和可吸入颗粒物浓度限值大幅收紧,同时新增PM2.5、臭氧以及一氧化碳三项评价指标,④空气质量达标难度大大增强。 从以上材料提供的信息看,影响环境质量的因素有哪些?请提取关键词。 [解析]本题是典型的提取关键词类试题,要求考生从材料提供的信息中提取出影响环境质量的因素。答题时,要仔细研读材料,找出影响环境质量的因素。参考答案:空气质量、水质、噪声等级。

社科类文章如何提取关键词

【原题重现】 海淀区高三第一学期期末语文卷第12小题。(文章略) 12.统观全文,从中摘取最能体现文章主要内容的5个关键词。(5分) 【分析】分值5分,很高。此题考查的摘取关键词。考点实则为信息筛选和压缩语段。主要考查学生概括思想内容、提取关键信息的能力。5分的分值是很高的。一般来说,要求考生在准确理解文段的基础上找到有效信息,并从中筛选出核心信息;然后用最简洁的语言加以概括,且概括时只能用词或短语。因为这个能力会涉及到阅读、语用、作文审题等等,是一个影响学生高考成绩的很重要的能力。 一、【方法解读】 【高考真题】:(2010年江苏卷) 阅读下面一段文字,找出“碳链式反应”过程的三个关键性词语。 科学家在喀斯特地貌的研究中,发现了一个复杂的碳链式反应。当水流从空气中“大口吮吸”二氧化碳并侵蚀石灰岩时,持续不断的吸碳过程就开始了。接着,在岩石表面自由流淌的酸性水流携带着大量碳酸氢根,随着自然界的水循环转辗奔向江河湖海。此时,浮游植物体内的“食物加工厂”在急切地“找米下锅”,它们惊喜地发现,只要分泌一种叫做“碳酸酐酶”的催化剂,对水中的碳酸氢根“略施魔法”,等待加工的“米”——二氧化碳,就唾手可得。最终,光合作用将大量随波逐流的碳转化成有机碳,封存与水生植物体内。 【解析】属“提取关键词”题型。解题步骤:1.读题,明确陈述的对象或主要事件或议论的中心观点,文段的主要表述对象。2.分层次,明确与主概念相对应的谓语动词或总结性的词语。题中要求“找出…碳链式反应?过程的三个关键性词语”,“接着”、“最终”提示我们这一过程可分三层次,三个层次的核心动词便是“吸碳”、“施魔法”、“光合作用”。 答案:吸碳略施魔法光合作用 二、【考点明析】: 关键词这一概念在撰写正规论文时经常涉及,指的是一篇文章或一段文字中最紧要的词语。关键词又是网络中经常提及的词语,指的是人们输入搜索框中的文字,也就是让搜索引擎(如“百度”“谷歌”搜索)寻找的东西。关键词的内容大多为人名、术语、网站、新闻、软件等。例如,就今天我们学习的探讨的内容,我们可以搜索[高考]、[语文]、[现代文阅读]、[关键词],那么这四个词就可称为关键词了。 三、【火眼金睛】 方法一:步步为营法(从语段中心话题入手) 解题基本流程:明确话题——寻找谓语——连缀成句——提取关键词 具体阐释:我们以2005年全国卷为例。 例①提取下面一段话的主要信息,在方框内写出四个关键词。 椐报道,我国国家图书馆浩瀚的馆藏古籍中,仅1.6万卷“敦煌遗书”就有5000余米长卷需要修复,而国图从事古籍修复的专业人员不过10人;各地图书馆、博物馆收藏的古籍文献

期刊关键词抽取方法

期刊关键词抽取方法 1引言 关键词是与文章内容和主旨密切相关的短语,被广泛应用于新闻报道、学术期刊等领域。关键词可以提高文档的管理和检索效率,还可以为一些文本挖掘任务提供丰富的语义信息,例如文档的分类、聚类、检索、分析和主题搜索等任务[1]。期刊的关键词对应学术期刊中的keywords部分,包含简单关键词(SimpleWord,SW)和复杂关键词(ComplexWord,CW)两大部分,其中SW表示由一个简单词组成的关键词,CW表示由多个简单词组成的关键词。根据IEEEExplorer[2]统计数据显示,每年约有24万篇新学术期刊被收录。根据某些学科期刊的要求,在文献发表时作者需要在期刊中对关键词进行注明。但仍有一些学科的出版物与早期发行的期刊、书籍、文献的部分章节不包含关键词等信息。缺乏关键词会在期刊的查阅和参考过程中造成困难。虽然可以使用索引对全文进行检索,但这种方法工作量大、且检索结果依赖于分词效果,难以给出准确的检索结果。而关键词抽取就是从文章中选择一小部分单词或短语来描述文章重要内容[3]。因此,需要寻找一种有效的期刊关键词抽取方法。针对传统方法的不足并结合最新研究成果,本文提出了一种基于融合词性的BiLSTM-CRF的期刊关键词提取方法。在实现数据时序和语义信息挖掘的同时,也保证了单词与单词之间的关联性。在真实数据上的实验结果表明融合词性的BiLSTM-CRF模型是一种有效的期刊关键词自动抽取方法。 2相关工作

目前,关键词抽取任务主要有两种方法,基于无监督的方法和基于有监督的方法[4,5]:2.1基于无监督的方法:无监督方法仅通过一些事先规定的关键 词权重的量化指标,计算权重排序关键词重要性来实现。TFIDF是字符串频率关键词[6,7]抽取的一种典型方法,其本质是无监督的,可以简单快捷的进行关键词抽取。该方法仅扫描语料库一次,即可获得所有单词的文本频率。但除了词频之外,仍需要考虑许多因素,例如词的词性以及在文本中的位置等。为了提高该方法的性能,必须人工的对其许多规则进行设计[5]。在新闻领域,字符串频率方 法比有监督的机器学习方法更有效。因为机器学习的方法在模型训练时需要花费大量的时间,并且文档需要标注。其次,每天都会发生新事件,新闻的内容具有多样性。但无监督方法只提供了单词在文本中的相对重要程度,无法有效地综合利用词法和语义信息对候选关键词进行排序[8]。2.2基于有监督的方法:有监督的方法将关键词抽取问题视为判断每个候选关键词是否为关键词的二分类问题, 它需要一个已经标注关键词的文档集合来训练分类模型,即通过在一个有标注的 数据集上训练分类器,以便决定候选词中哪些是关键词。不同的机器学习算法可 以训练出不同的分类器,如朴素贝叶斯[9],决策树[10]、最大熵算法[11]和支持向量机[12]等是关键词抽取中的代表性方法,通过大量数据来训练分类器。可见有监督方法可以利用更多信息具有更大的优势,且实验效果比无监督方法好[4]。 这种方法具有较高的准确性和较强的稳定性,但需要很大的语料库,且所有文本需要进行标注。标注人员具有一定的主观性并且标注任务具有复杂性。不同的标注人员在进行同一个文本的标注时,具有不同的认知和看法,标注的质量会影响模型的性能。并且上述方法都将关键词抽取问题视为一个二分类问题,对每个单词独立处理,忽略了文本结构信息。为解决该问题,可以将关键词抽取问题转化为序列标注问题,常用的模型有最大熵模型(MaximumEntropy,ME),隐马尔科夫模型(HiddenMarkovModel,HMM),条件随机场模型(ConditionalRandomField,CRF)。其中CRF模型的应用最为广泛,性能也最好,可以较为精确的实现关键词的有效提取,但却需要人工设计特征,特征设计的优劣与否将会直接影响到模型的性能和最终的抽取效果。随着深度学习的不断发展,深度神经网络,尤其是长短期记忆网络(LongShortTermMemory,LSTM)模型,前

高考语文专题复习:“提取关键词”解题指导与训练

提取关键词 1、提取下面一段话的主要信息,写出四个关键词。 “十五”期间,全国妇联与政府部门联手加强城乡妇女教育培训和推动妇女就业再就业工作,制定完成了三个目标,即培训200万下岗失业妇女,为200万妇女提供就业指导,多渠道帮助200万妇女实现再就业。同时建立了国家创业示范基地,组织了妇女创业师资培训班,发放了妇女创业循环资金,总结推广妇女创业孵化器、小额贷款助创业等经验,在31个省、自治区、直辖市建立了妇女再就业信息指导中心,拓展了广大妇女的创业层次和创业领域。 2、根据下面创维集团宣布消息的主要内容,提取四个关键词。 创维集团昨天对外宣布,正式进军半导体产业的晶圆项目。据介绍,该项目的产品方向为功率半导体器件,主要应用于绿色照明、充电器和家用电器领域,整个项目将于今年三季度开始基础建设,2006年下半年试产,其设计产能6英寸晶圆48万片,年产值4.3亿元。目前,国内分立器件市场中,进口产品依然占据了绝对多数,国内产品市场份额不足一成,需求缺口很大。国内半导体产业布局基本上以上海和江浙为中心,集中了全国约70%的生产能力。珠三角半导体使用量居国内首位,但能生产晶圆的企业却屈指可数,国内有晶片制造能力的企业也就十来家。市场需求给实力企业进入半导体制造领域提供了较好的机会。创维集团同时宣布,该项目首期投资2.4亿元已经到位。 3、阅读下面一段文了,写出四个关键词概括文意。 美国能源部费米国家加速器实验室利用Tevatron对撞机,成功发现两种罕见的粒子;一种由两个上夸克和一个底夸克组成;另一种由两个下夸克和一个底夸克组成。它们是最为常见的质子和中子的“远亲”,尾重子范畴,这也是夸克理论预测出的6种重子中的两种。该成果有助于人类完成重子周期表。 关键词: 4、提取下面一段话的主要信息,写出三个关键词语。引起小麦条锈病大流行的原因主要是病菌的变异速度比育种速度快。为了寻找新的抗源,李振声院士搜集鉴定了800多种牧草,发现野生的长穗偃麦草等对条锈病有很强的抗性。他大胆提出了通过远缘杂交,将草的抗病基因转移给小麦,选育持久性抗病小麦品种的投想。1964年,小麦成熟前连续40天阴雨,到6月14日天气突然暴晴,一天的工夫,几乎所有的小麦都青干了,只有小偃6号的祖父(小偃55—6仍保持着金黄颜色,这是一个十分难得的材料!李振声带领课题组紧紧抓住这个机遇,又经过两次杂交,育成了一个具有相对持久的抗病性、高产、稳产、优质的小麦新品种——小偃6号。因其耐强光和干热风的特性,小偃6号作为陕西省小麦骨干品种长达16年以上,至今仍然有50多万亩的种植面积!1985年获得国家发明一等奖。小偃6号作为小麦育种的骨干体系,衍生出了50多个小麦品种。这些品种累计推广3亿亩以上,增产小麦超过150亿斤。 5、根据要求提取下面一段话的主要信息,写出六个关键词(可以是短语。由于司马迁认识到了,历史终归是“人”的历史,不是“天”的意志史,于是以“绍圣《春秋》”为使命的司马迁抛弃了孔子既定的历史纪年法——编年体,而改用纪传体。这决不是一

高考提取关键词概要

高考提取关键词概要 浩海信息多浓缩取精华压缩语段提取关键词提取下面一段话的主要信息写出四个关键词语。 (分)从甲骨文到草书、行书的各种书法艺术间接地反映了现实某些方面的属性将具体的形式集中概括为抽象的意象通过视觉来启发人们的想象力调动人们的情感使人们从意象中体味到其间所蕴含的美。 这也是一些讲书法的文章里常说的“舍貌取神”──舍弃客观事物的具体现象特征而摄取其神髓。 第一步:明确陈述的对象或主要事件或议论的中心观点第二步:明确与主概念相对应的谓语动词或总结性的词语第三步:选定后可将几个词语连缀起来如能大体表达出文段的主要内容即可确定。 “步法”提取关键词应注意的问题:、关键词既可以是双音节词也可以是四字短语或多音节短语、关键词一般是名词、动词、形容词不会是虚词、书写时注意词语的顺序因为不少题暗含顺序的要求最好按原文顺序书写。 一、关注话题任何语段它总是围绕一个话题来展开体现话题的词语肯定是关键词之一。 可采用语法分析法抓句子的主干。 用“什么怎么样”这种格式来进行概括。 (全国)提取下面一段话的主要信息在方框内写出四个关键词。 据报道我国国家图书馆浩瀚的馆藏古籍中仅万卷“敦煌遗书”就

有余米长卷需要修复而国图从事古籍修复的专业人员不过人各地图书馆、博物馆收藏的古籍文献共计万册残损情况也相当严重亟待抢救性修复但全国的古籍修复人才总共还不足百人。 以这样少的人数去完成如此浩大的修复工程即使夜以继日地工作也需要近千年。 这个语段谈论的话题是?提取下面一段话的主要信息在方框内写出四个关键词。 据报道我国国家图书馆浩瀚的馆藏古籍中仅万卷“敦煌遗书”就有余米长卷需要修复而国图从事古籍修复的专业人员不过人各地图书馆、博物馆收藏的古籍文献共计万册残损情况也相当严重亟待抢救性修复但全国的古籍修复人才总共还不足百人。 以这样少的人数去完成如此浩大的修复工程即使夜以继日地工作也需要近千年。 语段话题:馆藏古籍修复。 提取下面一段话的主要信息在方框内写出四个关键词。 据报道我国国家图书馆浩瀚的馆藏古籍中仅万卷“敦煌遗书”就有余米长卷需要修复而国图从事古籍修复的专业人员不过人各地图书馆、博物馆收藏的古籍文献共计万册残损情况也相当严重亟待抢救性修复但全国的古籍修复人才总共还不足百人。 以这样少的人数去完成如此浩大的修复工程即使夜以继日地工作也需要近千年。 四个关键词:古籍修复人才不足(缺乏)(年四川卷)下面是一篇

基于语义的中文文本关键词提取算法

(小结)基于语义的中文文本关键词提取算 法 该方法核心关键是:在基于传统统计词频的基础上,参考了不同词之间是否为同义关系。判断同义关系的基础是结合了代汉语较常用的一部类义词典——哈工大的《同义词词林》扩展版。 本文根据《同义词词林》中词关系之间的定义,定义了词语词之间的近似度。因此对于一篇文章中的不同词,词之间根据近似度数值关系可以组成网络(词语语义相似度网络)。然后分析该网络中节点(词)的居间度,即聚集程度。 词语与主题越相关,词语的居间度密度越大。该方法出于作者认为:聚集文档围绕主题构建,与主题越相关,词语越密集,即与主题最相关的词语占的比例较大。并且主题相关词语与主题有语义相关性,所以他们彼此也有一定的语义相似度。最终关键词的提取同时参考了词语的居间度与词频。 附算法示意图:

文中提出算法示例结果:《我爱逛农贸市场》关键词提取结果为: SKE 算法提取的关键词为农贸市场、爱、鱼、乌骨鸡、羊肉、花生; 基于统计特征的算法提取的关键词为农贸市场、逛、爱、变化、美、生活。 个人对算法示例结果评价:具体某些场合可能会好于传统算法,该例子也并不表明该算法明显优秀,例如个人觉得关键字《逛》很重要。 附《我爱逛农贸市场》 我/r 爱/v 逛/v 农贸市场/n 19980101-07-008-002/m 董/nr 其中/nr 19980101-07-008-003/m 近些年/t 来/f ,/w 生活/vn 中/f 必不可少/l 的/u 便/d 是/v 逛/v 农贸市场/n 。/w 19980101-07-008-004/m 大概/d 是/v 我/r 为着/p 生活/v 而/c 操持/v 家务/n ,/w 又/d 从事/v 美术/n 创作/vn 而/c 需/v 感受/v 生活/vn ,/w 所以/c 对/p 逛/v 农贸市场/n 特别/d 感/Vg 兴趣/n 。/w 即使/c 我/r 每次/r 出差/v 外地/n ,/w 也/d 尽可能/d 要/v 去/v 农贸市场/n 转转/v 。/w 19980101-07-008-005/m 在/p 离/v 我家/n 不/d 远/a 的/u 一/m 条/q 小/a 街/n 里/f ,/w 有/v 一个/m 很/d 热闹/a 的/u 早市/n 。/w 蔬菜/n 、/w 瓜果/n 、/w 家禽/n 、/w 水产/n 、/w 日用/b 工业品/n 都/d 有/v 。/w 不过/c ,/w 还/d 是/v 农副产品/j 居多/v ,/w 而/c 农副产品/j 中/f 又/d 数/v 蔬菜/n 最/d 多/a ,/w 品种/n 也/d 非常/d 丰富/a ,/w 连/u 南方/f 的/u 苦瓜/n 、/w 蕻菜/n 、/w 苋菜/n 也/d 多/a 起来/v 了/y 。/w 尤其/d 在/p 夏/Tg 秋/Tg 两/m 季/Ng ,/w 映入/v 你/r 眼帘/n 的/u 尽/d 是/v 那/r 绿茵茵/z 的/u 芹菜/n 、/w 油菜/n 、/w 菠菜/n ,/w 红澄澄/z 的/u 西红柿/n 、/w 红/a 辣

高考语言运用之提取关键词经典题例(含答案)

高考语言运用之提取关键词经典题例(含答案) 1、提取下面一段话的主要信息,写出四个关键词。 “十五”期间,全国妇联与政府部门联手加强城乡妇女教育培训和推动妇女就业再就业工作,制定完成了三个目标,即培训200万下岗失业妇女,为200万妇女提供就业指导,多渠道帮助200万妇女实现再就业。同时建立了国家创业示范基地,组织了妇女创业师资培训班,发放了妇女创业循环资金,总结推广妇女创业孵化器、小额贷款助创业等经验,在31个省、自治区、直辖市建立了妇女再就业信息指导中心,拓展了广大妇女的创业层次和创业领域。 答案:政府帮助妇女就业 2、根据下面创维集团宣布消息的主要内容,提取四个关键词。创维集团昨天对外宣布,正式进军半导体产业的晶圆项目。据介绍,该项目的产品方向为功率半导体器件,主要应用于

绿色照明、充电器和家用电器领域,整个项目将于今年三季度开始基础建设,2006年下半年试产,其设计产能6英寸晶圆48万片,年产值4.3亿元。目前,国内分立器件市场中,进口产品依然占据了绝对多数,国内产品市场份额不足一成,需求缺口很大。国内半导体产业布局基本上以上海和江浙为中心,集中了全国约70%的生产能力。珠三角半导体使用量居国内首位,但能生产晶圆的企业却屈指可数,国内有晶片制造能力的企业也就十来家。市场需求给实力企业进入半导体制造领域提供了较好的机会。创维集团同时宣布,该项目首期投资2.4亿元已经到位。 答案:创维、进军、半导体产业、晶圆项目。 3、提取下面一段话的主要信息,写出四个关键词语。(4分) (06广东) 从甲骨文到草书、行书的各种书法艺术,间接的反映了现实某些方面的属性,将具体的形式集中概括为抽象的意象,通

相关文档
相关文档 最新文档