文档库 最新最全的文档下载
当前位置:文档库 › 信息检索复习整理概述

信息检索复习整理概述

信息检索复习整理概述
信息检索复习整理概述

一、什么是信息(Information)?

在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。在我国台湾、香港地区,该词被译为“资讯”。

信息是被反映物的属性再现,信息的属性在于表现它物。也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。一切事物包括自然界和人类社会都会产生信息。一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。

2、信息具有以下特征:

1)普遍性

(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。

(3)传递性

(4)可转换性:信息是可以由一种形态转换成另一种形态。信息一般有4种形态:数据、文本、声音、图像。这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。

(5)可再生性

(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。(8)可存储性:信息是可以通过各种方法存储的。

二、信息检索

广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。

狭义:仅仅指信息查找的过程。即取的环节。

三、信息检索的发展

1、第一阶段:完全手工检索阶段

2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段

3、第三阶段:计算机检索系统的发展阶段

4、第四阶段:基于Internet 的网络化检索系统阶段

信息资源的分类:

1、信息源可分为自然信息源和社会信息源。

2、按信息资源所依附的载体划分(不用全背)

(1)体裁信息资源:以人体为载体并能为他人识别的信息资源。按其表述方式又可分为口语信息源和体语信息源。口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。

(2)实物信息资源:以实物为载体的信息资源。又分为自然实物信息源与人工实物信息源。如:化石、产品、样品等。

(3)文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。

(4)网络信息资源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储

的手段与形式的信息资源。

3、按信息资源传递的范围划分:

(1)公开信息资源:又称共享信息资源或白色信息资源(white information),指公开发行、流通和传递的信息资源,其蕴涵的信息人人可以使用。一般来说,公开信息资源的数量最大,而且能够作为信息商品进行流通领域。

(2)半公开信息资源:又称灰色信息资源(grey information),指非公开发行、流通和传递,从常规途径难以获取的信息(内部信息)。这类信息出版量小,发行渠道复杂,流通传递范围有限,不易收集。例如:内部的刊物、技术报告、会议资料等。

(3)非公开信息资源:又称黑色信息资源(black information),指人们未破译或未被识别的,也指处于保密状态的信息。例如:考古发现的古老文字、未解密的政府文件、内部档案、个人日记、私人信件等。

自然信息均属于不可检信息。

超文本型(Hypertext):是用超链结的方法,将各种不同空间的文字信息组织在一起的网状文本。

文献信息资源1、按信息资源所依附的载体的物质形态划分

(1)刻写型:包括手稿、日记、信件、原始档案、碑刻等。

(2)印刷型:主要是指以纸张为载体,以印刷为记录手段,把信息内容固化在纸张上的形式。其优点是便于直接阅读、使用方便,其缺点是较笨重、存储密度低、收藏占用空间大、加工保存等花费人力物力大、识别和提取难以实现机械化和自动化。

(3)缩微型:以感光材料为载体,以缩微照相为记录手段而产生的一种载体形式,如缩微胶卷、缩微胶片等。其优点是存储密度较大、体积小、便于收藏保存和远距离传递。缺点是不能直接阅读、需借助缩微阅读机或阅读复印机才能使用。

缩微型一般针对于数量大、利用率低但又有较大保存和利用价值的信息资源。(4)声像型:以磁性和感光材料为载体,借助特殊的机械装置(如复录机、摄像机、录像机等)直接记录声音、图像信号的信息载体,又称视听资料,如唱片、录音带、录像带、幻灯片、电影片、多媒体资料等。

其优点是可以闻其声、观其形,直观而真切,给人以生动鲜明的印象。其缺点是制造成本较高,且需要借助于一定的设备才能使用。

2、按信息资源的加工深度和结构等级划分

(1)零次文献:指未经过任何加工的原始文献。如:实验记录、手稿、日记、原始录音、原始录像、谈话记录。

(2)一次文献:未经加工或粗略加工的原始信息资源,以本人的研究成果为基本素材而创作的文献,具体、详尽和系统化。如期刊论文、专利文献、科技报告、会议录、学位论文等等。

(3)二次文献:它是将大量分散、零乱、无序的一次文献进行进行加工、整理、标引、著录、浓缩,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。如:目录、题录、索引、文摘。具有报道和检索功能。

(4)三次文献:通过二次信息资源提供的线索,对某一范围内的一次信息资源进行分析、研究、加工而成的信息资源,它包括综述、述评、专题情报研究报告、百科全书、年鉴、

指南、手册、词典等。

特点:

一次文献是最重要的文献,是全部文献的基础。数量庞大、内容分散、无系统性,不便于管理和传播。

二次文献作为寻找一次文献的指南与向导,能提供多种检索途径(分类、主题、著者、团体著者、会议名称等)。

三次文献可以充分利用反映某一领域研究动态的综述类文献信息,在短时间内了解其历史、动态、水平等。

一次文献是二次文献和三次文献的基础,是文献检索的主要对象;二次文献具有浓缩性,是一次文献的简略及有序化,是文献检索的工具;三次文献具有综合性,既是检索对象,又可提供一定的检索途径与检索手段。

总之,文献经过加工、压缩,从零次信息到三次信息,使科技信息由分散到集中,由无序到有序,由无组织到系统化,由博而精的对知识信息进行不同层次的加工的过程。

信息的不同出版类型划分为:

图书期刊科技报告会议文献[C]论题集中、新颖、丰富、专深、学术性强,是了解各国科技发展水平和动向的重要文献来源。

(5)专利文献[P]:(6)技术标准和规范[S]:7)政府出版物(8)学位论文[D]:

(9)产品资料(10)技术档案(11)报纸[N]

3)科技报告[R] (理解)scientific and technical report :报道(记录)研究工作和开发调查工作的成果或进展情况的一种文献类型。又称研究报告、报告文献。出现于20世纪初,第二次世界大战后迅速发展,成为科技文献中的一大门类。大多与政府的研究活动、国防及尖端科技领域有关,发表及时,课题专深,内容新颖、成熟,数据完整,且注重报道进行中的科研工作,是一种重要的信息源。查寻科技报告有专门的检索工具。

特点:①反映新的科研成果迅速。以科技报告形式反映科研成果比这些成果在期刊上发表,一般要早一年左右,有的则不在期刊上发表。②内容多样化。它几乎涉及整个科学、技术领域和社会科学、行为科学以及部分人文科学领域。③保密性。大量科技报告都与政府的研究活动、高新技术有关,使用范围控制较严。④报告质量参差不齐。大部分科技报告是合同研究计划的产物,由工程技术人员编写,由于撰写受时间限制、因保密需要以工作文件形式出现等因素影响,使报告的质量相差很大。⑤每份报告自成一册,装订简单,一般都有连续编号,出版发行不规则。通常载有主持单位、报告撰写者、密级、报告号、研究项目号和合同号等。

附:美国四大科技报告(AD,PB,NASA ,DOE )

按检索对象的内容区分:

(1)文献检索(document retrieval)

(2)数据检索(data retrieval)

(3)事实检索(fact retrieval)

手工检索:以手工操作的方式,利用检索工具书进行信息检索。手工信息检索是信息检索的传统方式,已经历经了一个多世纪的发展历程。

检索效率高;直接性灵活性好,浏览功能差

附:查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。

查全率=(检出相关文献量/系统中相关文献总量)*100%

查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度。

查准率=(检出相关文献量/检出文献总量)*100%

三、按检索对象区分:

(1)文本检索:查找含有特定信息的文本文献的检索,其结果是以文本形式反映特信息反映的文献。这是一种传统的信息检索类型,在信息检索中至今占据主要地位。

(2)多媒体检索:多媒体是指将声音、图像、通信等在内的多种媒体的功能有机结合在一起,并用某种新媒体代替传统媒体的多种媒体。

多媒体检索是指根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行组织、存储从而识别、查找并获取所需信息的过程。

在因特网上存在着大量的多媒体文献,用户常常需要查找特定的声音、图像、动画等。多媒体文献的信息组织与处理传统文本的处理截然不同,其检索要求和检索途径也别具特色,这是现代信息检索的新课题。

(3)超媒体检索(hyper media retrieval)

如果超文本节点中的信息除文本块以外,还有图形、图像、声音、视频等多媒体信息,则称为超媒体(hyper media )。即存储对象超出了文本范畴,融入了静、动态图像(形)以及声音等多种媒体信息。

(同样具有超文本检索的优点,并且检索内容与形式更为丰富)

(1)强相关检索:

强调检索的准确性,也称作特性检索。这种检索注重查准率。只要检索得到的文献信息能满足用户的需求就行,对于检索结果的数量多少不作要求。

(2)弱相关检索:

强调检索的全面性,向用户提供系统完整的信息的检索。也称族性检索。这种检索注重查全性,要求检索出一段时间期限内有关特定主题的所有信息。为了尽可能避免漏检相关信息,对于检索的准确性相对要求较低。

要注意的是,这是两种检索要求比较极端的检索类型。实际上是介于两者之间,保证一定的查全率和查准率。

按时间跨度

(1)定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。

(2)回溯检索RS (retrospective search)查找一段时期内有关特定主题信息的检索。

文献检索是以文献作为检索对象,查找含有用户所需信息内容的文献,文献是一种相关性检索而非确定性检索,系统不直接解答用户所提出的问题本身,只提供与之相关文献或文

献的属性信息与来源指示供用户参考和取舍。所以其检索对象是包含特定信息的各种文献

七、按检索途径的特点区分

(1) 常用法,工具法,利用检索工具或系统中常设的检索入口查找文献信息的方法。如主题、分类、著者、题名等。其具体操作分为顺查,倒查,抽查

顺查方式是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。

倒查方式则相反。从最新时间查找起,直到满足检索要求为止。

抽查是针对有关学科的发展特点,抽查某些特定时期的文献信息。通常抓住学科专业发展兴旺的时期,此时的不仅文献发表的数量多,质量也高。

分类语言(大体了解):用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。其意义在于根据文献信息的内容特征和分类表,把相同内容的文献、信息集中在一起,同时又把不同内容的文献信息区别开来,以实现相关集中的功能。

分类语言的主要特点:按学科、专业集中相关文献信息,从知识分类的角度揭示文献信息之间的区别和联系,提供从学科专业领域检索文献信息的途径。

(大体了解)事实检索是检索关于某些客体(如机构、人物等)的指示性描述,或关于某一事件发生的时间、地点、经过等信息并将其查找出来的检索。如:名词术语、概念、定义、理论、方法、公式、事件等。事实检索属于数据,因为事实也是一种数据,即非数值性数据。

数据检索是将经过选择、整理、鉴定的数值存入数据库中,根据需要查出可回答某一问题的数据的检索。数据检索是一种确定性的检索,即直接提供用户所需要的确切数据。而且检索结果一般也是确定性的,要么是有,要么是没有;要么是对,要么是错。有些数据检索系统不仅能查出数据,还提供一定的运算、推导能力。

信息检索语言(retrieval language)又称为情报语言、情报存储和检索语言、信息组织语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁。

信息检索语言是检索系统的语言基础,主要作用是:表达描述信息内容和信息需求;用于信息的组织和整序;用于对检索系统中索引标识或提问标识的规范和控制。

根据结构原理划分:(大体了解)

1)分类语言

(2)主题语言

(3)分类主题一体化语言

(4)代码语言

(5)引文语言

分类语言主要可分为等级体系型分类语言和分面组配型分类语言两种。

目前我国广泛采用《中国图书馆分类法》(简称《中图法》)进行分类,该分类法由5大部类、22个大类组成

主题语言:以主题词来表达信息主题概念的语言,它按事物对文献信息进行浓缩、描述和整序,借用自然语言的语词,作为文献信息和检索提问的内容标示。

特点:按特定的事物集中文献信息,有较强的直接性。

构成原理:利用自然语言中的名词术语,经过一定程度的规范化处理,作为表达文献和提问内容的主题词;利用参照系统中的各种手段,显示主题标识之间的各种关系,并以此把主题词表中的众多主题词相互联系起来,构成多维的主题词体系;利用主题词的字顺序列,按事物的名称来排列和检索文献信息。

①标题语言:采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物--主题,并将全部标识按字顺排列。

例:一篇文章用“微型计算机”这个术语来叙述它的研究对象,另一篇文章用“微型电脑”这个术语来叙述它的研究对象,第三篇文章用“微机”这个术语来叙述,虽然都表示同一概念,这时就不能直接用“微型电脑”或“微机”来作标题词了,这三篇文章都必须用“微型计算机”作标题词(根据词表决定)。因为这三个术语是等同概念,如果同时用三个术语来标引,便会导致文献被分散。当然,读者若从“微型电脑”或“微机”入手检索时,都可以在标题词表中看到“见:微型计算机”的参照指示。

关键词语言(keyword):以关键词(从文献题名或文摘以及正文中抽取的,能够表达文献主题并具有实质意义的未经规范化处理的自然语言词汇)作为文献内容标识和检索依据的一种信息检索语言。

关键词与其他主题语言的区别在于:前者是没有经过规范处理的自然语言。属于非受控语言。后者是经过规范处理的自然语言,属于受控语言。

③元词语言:④叙词语言

检索途径及其选择

1、内容特征检索途径:内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。

(1)分类途径

(2)主题途径

(3)分类主题途径

2、外部特征检索途径:外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等

(1)责任者途径

(2)题名途径

(3)序号途径

(4)引文途径

西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等。

百科全书可按收录范围分为综合性百科全书(如:《中国百科全书》、专业性百科全书(如:《化工百科全书》;还可按编辑规模分为:大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)。

编排方式有三种:按字顺编排、按分类编排和分类与字顺相结合编排。目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的。

百科全书一般都有各种索引,其中最主要的是主题索引

(了解)《中国大百科全书》是中国第一部大型综合性百科全书,也是世界上规模较大的几部百科全书之一。美国百科全书》名为Encyclopedia Americana,简称EA

《不列颠百科全书(Encyclopedia Britannica)》(又称《大英百科全书》,简称EB)

科利尔百科全书(Collier' Encyclopedia)简称EC

世界ABC三大百科全书:美国百科全书、不列颠百科全书、科利尔百科全书

年鉴大体可分为综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等。

名录可分为人名录、地名录和机构名录

文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献。

检索工具必须具备四个条件:

第一,必须详细描述文献的外部特征和内容特征。

第二,每条描述记录都必须具有各种检索标识。(所谓检索标识是指描述文献外部特征和内容特征的专门用于信息检索的词、词组或代码,如主题词、分类号、著者姓名、文献序号等。)

第三,全部描述记录要科学地组织成一个有机的整体

第四,能够提供多种检索途径。

按著录方式分,有目录型、题录型和文摘型。

其中按著录方式划分体现了检索工具对文献内容揭示的深浅程度,体现了检索工具的性质,这是检索工具最主要的划分方法。

目录是以出版物(如一本图书、一种期刊等)为报道对象,揭示出版物外部特征的检索工具。所以目录对文献的描述比较浅显,一般只描述文献的外部特征,有时也通过简单的内容提要介绍文献的内容,但它不涉及文献中的具体章节或具体文献。目录主要用于报道、登记出版物的出版发行情况,揭示其收藏情况,供人们选购、查阅和获取文献时使用。目录的著录项目通常包括出版物名称、责任者(著者、编者或译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格等)。

目录型检索工具主要有图书馆馆藏目录、联合目录、出版社目录、国家书目等。

题录是以单篇文献作为报道单位,揭示文献外部特征的检索工具。由于它是以单篇文献为单位来报道和存储文献的,所以对文献的揭示程度比目录要具体、深入。

但题录与文摘相比,对文献内容的揭示又相对较浅,不过,它也因此具有加工容易、可以缩短报道的时差、文体简短、可以增加检索刊物的容量的优点。题录的著录项目一般包括题录号、文献题目、作者及其工作单位、出处、原文文种、主题词、文中所附图表数及参考文献数等。

文摘(abstract)是指对一份文献或一个文献单元的内容所做的简略、准确的描述,通常不包含对原文的补充、解释和评论。文摘的报道对象与题录相同,但它对文献内容的揭示程度较题录更深入具体,它不仅描述文献的外部特征,还进一步描述文献的主题内容。对内容的介绍主要由其中的“文摘”部分完成。文摘是最常用的文献检索工具。

原文出处。指刊载原文的地方。

(材料题)文摘的主要著录项目为:

(1)文摘号、入藏号(abstract number ,reference number , accession number )。它是在文献处理完以后,为每条文摘编的号码,起排序并帮助读者识别特写文摘的作用。它可以是简单的顺序号,也可以是含有某种情报内容的代码符号。

(2)文献名称(document title)。即文献的题目(篇名),它是读者识别特定文献的重要标志之一。文献名称一般是逐字照录,有时也可以删去某些引导性的词,或对含义不清及不完整的名称加以改写、补充。外文文献一般要同时著录译名和原名。有些英文检索工具对非拉丁文字的文献一般不著录原名,而著录原名的音译名。

(3)著者(author)及其工作单位(affiliation)。是读者迅速鉴别文献的依据之一,著录著者姓名可以用全称,也可以用简称。许多国家的人名表述是名在前,姓在后,一般姓用全称,名可以缩写。但大多数检索工具都采用姓在前、名在后的形式。英文检索工具对非拉丁文姓名用音译法著录。

4)合同号(contract number)或拨款号(grant number)。如果该文献是在某项合同或拨款的支持下进行的,一般都要标明该项合同的编号或拨款文件的编号。科技报告都有这一项目。

(5)原文出处。指刊载原文的地方。原文如果是某种期刊中的论文,出处包括该刊的刊名、出版地、卷期号、出版日期和起讫页码;如果是图书或其中的一部分,出处就是书名、编著者、出版地、出版者、出版时间和起讫页码。科技报告的出处就是入藏号、订购号或原来的报告号。专利说明书的出处就是专利申请书或专利说明书的编号。原文出处的著录是读者顺利找到原文的重要线索。

(6)原文文别和译文来源。原文文别一般用某种语言的简称标明,放在文献出处之后,有的放在文献的译名之后。若所摘录的文献是一篇译文,应给出译文的来源(被译文献的出处),如“译自X刊X卷X期X页”。此项的用处是免得使读者去找他所不能阅读的东西。

(7)主题词或索引词。指用来描述该文献的主题内容的若干个词或词组。该项的用途很多,既可以帮助读者了解原文主题,也可以用以查找其他相关文献,或供计算机识别和进行逻辑组配检索。

(8)文摘正文。对文献内容所做的简略描述。可以有报道性文摘和指示性文摘之分。前者需概述原文的内容要点,特别是创新点,向读者提供原文中的定量信息(如距离、最大值、最小值、公式等)和定性信息(如发现、结果、新方法、新设备、结论等)。它是原文内容的浓缩,基本上能反映原文的技术内容、信息量大,字数也较多。后者则是为了把原文的主

题范围、目的和方法概略地指示给读者的一种文摘,一般不包含具体的数据、方法、设备、结论等内容。它指示读者将在原文中发现什么,帮助读者判断原文是否与自己的需要相关以及是否需要阅读原文,字数也相对较少。

例:《计算机应用文摘》

9609321 ①复杂的混合信号集成电路的参量成品率预测②[刊,英]③/Oleary,M. …④//Int.J.Electron. —1995,78(2)⑤. —267-394⑥

借助图象处理技术能从硅片图象提取……⑦

①文摘号②文献篇名③文献类型、文种④著者姓名⑤文献出处:刊名缩写、年卷期⑥起讫页码⑦文献摘要

索引通常不提供文献内容本身,只指明文献的物理位置,是一种检索文献的系统指南,使读者能准确地找出文献或文献集合体中的特定信息。

最常用的索引有著者索引、主题索引、分类索引、题名索引。

被抽选出来的关键词都可以作为标引词在索引中进行轮排,作为检索词进行检索

主题索引可分为四种:

1、标题索引

2、关键词索引

3、单元词索引

4、叙词索引

1、布尔逻辑组配检索技术(问答)

布尔逻辑组配检索是现行计算机检索的基本技术,它利用布尔逻辑运算符表示两个检索词之间的逻辑关系,将检索提问转换成逻辑表达式。常用的运算符有:

①逻辑“与”—AND

②逻辑“或”—OR

③逻辑“非”—NOT

练习:

头孢菌素钠Ⅴ或磺胺甲恶唑治疗呼吸道感染的引起的副作用研究

检索式:(头孢菌素钠ⅤOR 磺胺甲恶唑) AND 呼吸道感染AND 副作用

美国DIALOG系统是目前世界上最强大的国际联机检索系统,也是目前运作最成功的联机商业数据库系统之一,

截断方式也有后截、中截、前截等

截词检索具有隐含的OR运算特性

(2) (N)算符和(nN)算符

(N)是Near的缩写,它表示:在算符两侧的检索词必须紧密相连,所连接的词间不允许插入任何其他单词或字母,但词序可以颠倒。

(nN)表示允许在连接的两个词之间夹插入至少n个单词,且这两个检索词的词序任意。例如:Railway(2N)Bridge,可以表示

Railway Bridge,

Bridge of Railway,

Bridge of the Railway

(3)(S)算符

在某些情况下,特别是对查全率有较高要求时,可放松词位置检索要求,改用同句检索。所谓同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。同句检索的位置算符是(S)。S是sentence的缩写。

例如:electronic(S)optical ,可以检索出题名为Cutting and polishing optical and electronic materials的文献。

计算机信息检索的一般步骤为:

1、根据检索课题,选择适用的数据库;

2、确定检索词;

3、编制检索式;

4、显示及判断检索结果;

5、修改检索策略。

6、索取原文

控制词汇来源于特定的受控检索语言,因此在选词时必须使用相应的词表。受控语言主要有规范化的主题语言和分类语言

非控制词汇是极为灵活有效的检索词。对于自由文本检索和全文检索而言,关键词更是最重要的检索词。

用以进行检索效果评价的参数主要有:查全率(recall factor)、查准率(也称适中率,precision factor)、漏检率(omission factor)、误检率(也叫检索噪音,noise factor)以及新颖率、检索速度等。

(1)查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:

查全率=(检出相关文献量/系统中相关文献总量)*100%

2)查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:

查准率=(检出相关文献量/检出文献总量)*100%

查全率和查准率是评价信息检索系统检索效果的主要指标,理想状态是检索系统中的全部相关文献都被检出,并且检出的文献全部是相关文献。然而,由于受许多因素的影响,在实际检索中,查全率和查准率是不可能达到100%,而是存在着一种互逆关系,即在同一检索系统中提高查全率,查准率就会降低;反之,提高查准率,查全率则会下降。

信息检索与利用复习重点

一、工具书概念:根据一定的查阅需要,系统汇集有关的知识资料,以特定的编排方式和检索方法,为人们迅速提供知识信息或资料线索,专供查阅的图书(文献)。工具书的特点:①信息密集②资料性强③查考为主④方便检索工具书类型:1 检索工具书又称线索性工具书,主要提供查找文献的线索:书目、索引、文摘。2 参考工具书主要向读者提供可资参考的知识内容,如数据、史实、结论、定义、人物简介等数据和事实信息:字典、词典、百科全书、年鉴、手册、名录、数表统计资料、表谱、图录等类型。3 边缘工具书——形式上不是工具书但具有查考检索作用的图书。丛书、总集、汇编、综述、史志、学科史及要籍等。工具书的结构:①序、跋②凡例③目录④正文⑤辅助索引⑥附录、参考文献工具书的鉴别与选择原则:1)看其主流,考察内容材料,看内容是否完备、材料新颖可靠,解释引证准确2)客观、正确,有无立场、观点问题3)了解编制体例,编排方式、检索方法、印刷规则、文体。4)同一种工具书的不同版本。鉴别与选择的方法1)查考编辑者与出版者2)编纂和出版的年代、审察版本3)查考序跋、凡例和目次4)辨别正文——选条试查、定条比较 5)参阅书评二、机器检索及光盘、联机与网

络检索计算机检索:人们在计算机或计算机检索网络终端机上,使用特定检索指令、检索词和检索策略,从计算机检索系统数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。信息检索工具:指用以报道、存储和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献,如书目数据库、搜索引擎、索引、文摘。检索工具的分类:1)(文献检索工具)提供线索的指示型检索工具(二次文献):书目、馆藏目录;索引;文摘;工具书指南2)(事实与数据检索工具)提供具体信息的参考工具(三次文献):1词典2类书、政书、百科全书3、年鉴4传记资料5表谱、图录6、政府文献7名录、手册8数表、统计集9丛集汇要10地理资料信息检索途径:1)外部特征途径:题名途径,著者途径,序号途径2)文献内容特征途径:分类途径,主题途径,关键词途径,分类主题途径,其他途径。信息检索步骤:1)分析检索课题,明确检索要求(2)制定检索策略:确定检索工具、方法、途径、用词及逻辑关系、位置关系(3)实验性查找,调整检索策略,正式查找;(4)辅助性查找(最新期刊、年鉴);(5)整理答案或索取原文。信息检索步骤:1)分析检索课题,明确检索要求2)制定检索策略:

信息检索复习资料

文献的定义 最简明的定义:记录有知识的一切载体。 定义:记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。 二次文献 将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。 特种文献 会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。 文献检索式 或:A or B 或 A + B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。 与:A and B 或 A * B; 用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。 非:A not B 或 A – B;表示检索记录中凡含有A不含B的记

录被检出。能够缩小命中文献的范围,增强检索的准确性。 网上的文献格式 期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。 文献信息源 用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。 CA美国化学文摘数据库收录文献 期刊论文、会议论文、图书、学位论文、专利、技术报告。 什么数据库能检索会议文献 国外:ISI会议录数据库、会议论文索引数据库、OCLC PapersFirst 与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。 国内:中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。

信息检索复习资料

信息检索复习要点 第一章 一、情报和文献 1.情报(P4 1.2.3) 情报就是为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。 知识性、传递性、针对性是情报的3个基本属性。 2.文献(P5 1.2.5) 记录有知识的一切载体叫文献。 知识内容、信息符号、载体材料、记录方式是文献的4个基本要素。 二、文献按载体划分(P5~6 1.3.1) 1.印刷型 2.微缩型 3.视听型 4.电子型 三、文献级次划分(P6 1.3.2) 1.零次文献:非正式出版物或非正式渠道交流的最原始的文献。如手稿、演讲、听取经验交流,甚至包括口头言论。 2.一次文献:依据作者本人的研究或成果制作成果创作的文献,即通常所说的“原始文献”、“第一手资料”。如图书、期刊论文、科技报告、学位论文、专利说明书等。 (原创性) 3.二次文献:按一定的方法对一次文献进行加工,使之有序化而形成文献。如目录、索引、文摘等。(有序性) 4.三次文献:一般是围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩等深度加工而形成的文献。 如各种评述、进展报告、教科书、词典、年检、百科全书等。(综合性) 四、ISBN和ISSN(P7~9 1.3.3) 1.ISBN(国际标准书号)

(1)它是由国际标准化组织1972年公布的一项国际通用的出版物统一编码。它是由10位数字组成,共分4段【组号、出版社号、书序号、校验码(1位数,ISBN最后一位数值)】。 (2)校验方式:将ISBN 1~9位数字顺序乘以10、9、8、7、6、5、4、3、2这9个数字,将这些乘机之和再加上校验码,如果能被11整除,则这个ISBN号是正确的。2.ISSN(国际标准连续出版物编号) (1)实现对全世界文献的管理。由8位数字组成分2段,每段4位数字。中间用“-”隔开前7位是刊名代号,最后一位是计算机检验位。 (2)检验方式:将ISSN 1~7位数字顺序乘以8、7、6、5、4、3、2这7个数字,将这些乘机之和再加上检验号,假如能被11整除,则这个ISSN号是正确的。 第二章 一、信息检索(P12) 从广义的角度讲,文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需的文献过程,亦叫信息检索。而人们一般所指的文献检索,是指狭义的文献检索,即最后一个过程——信息检索,文献的查找过程。 二、信息检索的类型(P13 2.1.2) 1.按照检索的对象的不同,人们将信息检索分为文献检索、数据检索和事实检索。2.按照检索的方式的不同,人们还常将它分为手工检索和计算机检索。 三、图书的四大常用检索点(P20 2.3.1) 1.书名 2.作者 3.主题词 4.分类号 四、检索语言的基本种类(P19 2.3) 检索语言是文献检索中用了描述文献特征和表达信息提问内容的一种专门化的人工语言,是信息组织和文献检索共同使用的语言。 检索语言大致分为分类语言(P19)和主题语言(P24)两种。 (1)最早的图书分类法(P20 2.3.1 2) 我国西汉刘向、刘歆父子所著的《七略》。它首创的“七分法”对后世我国的分类思想的形成和发展影响极大。 (2)四库全书(P21 小资料) 纂修与清乾隆年间的《四库全书》,从收集编纂到成本,共用10年(1173-1782),集我国古代文献典籍之大成。共著录图书3461种,79309卷,36000余册。《四库》将各种书籍分为经部、史部、子部、集部。各部下分若干类,类下细分为属。 (3)全球使用最广的分类法(P21 2.3.1 3) 《杜威十进分类法》(DDC)是当今世界上影响最大、用户最多的图书馆分类法。

信息检索复习重点1

信息检索 第二章信息用户 一、用户信息需求的概念 1、概念:是指人们在实践活动过程为解决遇到的各种问题而产生的信息不足感与求足感 2、主要特点:广泛性、社会性、发展性、多样性、主观性、客观性 二、用户信息需求的基本类型 1、按信息的属性分 自然信息需求:对客观存在的自然物信息的不足感与求足感,强调物质属性 社会信息需求:生活中的信息需求、职业活动中的信息需求、个体社会化的信息需求 2、按信息需求的目标分 主题需求:战略性信息需求、战术性信息需求、工作性(经营性)信息需求 已知资料需求:信息查对需求 3、按信息需求的表现形态分(沃格特) 新信息需要:需要能及时获得、迅速传递的最新信息,强调及时性 片断性信息需求:某一理论、方法、事件等的片断信息,以解决具体问题,强调准确性 完整性信息需求:对特定相关信息的系统把握,强调全面性 三、用户信息需求状态(Mizzaro) 1、客观信息需求(Real Information Need,RIN):用户解决某特定问题所需要的信息 2、意识到的信息需求(Perceived Information Need,PIN):户在问题及外界刺激下所感知到的信息需求 3、表达出来的信息需求(Request):用户在一定条件下对意识到的信息用自然语言表达出来的信息需求 4、信息提问(query):用户用所选择信息检索系统的检索语言相对应的语法形式描述的信息需求 四、用户需求提问 1.需求提问的类型划分 1)、从提问的规定性上分类 明确性提问:问题初始条件与目标状态清楚 不确定性提问:问题初始条件或目标状态不清楚 2)、从功能上分类 认知性提问:咨询提问和评价提问 非认知性提问 2.需求提问的结构分析 主题分析:描述用户信息需求的内容范畴。包括主题概念、学科范围

信息检索复习资料

第一部分:基本常识 1.文献按照出版形式可分为哪几种类型?举例。 图书、期刊、报纸、特种文献。 图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等 期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。 报纸:人民日报 特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案 美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA 报告4、能源部的DOE报告。 2现代科技文献具有的特点哪些? 答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降 3什么是核心文献、相关文献和边缘文献? 答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。 4 什么是文献?构成文献的有哪四个要素? 答:文献的定义是记录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。 5 电子文献的主要类型和文件格式是什么? 答: (1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分; (2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的gif文件、jpg文件以及标记文件格式的html文件和xml文件之分; (3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分; (4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分; (5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类; (6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。 6 如何针对不同时间要求的文献信息,选用不同的文献信息源? 答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。 7什么是ISSN和ISBN?

文献检索期末复习完整版

第一章绪论 1.文献检索(information retrieval)是指收集整理文献并按一定方式组织和存储,同时根据用户的信息需求查找出相关信息的过程,又称为“文献存储与检索”。狭义的文献检索是指根据用户信息需求,利用检索工具或检索系统从文献信息集合里找出用户所需文献的过程。 2. 文献检索语言是根据文献检索需要而人工规范的语言系统,用来描述文献特征和表达信息检索提问的一种专用语言,供信息标引以及文献检索时使用。 3.文献指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存贮和传播信息情报和知识作用的一切载体。 三个基本要素:内容上的知识或信息;揭示和表达知识信息的标识符号;记录信息符号的物质载体。 4. 信息素养 又称为信息素质,是伴随着社会信息化的形成和发展而出现的一个名词术语,指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。 第二章医学文献信息资源 1.按文献内容的加工深度和内容性质划分 一次文献、二次文献、三次文献、零次文献 (1)零次文献零次文献指未经正式发表或未进入正式交流的最原始的文献。(2)一次文献是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。

(3)二次文献是将大量无序分散的一次文献收集、整理、加工、著录其特征(如著者、篇名、分类、主题、出处等),并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有检索功能而称为检索工具或检索系统。 (4)三次文献是科技人员围绕某一专题,借助二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。 表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献、百科全书、年鉴、手册等参考工具书。 2. 其中《中图法》具有比较突出的优点,已为大多数图书馆所取用。 3. 图书馆目录目录是著录一批相关文献,并按照一定次序排列而成的一种揭 示与报道文献的工具。 4. 查找馆藏图书的方法一般有两种,一种是直接进开架书库或阅览室到书架上 查找,另一种方法是先利用馆藏目录查到要找图书的索书号,再根据索书号到书库中索取。 5. 参考工具书类型 参考工具书:是根据一定需要以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识或资料线索,专供查阅的特定类型的图书。 ?特点具有知识性、资料性、检索性。 ?按编辑体例与功用分:字典、词典、年鉴、手册、类书、政书、百科全书、表谱、图录、名录等。 ?按内容分有综合性的、专科性的; 6.馆际互借

信息检索资料题目整理版

选择题:(10*2'=20') 1、用__A__检索2004年中国经济领域的统计数据、政策、会议、新理论。 A 《中国经济年鉴》 B 《中国统计年鉴》 C 《中国大百科全书》经济卷 D 《经济管理大辞典》 2、用__C__检索金融统计数据、中国宏观经济月度分析报告、食品行业报告《2003年奶业形势分析》 A 《中国人民大学报刊全文数据库》 B 维普《中文科技期刊数据库》 C 国研网 D CNKI或者万方数据库的会议论文数据库 3、检索2004年经济方面的信息资料应该用2005年出版的年鉴. 4、已知参考文献:徐经长等,国际会计学,北京:中国人民大学出版社,1999。要找原文,使用_ D_检索《国际会计学》的收藏情况。 A、维普《中文科技期刊数据库》 B、中国人民大学报刊全文数据库 C、国务院发展研究中心信息网 D、图书馆的馆藏查询 5、用__C_检索世界范围的专利摘要比较方便 A、美国专利商标局数据库 B、日本专利局数据库 C、欧洲专利局esp@cenet数据库 D、世界知识产权组织//ipdl.wipo.int/PCT电子公报 6、用_A_检索α—呋喃甲醇羧酸酯的合成,含有碳元素和氢元素的化合物的英文综合学术性文献。 A、外文EBSCO数据库 B、外文农业类CAB文献数据库 C、外文农业类AGRICOIA数据库 D、外文食品科技文摘数据库FSTA 7、综合性检索工具 维普《中文科技期刊数据库》、CNKI的《中国期刊全文数据库》、万方《中国数字化期刊群》8、专利信息检索工具 使用最广收费专利数据库:thomson scientific公司derwent系列专利数据库 免费专利数据库:欧洲专利局、美国专利商标局、IBM专利数据库 9、综合性检索工具 欧洲专利局、《DELPHION知识产权信息网数据库》、thomson scientific公司derwent系列专利数据库 10、单一检索工具包括专利公报、专利索引、各国专利局的专利数据库 中国国家知识产权局、美国专利商标局网站专利数据库 11、商标检索工具:中国知识产权网、中国商标网(提供商标近似查询、商标综合查询、商标状态查询)、美国专利商标局(提供商标电子查询系统)、国际商标协会 判断题:(10*2'=20')

信息检索复习整理课件

一、什么是信息(Information)? 在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。在我国台湾、香港地区,该词被译为“资讯”。 信息是被反映物的属性再现,信息的属性在于表现它物。也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。一切事物包括自然界和人类社会都会产生信息。一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。 2、信息具有以下特征: 1)普遍性 (2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。 (3)传递性 (4)可转换性:信息是可以由一种形态转换成另一种形态。信息一般有4种形态:数据、文本、声音、图像。这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。 (5)可再生性 (6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。(8)可存储性:信息是可以通过各种方法存储的。 二、信息检索 广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。 狭义:仅仅指信息查找的过程。即取的环节。 三、信息检索的发展 1、第一阶段:完全手工检索阶段 2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段 3、第三阶段:计算机检索系统的发展阶段 4、第四阶段:基于Internet 的网络化检索系统阶段 信息资源的分类: 1、信息源可分为自然信息源和社会信息源。 2、按信息资源所依附的载体划分(不用全背) (1)体裁信息资源:以人体为载体并能为他人识别的信息资源。按其表述方式又可分为口语信息源和体语信息源。口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。 (2)实物信息资源:以实物为载体的信息资源。又分为自然实物信息源与人工实物信息源。如:化石、产品、样品等。 (3)文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。 (4)网络信息资源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储

《信息检索》总复习题库及答案

2011-2012经济学院《文献检索与利用》总复习题库 备注:红色为不确定答案,紫色是为了个人强化记忆。 单选题题库 1.下列属于布尔逻辑算符的是(D )。 A、与 B、或 C、非 D、以上都是 2、信息素养的核心是(C ). A、信息意识; B、信息知识; C、信息能力; D、信息道德 3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展. A、终身学习; B、学习型社会; C、创新发展; D、信息素质 4.参考文献的标准著录格式是( A )。 A、著者篇名来源出处; B、篇名著者来源出处 5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14, 1000-758X 属于哪种文献类型( C )。 A、图书; B、科技报告; C、期刊; D、报纸 6.常用的检索系统有( D )。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。A.逻辑与()B.逻辑或() C.逻辑非()D.逻辑与和逻辑非 8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。”A.情报 B.信息. C.知识 D.数据 9、( D )是指通过文献信息资料的主题内容进行检索的途径。 A.题名检索途径 B.作者检索途径 C.分类检索途径 D.主题检索途径 10、搜索含有“”的文件,正确的检索式为:( A )

A." " B. 11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。A.内容公开次数 B.载体类型. C.出版类型 D.公开程度 12、按照出版时间的先后,应将各个级别的文献排列成( C ) A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献 D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。 A.追溯法 B.直接法. C.抽查法 D.综合法 14、《中国学术期刊全文数据库》给出的检索结果为( D )。 A.仅题录 B.仅文摘. C.仅全文 D.题录、文摘和全文三种 15、以作者本人取得的成果为依据而创作的论文、报告等,并经公开发表或出版的各种文献,称为( B ) A.零次文献 B.一次文献. C.二次文献 D.三次文献 16、学术论文写作的六个步骤的正确顺序是( C ): ①搜集资料②研究资料③执笔撰写④选择课题⑤明确论点⑥修改 定稿 A.①⑤④③②⑥ B.⑤③④②①⑥C.④①②⑤③⑥D.②④ ③①⑤⑥ 17、毕业论文答辩的一般程序是( B D ) ①学生答辩②学生作说明性汇报③毕业答辩小组提问④评定成绩 A.③④②①B.②③①④C.③②①④D.②③①④ 18、下列文献中属于哪类属于一次文献( C )? A.文摘 B.索引C.科技报告D.题录 19、如果检索结果过少,查全率很低,需要调整检索范围,此时调整检索策

信息检索复习题

信息检索复习题 第一部分各章思考题 第一章思考题 1.信息、知识、文献的概念及相互关系是什么? 2.信息环境问题主要体现在哪些方面? 3.信息素质的内涵包括哪些内容? 4.按文献的载体形式、出版形式可分别将文献分为哪几种类型? 5.按文献的加工程度可将文献分为哪几种类型?它们之间的关系是什么? 第二章思考题 1.文献的外部特征和内容特征分别有哪些? 2.检索方法及各自的优缺点有哪些? 3.常用的检索技术有哪些? 4.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。 5.请为检索课题“航空或航天发动机的设计和制造”编制检索式。 6.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查该课题时输出文献60篇。经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率。 第三章思考题 1. 你是如何认识数字图书馆时代的馆藏资源的? 2. 请做排序:TP3/2;I247.5/123;I247.5/55;TP316/4;O13/5;TM925/44;G252.7/178;TP39/3。 3. 谈谈你对数字图书馆的认识。 4. 请检索你在图书馆近一年的借阅历史。 5. 请检索丁元霖主编的《商品流通企业会计》在中国国家图书馆是否有收藏,收藏在哪些书库? 第四章思考题 1.试比较分析中国知网(CNKI)、万方数据知识服务平台、维普资讯网中“中文期刊数据库”的异同点。 2.查找你所在单位人员撰写的你所学学科专业的硕士论文或博士论文3篇。 3.用检索实例说明中国知网(CNKI)标准检索、高级检索、专业检索、引文检索、学者检索的检索方法。 4.查找洗衣机方面的中国专利2项。简述检索方法和步骤。 5.查找参考文献写作规范的国家标准。 第五章思考题 1.结合你所学专业列出你所熟悉的外文电子图书数据库,并简述其检索方法。 2.简述你所学专业的常用外文电子期刊数据库有哪几种,并以其中一个数据库说明其检索方法。3.简述ProQuest学位论文数据库检索方法。 4.你常用的外文专利数据库有哪些?并简述其检索方法。 5.如何查找国外标准文献,请查找一条和你专业相关的国外标准。

信息检索与利用复习资料(整理2016.1)

信息检索与利用复习资料 (一)、名词解释 1、INTERNET(因特网):Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 2、SCI: SCI是科学引文索引的英文缩写首字母。SCI是一个引文数据库,收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊。 3、报刊:报刊是指报纸和期刊的总称,是属于连续出版物,它具有统一的题名,定期或不定期以连续分册形式出版,有卷期或年月标识,并且计划无限期连续出版。报纸以刊载新闻和评论为主,期则围绕某一学科和某些学科或某一研究对象,由多篇文献资料编辑而成。 4、标准文献。广义的标准文献包括标准的原始文件及检索工具书等。狭义的标准文献仅指带有标准号的标准、规范、规程等技术标准。 5、超文本:超文本是在普通文本的基础上增加了链接功能的一种文本。用户只要用鼠标点击页面上有特殊颜色或有下划线的文字时,就会出现新的解释或访问更多的信息。 6、分类途径:是指按文献内容的学科分类体系查找文献信息的途径。一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样的编排的结果可将同一学科的文献集中,便于按学科查找文献。 7、技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 8、检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 9、竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 10、科学文献:文献:凡是人类的知识用文字、图形、代码、符号、声频、视频等方式和技术手段记载在一定载体上的每一件记录,统称为文献。而把记录科学知识的每一份物质载体称为科学文献, 11、目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 12、全文搜索引擎。全文搜索引擎是使用自动索引软件来搜集和标引网页资源、建立数据库,以Web形式提供查找网络资源的一种网络信息检索工具。 13、索引:索引是将一种或一批相关书刊内容中的篇目、字句、人名、地名、事件、分子式等摘出,按一定的方法编排,并指明其在原书中的位置,为读者提供查找线索的工具书。索引是记录期刊、报纸、文集、论丛、会议录等文献所包含的论文题目、撰述者,将其摘录出来,并注明其出处,按照一定的原则编制而成,形成查寻文献篇名的检索工具。 14、图书馆目录:图书馆目录是提示、识别和检索馆藏文献信息的工具,也是宣传图书、辅导阅读的工具,是读者迅速、准确、有效地检索所需文献资料的向导,被喻为“打开人类知识宝库的钥匙”。 15、网络信息资源。以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 信息检索。是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。 16、网络信息资源:以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 17、网站:网站是某些单位或个人为了一定目的、为用户提供某些方面的服务,在Internet设置的站点,这些服务主要有Web服务、Ftp服务和Email服务等。 18、文献检索:以文献或其索引、文摘为检索对象,目的是核实已知文献的不确切项目,如著者名,年代、出处等,或查检某课题原始文献的线索及它们的具体收藏情况。 19、文献信息资源:文献是记录有知识的一切载体。文献信息资源是以文字、图形、符号、声频、视频等方

信息检索复习资料

信息检索公选课复习资料 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.按信息的加工层次分类:(含义) 一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等 二次文献:目录、题录、索引、文摘 三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。 二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。 三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。 二次信息资源与三次信息资源的区别: 对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容 用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案. 10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

相关文档