文档库 最新最全的文档下载
当前位置:文档库 › 川大信息检索及利用复习资料整理

川大信息检索及利用复习资料整理

川大信息检索及利用复习资料整理
川大信息检索及利用复习资料整理

四川大学信息检索与利用文史类

一、图书馆服务与资源介绍

1、四川大学图书馆,由文理、工学、医学、江安四个分馆组成。

川大图书馆主页的数据库:超星、CNKI、维普、万方、SCI、SpringerLinker

2、索取号:

索取号是某种图书或期刊在图书馆中位置的代号,是图书馆进行藏书组织、排架、流通和清点的主要依据之一,同时也是读者查找文献资源的依据。绝大多数的图书馆使用分类排架号作为索取号。

一般根据文献类型的不同,称图书的索取号为索书号、期刊的索取号为索刊号。

(1)索书号:

我馆索书号标签粘贴在书脊距底部约一寸的位置。

本馆索书号由以下两个部分构成:中图法分类号;同类区分号。

(2)索刊号

过刊索刊号粘贴或烫印在书脊距底部约5cm的位置,

现刊索刊号粘贴或手写在期刊封面下部。

3、《中图法》分类(5个基本部类,22个基本大类)

A 马克思主义、列宁主义、毛泽东思想、邓小平理论

B 哲学、宗教

C 社会科学总论;F 经济

N 自然科学总论;T 工业技术(TB 一般工业技术)

Z 综合性图书

4、与望江、华西分馆的借还书

(1)读者在就近分馆凭有效借阅证提交借书申请单;

(2)四个工作日内读者申请的图书由图书所属分馆传递到提交借书申请单的分馆,读者到提交借书申请单的分馆凭借书申请单和有效借阅证办理借阅手续;

(3)读者申请的图书在该分馆保留两个工作日,两个工作日后读者未来取书,该书被送回图书所属分馆。

1.3 信息检索的概念和作用

1、信息检索的概念

信息检索通常是指从以一定方式组成的信息集合中,查找特定用户所需信息的方法与过程。广义的信息检索包括信息的存储与检索。

2、信息检索的基本原理

(1)信息检索是文献交流的重要环节;

(2)文献存储的可逆性是信息检索的基础

3、信息检索的类型

文献检索数据检索事实检索

1.4 信息检索语言

信息检索语言的概念

是人们在加工、储存及检索信息时所使用的标识符号。

信息检索语言的分类

自然语言受控语言

几种常用的分类语言

中图法(中国图书馆分类法);杜威十进分类法DDC

1.6 信息检索工具和检索系统

计算机信息检索的类型:

参考数据库;源数据库/联机检索系统(如DIALOG);光盘数据库系统;网络信息检索系统

1.7 信息检索效果及评价

查全率查准率漏检率误检率其他

第2章信息检索技术及其应用

1、布尔算符:用来规定检索概念或检索词之间相互逻辑关系的算符。

逻辑“与”:AND(或*);逻辑“或”:OR(或+);逻辑“非”:NOT(或–)

2 位置算符/词位算符:用于限定词与词之间的位置关系,以提高查准率。

当检索词为词组形式时,或两个检索词之间可能被其他词或标点符号隔开时,均应使用位置算符。

(1)W - With

①W是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。

例:intelligent (W) robot?

②Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。

例:intelligent w1 robot*

(2)N - Near

①N是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。

例:intelligent NEAR robot*

②Nn (或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。

例:intelligent N1 robot*

3、截词检索:

截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这

个截词所有字符(串)的记录,系统都为命中。

截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。

①按截词位置分:前截断、后截断、中截断;

②按截词的字符数量分:非限制截断、限制截断。

注:表示截词的截断符号,各检索系统有不同的规定,没有统一标准。

(1)后截断

后截断是在检索词词干后面加截词符,表示不限制或限制词尾可变化的字符数,即查找词干相同的所有词。从检索性质上讲,后截断是前方一致检索。

①非限制截断:是在检索词词干后面加一个截词符,表示不限制词尾可变化的字符位数,即查找词干相同的所有词。即允许其后可带有任何字符且数量不限。

例:comput? 相当于查找compute、computing、computerized、computationally……

注:不宜将词截得过短,否则容易造成误检。

②限制截断:是在检索词词干后面加若干个截词符,表示限制可变化的字符数。

例:fib?? 相当于查找fiber 或fibre ……

(2)中截断(通配符或屏蔽)

是把截断符号置于一个检索词的中间,对词中间出现变化的字符数加以限定。一般中截断仅允许有限截断。

例:organi#ation, 可检索到包含organization和organisation的记录。

①一个?,代表零个或任意个字符。

例:colo?r 可检索到包含color、colour、colonizer、colorimeter的记录。

②一个? 和数字,其中的数字代表可替换的字符数。

例:colo?1r, 只能检索到包含colour的记录。

4、字段检索:指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。

西文数据库,字段检索常用代码来表示,如:作者AU,机构名称CS,文摘AB,题名TI,关键词KW。

四、学位论文数据库

1、学位论文是本科生和研究生从事学习和科学研究活动的学术论文。

(1)与一般论文的写作比较,质量要求更高,结构更为严谨。

(2)与期刊论文的检索比较,有以下特殊的检索字段(入口):导师、第一导师、导师单位、论文级别、学科专业名称、学位授予单位等。

2、学位论文信息检索

(1)CNKI学位论文全文数据库

(2)中国博士学位论文全文数据库

(3)中国优秀硕士学位论文全文数据库

(4)万方学位论文全文数据库

(5)四川大学学位论文数据库

(6)CALIS高校学位论文文摘库

(7)PQDD(学位论文数据库)

ProQuest公司是世界上最早及最大的博硕士论文收藏和供应商

第9章信息资源的利用与论文写作

9.4 学术论文写作

1、学术论文的特点:

求实性科学性创新性理论性

2、学术论文的基本格式与写作要求

①规则:GB7713-87(国标《科学技术报告、学位论文和学术论文的编写格式);GB7714-87(国标《文后参考文献著录规则》)

②基本格式:题名;作者姓名和单位;摘要;关键词;引言;正文;结论;致谢(学位论文必备);英文题名、摘要及关键词;参考文献。

3、学术论文三要素:论点、论据和论证。

英文电子图书

§KingBook(金图国际外文数字图书馆)远程镜像

§KingBook(金图国际外文数字图书馆)

§MyiLibrary电子书数据库

§Encyclop?dia Britannica(大英百科全书、不列颠百科全书)

§Springer Ebooks

MyiLibrary电子书数据库

§学科覆盖范围:工程技术、自然科学、生命科学、医药、社会科学、法律、教育、心理、哲学、政治学、文学、语言、音乐等。

§

Encyclop?dia Britannica

§Encyclopaedia Britannica 包括印刷版《不列颠百科全书》的73 000余条条目,提供有关各种主题完整而准确的信息,包括短条目和长及书籍的长条目。

§Britannica Concise Encyclopaedia 《不列颠百科全书》简明版,包括28 000个短条目,可以迅速解答有关历史、艺术、科学等主题的问题。

§The Web‘s Best Sites 大英精选网站。超过166,000 专家编辑群精选推荐网站。

§The Web's Best Sites 大英精选网站.

§Merriam-Webster Dictionary & Thesaurus 韦氏词典及英语同义词字典

§Journals and Magazines EB Online还包括对EBSCO和ProQuest这两个数据库的部分期刊和杂志的检索.

§The New York Times, BBC News 焦点新闻.

§Spotlight Archive 大英主题数据库

§World Atlas 世界地图

§World Data Analyst 全球资料分析

§Gateway to the Classics 经典文献

§Notable Quotations 名人格言

§Britannica Blog 大英知识博客

§Advocacy for Animals 动物保护站

SpringerLink系统可访问2010-2012版权年Springer 出版的近10500种英文电子书,学科涉及化学与材料、数学与统计学、资源环境与地球科学、计算机科学、生命科学、医学、物理学、经济学、商业与管理、心理学、人文社科、法律、教育学、哲学,其中包括Lecture Notes in Computer Science (计算机科学讲义)、Lecture Notes in Mathematics(数学讲义)、Lecture Notes in Physics(物理学讲义)和Lecture Notes in Earth Science(地球科学讲义)等著名丛书

英文数据库

§Web of science

§EBSCO

§Gale

§OCLC基础组的13个数据库

§Emerald管理学、工程学数据库

§ScienceDirect(Elsevier SDOL)

§SpringerLink

§Wiley-BlackWell e-journals

§JSTOR(Journal Storage)-CASHL电子资源

§PAO(Periodicals Archive Online)-CASHL电子资源

§ProQuest Research Library (PRL) ProQuest学术图书馆期刊数据

§SAGE Journals Online

§PQDD--ProQuest Digital Dissertations (CALIS镜像) 学位论文

Web of Science

Web of Science 由五个数据库组成,内容包含来自数以千计的学术期刊、书籍、丛书、报告、会议

及其他出版物的信息

§Science Citation Index Expanded(科学引文索引)(SCI-Expanded):是针对科学期刊文献的多学科索引。

§Social Sciences Citation Index(社会科学引文索引)(SSCI):是针对社会科学期刊文献的多学科索引。

§Arts & Humanities Citation Index(艺术及人文科学引文索引)(A&HCI):是艺术和人文期刊文献的多学科索引。

§Conference Proceedings Citation Index - Science (CPCI-S) :此数据库对应印刷版的《科技会议录索引》(Index to Scientific & Technical Proceedings,简称ISTP)。

§Conference Proceedings Citation Index - Social Sciences & Humanities (CPCI-SSH):此数据库对应印刷版的《社会与人文科学会议录索引》(Index to Social Science & Humanities Proceedings,简称ISSHP)。

11个字段的深入分析

§按照作者分析:了解某个研究的核心研究人员是谁;

§按照丛书名称分析:

§按照会议名称分析:了解论文发表在那些会议录上;

§按照国家/地区分析:了解核心研究国是哪里;

§按照文献类型分析: 了解该研究通常以什么途径发表;

§按基金资助机构分析:了解发表论文基金资助的情况;

§按照机构分析:了解有哪些机构在从事这项研究

§按照语种分析:了解该研究是以什么语种发表的;

§按照出版年分析:了解该研究的发展趋势;

§按照来源出版物分析:了解该研究通常发表在哪些期刊上;

§按照学科分类分析:了解该研究涉及了哪些研究领域

EBSCO是美国的一家私人公司

§名称来源于“Elton B. Stephens Company”

§创建于1943年,1963年开设图书馆服务办公室,1986年开始发展电子信息产品,1994年开始在Internet上提供在线服务。

§是全球最早推出全文在线数据库检索系统的公司之一

§可以提供100 多种全文数据库和二次文献数据库。所用检索系统为“EBSCOhost”。

Gale平台数据库

§Gale集团隶属于全球最大的信息传媒集团之一The Thomson Corporation(TTC),是国际著名出版机构和全球最大、最权威的参考书出版商,多年来在出版人文科学工具书以及机构名

录方面颇具权威性。图书馆购买了Gale 集团6个专题数据库,内容来自Gale 集团多年来出版的众多参考书系列,许多资料为Gale 集团独家拥有,是重要的事实性数据来源。数据每月更新一次。

OCLC基础组的12个数据库

JSTOR(Journal Storage)-CASHL电子资源

§该库是以政治学、经济学、哲学、历史等人文社会学科主题为中心,兼有一般科学性主题共十几个领域的代表性学术期刊的全文库,从创刊号到最近两三年前过刊都可用影像来阅览全文,有些过刊其回溯年代早至1665年,目前共计400多种期刊,具体内容包括:§ 1. Arts & Sciences I Collection人文社会主题一

§ 2. General Science Collection一般科学性主题

§ 3. Ecology & Botany Collection生态学与植物学主题:

§ 4. Arts & Sciences II Collection人文社会主题二

§5. Business Collection 商业主题:有关商业方面的期刊46种。

§ 6. Language & Literature Collection语言文学专题:共47种刊。

PQDD学位论文全文库是目前国内唯一提供国外高质量学位论文全文的数据库,主要收录了来自欧美国家2,000余所知名大学的优秀博硕士论文,目前中国集团可以共享的论文已经达到254345篇,涉及文、理、工、农、医等多个领域,是学术研究中十分重要的信息资源。

CALIS公共目录检索系统(https://www.wendangku.net/doc/eb5994927.html,

一、信息、知识、文献的概念

1. 信息( information ):

信息是指客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。从本质上说,信息是反映现实世界的运动。发展和变化状态及规律的信号与消息。

2. 知识:

知识是人类在改造客观世界实践中所得的认识和经验的总合,是信息的一部分,是一种特定的人类信息。

3. 文献(document):

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。

二、信息、知识和文献之间的相互关系

1.信息是事物的本来面貌,信息经过人脑加工形成知识。

2.只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。

3.知识信息被记录在载体上就形成文献。

文献必须包含知识内容,而知识内容只有记录在物质载体上才能构成文献。文献经过传递、传播、应用于理论与实际而产生新的信息。

一、文献信息资源的层次

从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。

1. 一次文献(primary document)

即原始文献。人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大。专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献属于一次文献。

2. 二次文献(secondary document)

是通过对大量分散、无序的一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征(题名、作者、文献物理特征)和内容特征序化,形成另一类新的文献形式——书目、索引、文摘,这就是二次文献。

二次文献的重要性在于它可以提供一次文献的线索。

3. 三次文献(tertiary document)

在利用二次文献的基础上,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式——专题报告、综述、进展以及手册、百科全书、年鉴等工具书,就是三次文献。

n从一次文献——> 二次文献——> 三次文献

n博——>略,分散——>集中, 无序——>有序

n一次文献:文献的基础,是文献检索的对象

n二次文献:是一次文献的简略和有序化,是文献检索的工具。

n三次文献:是集中分散的一次文献,按知识门类或专题进行综合加工的产物,是文献检索的重要来源。

二、文献信息资源的类型

1. 根据文献的载体形式划分印刷型缩微型机读型视听型

2. 根据文献的编辑出版形式划分

3. 按文献的结构等级(文献的加工程度)划分

1. 图书( book ) ISBN(International Standard Book Number)

定义:指内容比较成熟、资料比较系统、有完整定型的装祯形式的出版物。

格式:著者、书名[M]、版本(第1版不标注)、出版地、出版者、出版年、引文所在的起始或起止页码。

【例】Borko H, Bernier C L. Indexing concepts and methods[M]. New York:Academic Press,1978

2. 期刊( journal、periodical ) ISSN(International Standard Serial Number)

定义:是指那些定期或不定期出版、汇集了多为著者论文的连续出版物。通常有数字或年月顺序编号,并打算无限期地连续出版下去的出版物。期刊一般都有固定的刊名。

格式:著者、题(篇)名[J]、刊名、出版年、卷号(期号)、引文所在的起始或起止页码。

【例】Porter MF, Zhang J. An algorithm for suffix stripping [J]. Program. 1980, 14(3):130~137 3. 会议文献( conference、paper )

定义:会议文献是在各种学术、专题会议上发表的论文、报告稿、讲演稿等与会议有关的文献。会议文献多数以会议录的形式出现。是专业领域最新研究成果报道的一种主要方式。

格式:文献著者、题(篇)名[A]、论文集名[C]、出版地、出版者、出版年、引文所在起始或起止页码。【例】Neal J. The Digital Imperative:Building the Electronic Library of the Future[A]. '98 General Conference of International Federation of Library Associations and Institutes[C], Amsterdam, The Netherlands, 1998.

4. 学位论文( dissertation、thesis )

定义:高等学校或科研院所的本科生、研究生为获得学位资格(学士、硕士和博士)而撰写的学术性较强的研究论文。

格式:著者、题(篇)名[D]、保存地点、保存单位、年份、引文所在起始或起止页码。

【例】Cairns R B. Infrared spectroscopic studies on solid oxygen [D]. Berkeley:Univ. of California,1986

8. 政府出版物( government document )

政府出版物是各国政府部门及其所属机构发表、出版的文件,其内容广泛,概括可以分为行政性文献和科技文献两大类。

9. 产品资料、技术档案等(product literature、technical record)

各厂商为推销产品而印发的商业宣传品,包括产品样本、产品目录、产品说明书、厂商介绍、技术座谈资料等。

企业或科研机构在技术工作中形成的、有一定的工程对象的技术文件。如任务书、协议书、技术经济指标和审批文件、研究计划方案大纲和技术措施等。

各类型出版物特点比较

●内容新颖性:期刊、会议文献、图书

●信息报道速度:期刊、会议文献

●流通范围广度:期刊、图书、会议文献、政府出版物

●发行量:期刊、图书、会议文献

●易于获取程度:期刊、图书、学位论文、会议文献、政府出版物

文献出版类型的辩识

(1)图书: 有出版社名称和出版年份。

(2)期刊: 包括刊名、卷、期、页码、月年。

(3)会议文献: 包括会议名称、时间、地址、会议录出版单位及其地址、出版年份、会议录提供单位及其地址、页码。

(4)学位论文: 一般著录学位和学位论文的名称, 颁发的单位及地址、时间。

一、信息检索的概念

广义的信息检索:是指将信息按一定的方式组织和存储起来, 并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”。

狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。

二、信息检索的基本原理

是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。用户根据检索需求,对一定的信息集合采用一定的技术手段,根据一定的线索与准则找出相关的信息。

三、信息检索的类型

1. 根据信息的存储媒体和检索技术手段的不同, 信息检索可分为:

手工检索:通常使用的是一些印刷载体的工具书和检索期刊,检索过程由人脑和手翻书刊的配合来完成的,匹配是人脑的思考、比较和选择。

计算机检索:使用的是检索系统。系统包括计算机设备、终端、通信设施、数据库和检索、应用软件等。

2. 根据检索对象形式的不同, 信息检索可分为:

文献检索: 凡以文献检索工具(文摘、题录、全文等)为检索对象, 是一种相关检索,不直接解答用户所提出的技术问题本身,只提供与之相关的文献供用户参考。

数据检索(数值检索): 以数值、图标等信息形式为检索对象的信息检索。是一种确定性检索, 直接回答用户所需要的确切的数据。

事实检索:事实数据也被称作“基础资料”,它是指以直接提供可用的特定事实信息为目的的信息检索。

一、检索方法

文献检索的方法(查找文献的方法)大致可以归纳为三种:

1.常用方法(直接法):即直接利用文献检索工具或检索系统来查找文献的方法,是一种常规的科学检索方法。分为顺查法、倒查法和抽查法。

2.追溯法:又称引文法,是一种跟踪查找法。这种方法是利用已知的有关文献后所附的“引用参考文献”进行追溯查找,通常是在没有成套检索工具或检索工具不全的情况下,采用此法可查得一批相关文献。

3.循环法(交替法、分段法):1、2两种方法的综合。利用检索工具或检索系统进行常规检索,再利用文献后所附参考文献进行追溯检索,分期分段交替使用这两种方法,直到满足要求为止。可以查得较全面较准确,尤其适用于那些过去年代内文献较少的课题。

二.信息检索的基本途径

文献检索的途径主要可以分为以下几种:

1. 分类途径

是一种按照文献的知识内容及所属学科(专业)性质而分类和检索文献信息的途径。一般检索系统均提供数据库所使用的分类表的分类号索引。

《中图法》的分类原则

根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母A—Z表示。

2.主题途径

通过文献信息的内容主题进行检索的途径。计算机检索主要是主题检索,检索系统可提供多个检索点。

3. 著者途径

是根据已知文献著者姓名来查找文献的途径。文献著者包括个人著者和团体著者。一般检索系统都有著者(个人)索引,有的还有团体著者(机构)索引,均按字顺编排,其下为记录个数或文摘号。在利用内容途径查文献有困难时,如一些新近发展起来的学科或技术,往往难于确定类目或检索词,使用著者途径查找文献就显出其优越性,但该方法不能满足全面检索某一课题文献的需要。

4. 名称途径

根据文献的名称查找文献的途径。一般多用于查找图书、期刊、会议名称。常用于目录性检索工具/系统,如《书名目录》《期刊目录》《期刊联合目录》等。

二、数据库的类型

目前在计算机检索领域中数据库种类繁多,为便于学习,归纳为文献数据库和非文献数据库两大类。

文献数据库包括:题录文摘数据库、全文数据库;

非文献数据库包括:事实数据库、数值数据库。

1. 题录、文摘数据库(bibliographic database): 是一种二次文献数据库,主要存贮相关主题领域的各类文献资料的书目信息,包括机读版的文摘、题录、目录、索引等。用户可从大量文献记录中筛选出有参考价值的文献源,并依据记录提供的来源指示获取一次文献。如:Ei Web(工程索引)、《中文期刊数据库(文摘题录版)》等。

2.全文数据库(full-text database): 是将一个完整的信息源的全部内容转化为计算机可识别和处理的信息单元而形成的数据集合,即机读化的一次文献。用户可直接检索出原始文献,也可检索全文中的段、节、章等内容。

如:《中国学术期刊数据库》、《维普中文科技期刊(全文版)》等。

3.事实数据库(fact database):这类数据库能直接向用户提供可用的数据(包括文字、图形、图象、声音、计算机程序等)。如:百科全书、辞典、手册、指南、地图集、人名录、企事业名录、计算机程序、音乐等。

如:中经专网(教育版)、中国资讯行、万方。

4.数值数据库(numeric database):这类数据库主要提供来自原始文献的统计数据、调查数据或经过处理的各种数据、数值表格。

如:气象数据、地质资料、化学或物理化合物特性的文献数据、财务数据、人口统计资料、市场调研数据等。

四、字段检索(range searching)

字段检索即指定检索词出现的字段,被指定的字段也称检索入口,检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。西文数据库,字段检索常用代码来表示,如下表所示。

信息检索的基本步骤

(1)确定检索方向。这是使检索获得满意结果的先决条件,为此必须弄清所需信息的诸特征,如学科归属、主题概念、时间界限、文献类型、国别和语种等。

(2)确定检索方法。一般有三种方法:

a.正文法——从主题、分类、作者等途径查找。

b.引文法:又叫追溯法,即着眼于文献所附的参考或引用文献目录。(SCI)

c.交替法:正文法和引文法交替使用。

(3)确定检索工具。根据学科专业、语种等,选择一种或多种检索工具或检索引擎。

(4)确定检索途径。主题、分类或作者

(5)实施检索。注意检出一批结果后,应浏览题目和文摘,判断是否满足要求,并加以筛选,若感到不满意,应及时修改检索策略,加以调整,再行检索,直到满意为止。

(6)索取原始文献。检出结果通常是文献线索,还不是原始文献。为了索取原始文献,还须进行两项工作:

a.辩识文献款目,包括文献类型、来源、出版物名称等;

b.查找原始文献的收藏单位,先从本单位、本地区入手,利用馆藏目录和联合目录(联网目录),

找到原始文献收藏单位,即可通过借阅、复制或网上传送、馆际互借等途径获得文献。

中文检索工具

一、全文数据库

https://www.wendangku.net/doc/eb5994927.html,KI中国知网(中国知识基础设施工程)

2.中文科技期刊数据库

3.万方数据资源

4.人大复印报刊资料全文数据库

5.龙源电子期刊

二、全文图书

1.超星数字图书馆

2.读秀

3.书生之家

4.方正Apabi数字图书馆

三、索引

1.全国报刊索引数据库

2.中文社会科学引文索引(CSSCI)

四、其他

1.国务院发展研究中心信息网(国研网)

2.中经专网

3.国泰安数据库(用户名:scdx, 密码:654321)

4.超星名师讲坛——超星视频

5. KUKE数字音乐图书馆

2. 在数据库检索中,当检出的文献数量较少时,分析其可能原因,以及采用何种对应措施,才能增大文献信息的检出量?(至少列举5种情况)

答:在数据库检索中,当检出的文献数量较少时,可能是以下原因造成的:

①检索词拼写错误;

②遗漏重要的同义词或者隐含概念;

③检索词过于冷僻具体;

④没有使用截词算符;

⑤位置算符和字段算符使用过多;

⑥使用过多的逻辑“与”,过于严格。

⑦被检索的数据库数量较少

因此需要扩大检索范围,增加文献信息的检出量,具体措施如下:

①减少“与(AND)”算符,以0R加入相关检索词;以0R加入所有下位叙词;加入上位叙词;采用上位类;排除数据库中的普遍概念。

②在词干相同的单词后使用截词符(?);

③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。

④修正错误的检索词;

⑤补充足够的问义词,

⑥把叙词作为紧邻关键词使用;

⑦选用登录数高的索引词;

⑧放弃单库检索,选择跨库检索

信息检索复习资料

文献的定义 最简明的定义:记录有知识的一切载体。 定义:记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或固化在物质载体上的知识。 二次文献 将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。 特种文献 会议文献、学位论文、专利文献、标准文献、科技报告、政府出版物、产品资料、档案8种类型文献是一种介于图书与期刊之间的文献类型,通常在出版发行方面或获取途径方面比较特殊,因而也被称为特种文献或灰色文献。 文献检索式 或:A or B 或 A + B;用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。 与:A and B 或 A * B; 用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查全率。 非:A not B 或 A – B;表示检索记录中凡含有A不含B的记

录被检出。能够缩小命中文献的范围,增强检索的准确性。 网上的文献格式 期刊、专著、论文集、学位论文、报告、专利论文、[国际、国家标准]、报纸文章、电子文献。 文献信息源 用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。文献信息源是信息源的主体部分,是信息搜集、存储、检索和利用的主要对象。 CA美国化学文摘数据库收录文献 期刊论文、会议论文、图书、学位论文、专利、技术报告。 什么数据库能检索会议文献 国外:ISI会议录数据库、会议论文索引数据库、OCLC PapersFirst 与ProceedingsFirst、STN联机系统中的CONF会议论文数据库、美国物理所电子会议录数据库、美国光学工程师学会会议文献数据库、美国航空航天协会电子图书馆。 国内:中国重要会议论文全文数据库、万方数据知识服务平台会议论文数据库、中国国家科技图书文献中心会议论文数据库、中国学术会议文献通报、上海图书馆会议资料数据库。

信息检索与利用复习重点

一、工具书概念:根据一定的查阅需要,系统汇集有关的知识资料,以特定的编排方式和检索方法,为人们迅速提供知识信息或资料线索,专供查阅的图书(文献)。工具书的特点:①信息密集②资料性强③查考为主④方便检索工具书类型:1 检索工具书又称线索性工具书,主要提供查找文献的线索:书目、索引、文摘。2 参考工具书主要向读者提供可资参考的知识内容,如数据、史实、结论、定义、人物简介等数据和事实信息:字典、词典、百科全书、年鉴、手册、名录、数表统计资料、表谱、图录等类型。3 边缘工具书——形式上不是工具书但具有查考检索作用的图书。丛书、总集、汇编、综述、史志、学科史及要籍等。工具书的结构:①序、跋②凡例③目录④正文⑤辅助索引⑥附录、参考文献工具书的鉴别与选择原则:1)看其主流,考察内容材料,看内容是否完备、材料新颖可靠,解释引证准确2)客观、正确,有无立场、观点问题3)了解编制体例,编排方式、检索方法、印刷规则、文体。4)同一种工具书的不同版本。鉴别与选择的方法1)查考编辑者与出版者2)编纂和出版的年代、审察版本3)查考序跋、凡例和目次4)辨别正文——选条试查、定条比较 5)参阅书评二、机器检索及光盘、联机与网

络检索计算机检索:人们在计算机或计算机检索网络终端机上,使用特定检索指令、检索词和检索策略,从计算机检索系统数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。信息检索工具:指用以报道、存储和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献,如书目数据库、搜索引擎、索引、文摘。检索工具的分类:1)(文献检索工具)提供线索的指示型检索工具(二次文献):书目、馆藏目录;索引;文摘;工具书指南2)(事实与数据检索工具)提供具体信息的参考工具(三次文献):1词典2类书、政书、百科全书3、年鉴4传记资料5表谱、图录6、政府文献7名录、手册8数表、统计集9丛集汇要10地理资料信息检索途径:1)外部特征途径:题名途径,著者途径,序号途径2)文献内容特征途径:分类途径,主题途径,关键词途径,分类主题途径,其他途径。信息检索步骤:1)分析检索课题,明确检索要求(2)制定检索策略:确定检索工具、方法、途径、用词及逻辑关系、位置关系(3)实验性查找,调整检索策略,正式查找;(4)辅助性查找(最新期刊、年鉴);(5)整理答案或索取原文。信息检索步骤:1)分析检索课题,明确检索要求2)制定检索策略:

信息检索考试题库

一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 知识是指人类对客观世界的认识。知识可分为(C) A.有用知识和无用知识 B.基础知识和高级知识 C.感性知识和理性知识 D.理论知识和实践知识 文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型 B金石型 C.电脑型 D.机读型 信息检索系统的功能为:报道文献信息、存储文献信息和(B) A.揭示文献信息 B.检索文献信息 C.宣传文献信息 D.介绍文献信息 检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D) A.目次 B.题录 C.附图 D.正文(主文档) 为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A) 是题名的标识符 是关键词的标识符 是摘要的标识符 是著者的标识符 以下不是布尔逻辑算符的是(B) B.Near 布尔逻辑算符通常的运算顺序是(A) A.有括号时,括号内的先执行;无括号时 NOT > AND > OR B.有括号时,括号内的先执行;无括号时 NOT > OR >AND C.有括号时,括号内的先执行;无括号时 AND >NOT > OR D.有括号时,括号内的先执行;无括号时 AND > OR > NOT 限定词“in”是为了缩小检索范围,提高检索速度和命中率的。下列检索表述式正确的是(B) A.“信息in OCLC” B.信息in AB” C. 信息in CNKI” D.信息in Calis” 我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A) A.《中国图书馆图书分类法》 B.《国际十进分类法》 C.《人大法》 E.《科图法》 信息检索的方法有追溯法、综合法和(C) A.须查法 B.倒查法 C.工具法 D.抽查法 CNKI数据库的全文数据输出文件的格式为(D) 和TXT 和VIP 和PDF 和PDF 超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A) A.书名、作者、索书号和出版日期 B.书名、作者、索书号和出版社 C.书名、作者、分类号和出版社 D.书名、版本、索书号和出版社 读秀知识库是由海量全文数据及元数据组成的超大型 数据库。其提供的中文图书有(B) 万种 万种 万种 D400万种 SCienCe DireCt数据库收录2000多种期刊,其中被ISI 收录期刊种类为(C) SD数据库常用字段中“TITLE-ABSTR-KEY”字段是表示: ( D ) A.题名-作者-关键词 B.题名--作者-摘要 C.作者- 摘要-关键词 D.题名-摘要-关键词 Dialog数据库于1972年正式开始提供商用联机服务, 是世界上最大、历史最悠久的联机检索系统。目前数据 库有( A ) 多种 多种 多种 多种 网络信息资源的一次出版信息包括:网上图书、期刊、 报纸、专利、政府出版物和( D ) A.电子邮件 B.新闻 C.博客 D.会议资料 Google检索框中的两个关键词之间用空格隔开则默认 的连接是( A ) A.“AND”(“与”运算) B.“OR”(“或“运算) C.“NOT”(“非”运算) D.“W”(位置运算) 下列哪个是Google指定文件类型检索(B) A.检索词site: B.检索词filetype: C.检索词insite: D.检索词innurl 百度搜索中能实现精确匹配查询的是(C) A.单引号‘’ B.中括号[] C.双引号“” D.逗号 下列开哪个开放存取学术资源利用平台的名称是正确 的(D) :中图链接服务 : OA资源一站式检索服务平台 :开放存取期刊仓库 J – GATE:开放存取期刊门户 论文摘要的文字必须十分简炼,内容亦需充分概括,字 数一般不超过论文字数的( B ) A.6%, %, %, % 制定检索策略首先要弄清用户的提问要求,并确定要查 找的文献学科范围、类型、文种和(C) A.地点 B.样式 C.时间 D.方位 搜索引擎的由哪几个部分组成(A) A.搜索器、索引器、检索器和用户接口 B.搜索器、编辑器、检索器和用户接口 C.搜索器、索引器、整理器和用户接口 D.查询器、索引器、检索器和用户接口 下列文献哪个“参考文献”的格式著录是正确的(D) A.[1]刘付芬. 黄银安,青少年网瘾对家庭经济危害的 分析及对策,《消费导刊》,2010年第8期,25-28页 B.(1)刘付芬. 黄银安,青少年网瘾对家庭经济危害 的分析及对策,消费导刊,2010(8):25-28 C.<1>刘付芬, 黄银安.青少年网瘾对家庭经济危害的 分析及对策.消费导刊,2010(8):25-28 D.[1] 刘付芬, 黄银安.青少年网瘾对家庭经济危害 的分析及对策.消费导刊,2010(8):25-28 每个被收录的网页,在百度上都存有一个纯文本的备 份,称为:(C) A.百度文档 B.百度相似搜索 C.百度快照 D.百度百科 在百度中如果在特定站点“新浪网中搜索关于“公司治 理”方面的文献信息的检索式为:(B) A. 公司治理intitle:公司治理site: 公司治理inurl: 公司治理filetype:开放存取期刊门户”的网址为:(C) 文献综述的写作步骤包括:选题、查阅文献资料、加 工处理,拟定提纲,撰写成文,反复修改和(A) A.定稿成文 B.定题名称 C.定稿打印 D.定稿腾写 判断一篇文献综述质量高下的分界线是:(D) A.评论 B.综合归纳 C.总结 D.描述 二、多项选择题 (在每小题的备选答案中,可能有一个或多个正确的答 案,请将其代码分别填在题干的括号内,多选、少选、 错选、均无分。) 信息是事物存在的方式和运动状态及其规律的表征,是 事物的一种普遍属性。信息的特征有(A、B、C、D、E) A.客观性 B.时效性 C.传递性 D、共享性 E.中介性 以信息所依附的载体为依据,信息可分为(A、C、D) A.文献信息 B.自然信息 C.口头信息 D.电子信息 E.社会信息 文献是记录有知识的一切载体。构成文献的要素为(A、 B、D、E) A.知识、信息内容 B.信息符号 C.信息类型 D.载体材料 E.记录方式 文献按出版形式区分,可分为十大文献情报源,除图书、 期刊和报纸外下列哪些文献属于十大文献情报源(C、D、 E) A.研究报告 B.宣传手册 C.会议文献 D.政府出版物 E.专利文献 下列属于四大科技报告的有(B、C、D、E) 报告 报告 报告 报告 报告 下列属于零次文献的有(A、B、C、D) A.书信 B.手稿 C.记录 D.笔记 E.研究报告 下列属于一次文献的有(B、C、E) A.论文手稿

信息检索复习资料

信息检索复习要点 第一章 一、情报和文献 1.情报(P4 1.2.3) 情报就是为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。 知识性、传递性、针对性是情报的3个基本属性。 2.文献(P5 1.2.5) 记录有知识的一切载体叫文献。 知识内容、信息符号、载体材料、记录方式是文献的4个基本要素。 二、文献按载体划分(P5~6 1.3.1) 1.印刷型 2.微缩型 3.视听型 4.电子型 三、文献级次划分(P6 1.3.2) 1.零次文献:非正式出版物或非正式渠道交流的最原始的文献。如手稿、演讲、听取经验交流,甚至包括口头言论。 2.一次文献:依据作者本人的研究或成果制作成果创作的文献,即通常所说的“原始文献”、“第一手资料”。如图书、期刊论文、科技报告、学位论文、专利说明书等。 (原创性) 3.二次文献:按一定的方法对一次文献进行加工,使之有序化而形成文献。如目录、索引、文摘等。(有序性) 4.三次文献:一般是围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩等深度加工而形成的文献。 如各种评述、进展报告、教科书、词典、年检、百科全书等。(综合性) 四、ISBN和ISSN(P7~9 1.3.3) 1.ISBN(国际标准书号)

(1)它是由国际标准化组织1972年公布的一项国际通用的出版物统一编码。它是由10位数字组成,共分4段【组号、出版社号、书序号、校验码(1位数,ISBN最后一位数值)】。 (2)校验方式:将ISBN 1~9位数字顺序乘以10、9、8、7、6、5、4、3、2这9个数字,将这些乘机之和再加上校验码,如果能被11整除,则这个ISBN号是正确的。2.ISSN(国际标准连续出版物编号) (1)实现对全世界文献的管理。由8位数字组成分2段,每段4位数字。中间用“-”隔开前7位是刊名代号,最后一位是计算机检验位。 (2)检验方式:将ISSN 1~7位数字顺序乘以8、7、6、5、4、3、2这7个数字,将这些乘机之和再加上检验号,假如能被11整除,则这个ISSN号是正确的。 第二章 一、信息检索(P12) 从广义的角度讲,文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需的文献过程,亦叫信息检索。而人们一般所指的文献检索,是指狭义的文献检索,即最后一个过程——信息检索,文献的查找过程。 二、信息检索的类型(P13 2.1.2) 1.按照检索的对象的不同,人们将信息检索分为文献检索、数据检索和事实检索。2.按照检索的方式的不同,人们还常将它分为手工检索和计算机检索。 三、图书的四大常用检索点(P20 2.3.1) 1.书名 2.作者 3.主题词 4.分类号 四、检索语言的基本种类(P19 2.3) 检索语言是文献检索中用了描述文献特征和表达信息提问内容的一种专门化的人工语言,是信息组织和文献检索共同使用的语言。 检索语言大致分为分类语言(P19)和主题语言(P24)两种。 (1)最早的图书分类法(P20 2.3.1 2) 我国西汉刘向、刘歆父子所著的《七略》。它首创的“七分法”对后世我国的分类思想的形成和发展影响极大。 (2)四库全书(P21 小资料) 纂修与清乾隆年间的《四库全书》,从收集编纂到成本,共用10年(1173-1782),集我国古代文献典籍之大成。共著录图书3461种,79309卷,36000余册。《四库》将各种书籍分为经部、史部、子部、集部。各部下分若干类,类下细分为属。 (3)全球使用最广的分类法(P21 2.3.1 3) 《杜威十进分类法》(DDC)是当今世界上影响最大、用户最多的图书馆分类法。

信息检索考试重点

第一章 知识含义:是人们通过实践对客观事物及其运动过程和规律的认识。 文献含义:是记录有知识的一切载体。 文献基本要素:知识、载体和记录 信息资源含义:是可供人们直接或间接开发利用的各种信息集合的总称。 信息的类型:按信息的表现形式:文字信息图像信息数值数据信息语音信息 连续出版物含义:是一种具有统一名称、固定版式、统一开本、连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物。 学位论文含义:是大学生或研究生为取得学位资格而提交的学术论文。 会议文献含义:主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料。专利文献含义:是实行专利制度的国家和地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 标准含义:是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件 信息素质含义:利用大量的信息工具及主要信息源使问题得到解答的技术和技能。 信息素质内涵:信息意识、信息能力、信息道德。 Internet应用:信息获取、交流沟通、网络娱乐、商务交易 第二章 信息检索过程:(1)明确信息检索需求;(2)选择检索系统;(3)确定检索词;(4)构造检索表达式;(5)索取原始信息。 信息检索类型:对象内容划分:文献检索、数据检索、事实检索、多媒体检索 组织方式划分:全文检索、超文检索、超媒体检索 信息检索发展历史:1、手工信息检索2、单机信息检索3、联机信息检索4、网络信息检索信息检索发展趋势:信息检索智能化、信息检索可视化、信息检索集成化、信息检索个性化信息检索语言功能:是组织与存储信息的依据、是信息检索的依据、是联系信息存储与信息检索的桥梁 信息检索语言种类:按检索语词的规范化程度分、按内容性质和结构原理分 分类语言含义:是一种按学科范畴和体系来划分事物的语言,它是以数字、字母符号对类目进行标识的一种语言体系,也称分类法。 分类语言类型:体系分类语言、组配分类语言 《中图法》基本类目表5个基本部类,22个大类。 主题检索语言含义:主题检索语言是指描述文献主题的语词标识并按字顺序列排检的检索语言。 主题检索语言类型:标题词语言、单元词语言、叙词语言、关键词语言 标题词语言含义:是用规范化的自然语言词做标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的一种主题法。 叙词语言含义:又称主题词语言,是以表达文献主题内容的概念单元为基础,经过规范化处理,可以进行逻辑组配的一种主题语言。 布尔逻辑检索(是逻辑检索的基础)运算符:逻辑“或”(OR)、逻辑“与”(AND) 、逻辑“非”(NOT)。 位置检索:(1)(W)—With (W)表示在此算符两侧的检索词必须按此前后的顺序排列,顺序不许颠倒,而且两个检索词之间不许有其他的词或字母,但允许有空格和标点符号。 (2)(nW)—nWord

信息检索模拟试题

《INTERNET信息检索》模拟试题(一) 一、填空 1.小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部 相关文档有25 篇。 2.INTERNET是基于TCP/IP 协议的。 3.文件ABC.001.TXT的后缀名是TXT 。文件类型是文本文件。 4.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 5.目录型搜索引擎主要提供族性检索模式,索引型搜索引擎主要提供特性检索模 式。 6.在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 7.根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型 搜索引擎。 8.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文 献。 9.定期(多于一天)或不定期出版的有固定名称的连续出版物是期刊。 10.检索工具具有两个方面的职能:存储职能、检索职能。 11.以单位出版物为著录对象的检索工具为:目录。 12.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。 13.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法, 又称为引文法。 14.已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是:Levitan 。 15.检索语言可分为两大类:分类语言、主题词语言。 16.LCC指的是美国国会图书馆分类法。 17.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。 18.主题词的规范化指的是词和概念一一对应,一个词表达一个概念。 19.国际上通常根据内容将数据库划分为:参考数据库、源数据库、混合数据 库。 20.查询关键词为短语"DA TA OUTPUT",可以用位置算符(W)改写为:DATA (W) OUTPUT 。 21.著录参考文献时,对于三个以上的著者,可以在第一著者后面加上et al. ,代表"等 人"的意思。 22.国家图书馆默认的检索方式是多库检索。 二、单项选择 使用PING命令探测远方主机时,得到的响应是"TIMED OUT",这个信息的含义是:【B】 A.无法解析DNS B.连接超时,在指定的时间内,远方主机没有响应 C.无法识别远方主机的响应信号 D.其他

信息检索复习资料

第一部分:基本常识 1.文献按照出版形式可分为哪几种类型?举例。 图书、期刊、报纸、特种文献。 图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等 期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。 报纸:人民日报 特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案 美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA 报告4、能源部的DOE报告。 2现代科技文献具有的特点哪些? 答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降 3什么是核心文献、相关文献和边缘文献? 答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。 4 什么是文献?构成文献的有哪四个要素? 答:文献的定义是记录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。 5 电子文献的主要类型和文件格式是什么? 答: (1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分; (2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的gif文件、jpg文件以及标记文件格式的html文件和xml文件之分; (3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分; (4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分; (5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类; (6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。 6 如何针对不同时间要求的文献信息,选用不同的文献信息源? 答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。 7什么是ISSN和ISBN?

信息检索考试重点

名词解释4*4’ 1.信息素质: 个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。 2.信息检索 广义的信息检索 全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。 狭义的信息检索 “信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。 3.登记性目录(概念) 也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。 4.联合目录(概念) 汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。 5.年鉴(概念) 年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。 6.OPAC(公共联机书目查询系统) 利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。 7.引文索引(概念) 根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义: 对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。同时由于B引用了A,故B又称为引用文献。 8.垂直搜索引擎(概念) 也被称为专业搜索引擎,或主题搜索引擎。它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。 简答4*9’ 信息素质包含四个层面的含义: 第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。 第二,掌握了主要的信息源和信息工具的知识及技能。 第三,能够分析评价选择相关信息。 第四,利用信息的目的是为了有效地解决具体问题。 信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力

《信息检索》模拟精彩试题

《信息检索》模拟试题(一) 一、填空 1.小王在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,则全部 相关文档有 25 篇。 2.INTERNET是基于 TCP/IP 协议的。 3.文件ABC.001.TXT的后缀名是 TXT 。文件类型是文本文件。 4.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。 5.目录型搜索引擎主要提供族性检索模式,索引型搜索引擎主要提供特性检索模 式。 6.在使用搜索引擎检索时,URL:ustc可以查到网址中带有ustc的网页。 7.根据索引编制方式的不同,可以将搜索引擎分为索引型搜索引擎和网络目录型 搜索引擎。 8.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文 献。 9.定期(多于一天)或不定期出版的有固定名称的连续出版物是期刊。 10.检索工具具有两个方面的职能:存储职能、检索职能。 11.以单位出版物为著录对象的检索工具为:目录。 12.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。 13.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法, 又称为引文法。 14.已知一篇参考文献的著录为:”Levitan, K. B. Information resource management. New Brunswick: Rutgers UP,1986”,该作者的姓是: Levitan 。 15.检索语言可分为两大类:分类语言、主题词语言。 16.LCC指的是美国国会图书馆分类法。 17.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。 18.主题词的规范化指的是词和概念一一对应,一个词表达一个概念。 19.国际上通常根据内容将数据库划分为:参考数据库、源数据库、混合数据 库。 20.查询关键词为短语"DATA OUTPUT",可以用位置算符(W)改写为: DATA (W) OUTPUT 。 21.著录参考文献时,对于三个以上的著者,可以在第一著者后面加上 et al. ,代表" 等人"的意思。 22.国家图书馆默认的检索方式是多库检索。 二、单项选择 1. 使用PING命令探测远方主机时,得到的响应是"TIMED OUT",这个信息的含义是:【B】 A.无法解析DNS B.连接超时,在指定的时间内,远方主机没有响应 C.无法识别远方主机的响应信号 D.其他 2. 一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:【C】 A.关键词>标题>文摘>正文

信息检索复习资料

信息检索公选课复习资料 1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。 2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。 3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。 4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。 5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。 6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。 7.著录是对文献内容和形式特征进行选择和记录的过程。 8.数据检索是指特定的数值型数据为对象的检索。 9.按信息的加工层次分类:(含义) 一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等 二次文献:目录、题录、索引、文摘 三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。 二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。 三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。 二次信息资源与三次信息资源的区别: 对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容 用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案. 10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实

2018年成人高考文献检索末复习材料知识点复习考点归纳总结

《文献检索期末复习题》 一、选择题 1.( C )年,国内检索刊物编辑出版工作走上有领导、有组织、有计划的发展道路。C.1956 2.国际联机信息检索是在20世纪的哪个年代发展起来的?( C ) C.80年代 3.《科学引文索引》的检索途径包括(A)A 引文途径来源途径团体途径主题途径 4.《全国报刊索引》属于( B ) B.题录型检索工具 5.《中国医学文摘》的主体部分采用下列哪些形式报道文献?( B ) B.文摘、简介、题录 6.《中国专利公报》当前的出版频率为( D )。 D.周刊 7.《中目》(医药卫生)的分类途径是以( B )为检索标识检索文献的. B分类号、类目名 8.《中文科技资料目录》《医药卫生》的分类途径是以下列哪项为检索标识的途径?( D) D.分类号、类目名 9.下列对学位论文描述不正确的是( D ) D.学位论文是公开出版的,全文获取比较容易 10.2005年,国际专利分类法已经出版到第几版?( C ) C.第七版 11.AIDS与MeSH主题词‘‘Acquired Immunodeficiency Syndrom”(获得性免疫缺陷综合的关系在MeSH中应反映为( B) B. Acquired Immunodeficiency Syndrom X AIDS 12.IM主题索引部分采用哪种检索语言标引文献?( D ) D.叙词语言 13.Internet通过统一的通信协议才实现全球计算机的互通互连,这个协议是( D )D.TCP/IP 14.MEDLINE光盘数据库的每一条记录大约是由26个字段组成的,其中又分为默认字段和限制性字段两种,默认字段是指( C ) C.如果不加限 制,系统默认进行检索的字段 15.MEDLINE是当今世界上最大也是最权威的生物医学文献数据库,它收录了(C) C仅仅全世界生物医学校心期刊的文献 16.MeSH词表中反映词间相关关系所采用的符号为( B )。B.“see related”和“XR” 17.Meta分析法是属于下列哪种文献信息调砑方法?( C ) C定量和定性相结合 18.PUBMED中的预检索功能的目的在于( A ) A.显示检索结果前先显示检索结果的数量,节省调整检索策略的时间 19.SCI中文献类型代码B表示( B )。 B.书评 20.WinSpirs检索软件中规定邻近度算符With表示( C ) C.运算符前后两词出现在同一字段中,后顺序不固定 21.WWW服务主要是通过( C )模式提供服务的。 C.客户/服务器 22.WWW是Internet上最常用的服务方式,其精髓在于(A ) A.超文本 23.按照国际上通用的分类方法,下列哪个数据库属于源数据库?( B )B.期刊全文数据库 24.-般来说,在检索工具严重短缺的情况下,可采用( D )检索方法。 D.引文法 25.-般情况下,数据库的顺排文档是按记录的( D )顺序排列的。 D.流水号(或存取号)的大小 26.查找“2003年我国居民病伤死亡原因排名在前三位的是哪几项?”,这一检索提问属于 ( C ) C.事实检索 27.调研报告的类型多种多样,以下哪项不属于调研报告?( D ) D.技术报告 28.二次文献是指( B )。 B.对一次文献进行收集、分析、整理并加以编排的文献 29.发明专利自申请之只起满( B ).即可向公众公开. B18个月 30.分段法是查找文献的一种方法.是指( D ). D-将引文法和常用法两种检索方法结合起来,交咎使用的方法 31.关于因特网上的FTP服务描述不正确的是( C ) C.所有FTP服务器都可以匿名访问 32.光盘存储技术的研究始于( C )。C.1980年 33.光盘类型CD-RW属于(C)C第三代光盘产品 34.国际专利分类法每个一段时间会再版一次,到1974年为第几版(A)A 第二版 35.计算机信息检索系统的构成从本质上主要包括( A ) A.信息存储与检索 36.计算机用于信息检索的研究始于( C )。 C.20世纪50年代初 37.检索工具的时差是指( D )。 D.检索工具收摘报道文献的时间与该原始文献发表的时间之差 38.检索式“leukemie neard etilogy”表示前后两个检索词之间可以出现(B) B 少于4个单词 39.检索式A near3 B表示A和B之间最多可允许插入( A )个其他单词. A.2 40.检索语言中的标题词语言是一种( A ). A.先组式规范语言 41.截词算符可使多个词根一致的检索词之间实现(B)”B逻辑“或”C 逻辑“非” 42.目前,因特网上的倍息服务大多都是基于( C )工作模式。 C.客户机/服务器 43.目前世界上生物医学方面最著名的四大检索刊为(C) C IM BA CA EM 44.目前世界上最大的国际联机信息检索系统是(B ) B.DIALOG 45.如果检索课题所涉及的内容比较专深,往往采用( B )的检索方法.B.主题途径 46.使用《中目》(医药卫生)检索课焉“心血管疾病”时,首选的检索途径应为( C ).C分类途径 47.使用《中文科技资料目录》(医药卫生)检索“帕金森病人伴发的精神病”的文献时,首先主择的检索途径应为( A ) A.主题途径 48.使用《中文科技资料目录》《医药卫生》检索“肿瘤患者伴发疲劳综合症”的文献时,首先选择的检索途径应为(A)A主题途径 49.世界上第一台计算机诞生于( B ). B.1946年 50.世界上第一种光盘数据库出现于1985年,它是( C ) C BIBLIOFILE 51.世界上最大的联机信息检索系统是(B)B DIALOG系统 52.市面上出售的DVD电影光盘属于下列哪种类型的光盘?( A ) A.只读光盘 53.特尔裴法属于(C)的文献信息调研方法?C 定量和定性相结合 54.通常ISBN号的定长为(D)位数字A 7 B 8 C 9 D10 55.位置算符又称邻近度算符,它是( A )运算符的延伸。 A. and 56.文献特征包括外表特征和内容特征,他们对应于数据库中的(C) C 字段 57.我国的文献检索刊物出现比较晚,在哪一年之后才逐渐形成了一定的规模?( C )C.1978年 58.我国的专利制度是从哪一年开始实施的?( B) B 1985年 59.我国文献检索刊物出现较晚,直到哪年才开始有文摘性检索刊物?( B ) B.1934 60.下列对“信息”描述正确的是( C ) C.信息是“熵” 61.下列关于综述的说法中错误的是( A ) A.以多种文献情报源为素材或原料 62.下列获取文献信息的途径中,哪种途径属于非正规获取途径?( B ) B.参加学术会议

信息检索题库 答案(终极版)分析

四川师范大学信息检索课后作业 1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。 A、信息素养 B、信息安全 C、信息检索 D、信息评价 2.(第1章?多选)信息素养的基本构成具体包括(ABCD) A、信息知识 B、信息意识 C、信息能力 D、信息伦理 3.(第1章?多选)信息意识具体包括(ABCD)。 A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题; B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案; C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求; D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主动的通过获取信息找寻答案。 4.(第1章?多选)关于信息素养教育,下列说法正确的是(ABCD)。 A、信息素养教育的第一个层次是拓展视野,使人们知道这个世界上原来还有这么多信息资源。 B、信息素养教育的第二个层次是训练信息获取能力,使人们知道如何获取所需要的信息。 C、信息素养教育的第三个层次是培养信息利用能力,使人们具有敏锐的信息意识和利用信息解决问题的能力。 D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互促进、螺旋提升的关系。 5.(第1章?多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。 A、信息意识 B、信息知识 C、信息伦理 D、信息评价 6.(第1章?多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。下列属于5项标准的是(ABCD)。 A、具有信息素养的学生能够确定所需信息的性质和范围 B、具有信息素养的学生能够有效和高效地获取所需信息 C、具有信息素养的学生能评价信息及其来源并将选取的信息整合入其知识基础和价值体系中 D、具有信息素养的学生,不论是个人或作为小组成员,都能够有效地利用信息达到特定的目的 7.(第1章?单选)"information literacy "一般翻译为(B)。 A、信息检索 B、信息素养 C、信息安全 D、信息评价 8.(第1章?单选)(D)是指在信息的生产、存储、获取、传播和利用等信息活动各个环节中,用来规范相关主体之间相互关系的法律关系和道德规范的总称。 A、信息知识 B、信息能力 C、信息意识 D、信息伦理

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

相关文档