文档库 最新最全的文档下载
当前位置:文档库 › 现代信息检索讲义

现代信息检索讲义

现代信息检索讲义
现代信息检索讲义

目录

上篇图书馆概述第一章图书馆概述

第二章数字图书馆

下篇信息检索第三章信息检索基础知识

第四章数据事实检索

第五章特种文献检索

第六章国外部分重点检索工具

第七章网络信息资源检索与利用第八章学术论文撰写及发表

第一章现代图书馆概述

一、图书馆史略

文字的产生和文献的出现,是人类社会进入文明阶段的重要标志。当人类意识到需要将经验和知识用文字记录下来以供利用时,最古老的文献便产生了。当人们认识到需要对已产生的文献进行连续不断的收集,并将收集到的、有一定数量的文献有序地存放在一起以便长久保存和利用时,最早的图书馆便诞生了。

考古发现,在约公元前3000年的河南安阳的殷墟的一个窖穴里,有2万多块甲片整齐地摆放在一起,这是已知最早的图书馆。

中国最早的文献形态,是公元前14~前11世纪,商代后期的甲骨文献和金文文献。商代设有史官,掌管记录统治者的言行及重大事件的图书档案。周代除王室有收藏文献的库室外,各诸侯国也有本国的文献库室,因为最晚在春秋战国时已流行以竹木和缣帛为载体的文献,记录文字较前便利得多。在以上这段时期,图书和档案工作是结合在一起的。隋唐写本书盛行,推动了图书馆事业的发展。唐代发明的雕版印刷术,至宋代得到普遍推广,文献的生产更加方便,五代十国曾一度凋敝的图书馆事业又迅速复兴起来,并且出现了新的图书馆类型—书院藏书。金、元两代图书馆没有重大发展。明代又掀起高潮,以私人藏书成绩最为可观,成了图书馆事业的主流。清代无论是官府藏书还是私家藏书在数量和规模上都大大超越了前代。鸦片战争以后,封建时代的图书馆事业逐渐向近代公共图书馆事业过渡。1902年,浙江绍兴的徐树兰以一己之力筹建古越藏书楼,于1904年正式开放。湖南图书馆和湖北图书馆也先后成立。北京图书馆的前身京师图书馆1910年开始筹建,1912年正式开放。

近代大学图书馆的产生,在时间上要早于近代公共图书馆。1902年由中国人自己创办的京师大学堂(北京大学前身)图书馆为最早;由外国人在中国创办的教会大学图书馆,以1894年成立的上海圣约翰大学图书馆为最早。

中国封建社会图书馆经过漫长演进而兴盛、发达,成为一种成熟的精神文化形态,为人类积有累世不断的、浩如烟海的文献。除甲骨文献、简牍文献、缣帛文献等仍在陆续出土外,现在保存在各大图书馆里的唐末以来的纸质古籍,据不完全统计约有十万种以上。这是中华民族对整个人类文明所做的特殊的、卓越的贡献。

古埃及最迟在约公元前23世纪前的古王国时期,就有了王室图书馆和寺院图书馆。古代希腊、罗马时期也都有为奴隶主阶级,及其贵族知识分子保存资料的图书馆。特别值得一提的是在希腊化时代(公元前四~前一世纪)托勒密王朝曾建立了规模宏大的亚历山大图书馆。

图书馆作为一种社会机构,对人类社会文明的贡献是巨大的。早在17世纪德国的莱布尼茨就称誉它是“人类灵魂的宝库”。凡历史上为各个学科领域的发展提供了某种新思想,做出某种创造性的贡献的人,无一不是利用图书馆博览群书,而成为知识渊博的一代伟人的。图书馆无论在历史上、现实社会和未来社会中,都对人类文明的进步和发展起着不可替代的作用。

二、图书馆的基本含义及类型

1.定义

图书馆是系统搜集、整理、保存、传播和利用书刊资料,为一定社会的政治、经济和文化服务的科学、教育、文化机构。具有保存人类文化遗产、社会教育、传递科学情报、开发智力资源等四大基本职能。

图书馆是为人们利用知识创造便利的机构。它是知识的聚散地,是社会的记忆装置和扩散装置。

图书馆是知识与知识利用者之间的桥梁和中介。

聚(采访)→序(管理)→散(服务)

根据国际图联和国际标准化组织的定义,图书馆大致可以分为国家图书馆、公共图书馆、学校图书馆、专业图书馆等四类。不同类型的图书馆在职能、服务方式、服务对象等方面都有所区别。

2.图书馆的类型

目前,我国现代图书馆大致分为三大类:公共图书馆、高等院校图书馆、科学和专业图书馆。

a.公共图书馆

公共图书馆是指那些业务上由文化部负责协调指导、地方政府提供财政支持、为一个团体或区域的公众提供服务的图书馆,是一种公益性事业。其目标是满足公众的教育需求、情报需求、研究需求、文化需求和娱乐需求。公共图书馆,特别是对社区图书馆来说,是读者身边的图书馆,因此其服务方式以到馆服务为主,服务的对象主要是本地区的用户。如中国国家图书馆、美国国会图书馆、广州市图书馆、越秀区图书馆等。

b.高校图书馆

高等学校图书馆主要为教师、学生和科研人员以及其他相关人员提供服务,学术性很强,它既是一个服务性的部门,同时又是一个学术性的机构。由于高校图书馆拥有丰富的学术性文献资源,因此,在发挥情报职能和教育职能方面具有相当优势。如清华大学图书馆、北京大学图书馆、中山大学图书馆等。

c.科学和专业图书馆

科学和专业图书馆是由各种研究机构、政府部门、学会、协会、博物馆、商业公司、企业商会或其他组织机构所支持的图书馆,通常以其所属机构的目标为目标,为用户提供非常个性化的深层服务。如中国科学院图书馆、中国医学科学院图书馆、中国社会科学院图书馆。

三、馆藏书刊资源检索

(一)、《中国图书馆分类法》(简称《中图法》)

1、《中图法》概述

图书分类是根据图书内容的学科属性或外表特征,依据一定的分类法,将图书分门别类地、系统地组织起来,同时给以与之相适应的标记符号,即分类号,以便按分类号分类组织藏书和编制分类目录。

《中国图书馆分类法》,简称《中图法》。是以科学分类为基础,结合图书资料的内容

特点,分门别类组成的分类法。

我国公共图书馆和大学图书馆多以《中图法》为图书分类的依据。另外,多数编辑部也要求作者投稿时提交学术论文的《中图法》分类号。

2、《中图法》的体系结构

《中图法》整体结构分为5大部类,22个基本大类(一级类目),下分二、三、四……级类目,类目级别越多,分类越细,类目所表达的内涵越丰富。

(1)部类是整个分类法逻辑体系的反映,不用于类分图书。这5个部类分别是:第一部类:马克思主义、列宁主义、毛泽东思想、邓小平理论

第二部类:哲学

第三部类:社会科学

第四部类:自然科学

第五部类:综合性图书

(2)22个一级类目列举如下:

A马克思主义、列宁主义、

毛泽东思想、邓小平理论

B哲学、宗教

C社会科学总论

D政治、法律

E军事

F经济

G 文化、科学、教育、体育

H 语言、文字

I文学

J艺术

K历史、地理

N自然科学总论

O 数理科学和化学

P 天文学、地球科学

Q生物科学

R医药、卫生

S农业科学

T工业技术

U交通运输

V航空航天

X环境科学、安全科学

Z综合性图书

(3)类目级别

基本大类是类分图书的第一级类目,随着内容的细分,在一级类目下还有二级类目、三级类目、四级类目......如:

R 医药、卫生一级类目

R5 内科学二级类目

R51 传染病三级类目

R511 病毒传染病四级类目

R511.1 麻疹五级类目

3.分类号

(1)编码方法:《中图法》采用大写英文字母与阿拉伯数字相结合的混合制号码,用一个字母标识一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分。为方便读写,分类号中的阿拉伯数字部分由左至右每隔3位加一个圆点“.”,如G252.7

(2)含义(举例略)

(3)复分号:按学科分类的图书,有时会有不同的文献类型,如教材、词典、图谱等。为了进一步细分每类图书的不同文献类型,而又不增加分类表的篇幅,在《中图法》中采用了复分处理。

复分的方法是将带有连字符的复分号加于基本分类号之后,形成新的更专指的分类号。

学生常用的复分号有:

-43 教材

-44 习题、试题及题解

-61 名词术语、词典、百科全书(类书)

-64 表解、图解、图册、地图等

例:R5-43 内科学教材

R654.2-64 心脏外科学解剖图解

H310.42-44 英语水平考级试题

(二)、书刊排架的基本原理

排架就是将已经加工整理的文献按照一定的依据和次序存放在书架上的过程。

1、索取号

索取号是图书馆对书、刊进行排架和索取的依据,因此通常也称为排架号。对于图书又可称为索书号,对于期刊则又可称为索刊号。

索取号的构成一般至少分为两段号码,第一段号码是书、刊排架的主要依据,第二段号码是第一段号码相同时进一步区分和排架的次要依据。因此,索取号的编码方法与各图书馆的排架方法是一致的。总之,索取号的任何编码方法,其目的就是为了科学地组织书刊的排架,尽量使每一本书或刊在书架上都有其唯一的位置和次序,方便馆员管理和读者索取。

2、图书的排架方法

图书排架的方法有多种,比较科学、并被多数图书馆采用的是分类排架法,而分类排架的直接依据是索取号,这时索取号的构成=分类号+书次号。

分类排架时,首先按分类号顺序排,如果分类号完全相同时,再按书次号顺序排。

图书分类号:使同一学科主题的图书相对集中地排列在书架上,起到方便管理和读者查找的作用,多以《中图法》为分类依据。

书次号:使同类号的图书再按其它的方法区分并排列,各图书馆的编号方法有所不同,

有编年法、图书入馆流水号、著者号等等。如我馆采用编年法,中山大学图书馆采用入馆流水号。

索书号位于图书书脊标签上。如:我馆收藏的《圣经的故事》一书,书脊标签上有“B971/7”索书号,其中“B971”为分类号,“7”为书次号。

到书库索取图书时,读者可根据图书的索取号到书库中相应的排架位置快速查找。

3、期刊的排架方法

各馆对期刊排架的方法不尽相同,大体包括分类法、字顺法和年代法等等。因此期刊的索取号构成也不尽相同,主要取决于各馆的排架方法。另外,中文、外文,现刊、过刊也有不同的排架习惯。读者到每个图书馆查找期刊时应注意咨询该馆的排架方法,提高查找效率。

我馆的排架方法。目前我馆的中、外文现刊、过刊排架方法已统一:主要先按分类排,再按书次号排,然后再按期刊年份排序。

(三)、馆藏目录及相关概念的含义

1.馆藏目录的定义

是将文献的外部信息和内容特征著录下来,按照一定的顺序编排而成的一种揭示和报导文献的工具。

2.机读目录的定义(MARC)

是一种以代码形式和特定结构记录在计算机存贮载体上的,能够被计算机识别和编辑输出书目信息的目录。

3.联合目录

是采用图书馆之间相互协作的形式,为提示和报导全国或某一地区内若干图书馆收藏文献(多为外文期刊)的情况而编制的统一目录,其特点是能够反映某一期刊被收藏的多个馆所。

4.全国性联合目录

是指由国家级单位牵头,各地图书馆参加协编,基本能够反映全国收藏情况的联合目录。如《全国西文连续出版物联合目录数据库》、《中西文期刊联合目录》等。

5.地区性联合目录

是指能反映某一地区各图书馆收藏情况的联合目录。如《华东地区西文期刊联合目录》等。

(四)、馆藏机读目录检索途径

1.题名检索途径

是指以书、刊名称或其中的任一关键词为入口检索书刊信息的途径。如:检索《希氏内科学》一书,既可以“希氏内科学”为检索入口,也可以“希氏”或“内科学”等书名中所含的关键词为检索入口。若了解图书馆有无收藏“中华医学检验杂志”这一期刊,可以直接键入刊名进行查找。

2.著者检索途径

一般是指以图书的著者或编者为入口来检索获取图书。如:检索人民大学王长喜编写的英语参考书,可以“王长喜”为检索入口。

3.分类号检索途径

是指以图书或期刊的分类号为入口来检索书刊的途径。如:检索计算机类的图书,可

以“TP3”为检索入口。

4.主题检索途径

是指以图书的主题词为入口检索书刊的途径。如:检索有关哮喘方面的图书,可以“哮喘”为检索入口。

(五)、网上馆藏目录查询

1.登录各大公共图书馆馆目检索

国家图书馆、云南省图书馆等。

2.登录各大科研院所图书馆馆目检索

中国科学院系列图书馆、中国医学科学院图书馆等。

2.登录本地各大高校馆目检索

云南大学图书馆、云南财经大学图书馆、云南师范大学图书馆等。

3.登录外地各大高校馆目检索

北京大学图书馆、清华大学图书馆、复旦大学图书馆、上海第二医科大学图书馆等等。

(六)、馆藏书刊检索举例(略)

第二章数字图书馆

一、数字时代的图书馆

据不完全统计,国内在线图书馆已达到了数百家,尤其是实体图书馆的馆藏文献的数字化,为数字图书馆提供了坚实的资源基础。

1.定义

数字图书馆(Digital Library)是指对文本、图像、语音、视频、软件和科学数据等不同载体、不同地理位置的信息资源经过数字化存储、组织,以计算机网络的方式提供给本地和远程用户存取,以实现资源共享的系统。

2.特性

通俗地讲,数字图书馆就是数字化的信息资源库(或者叫信息数据库),它应有以下几个特性:

(1)资源的数字化,存取的网络化

可以分散,但在统一的标准下建设。

(2)资源的丰富性

(3)资源的共享性

3.数字图书馆的历史

1)1945年,美国著名科学技术管理学家布什(V.Bush)先生在《大西洋月刊》上发表了《诚如我们想象的那样》(As We May Think)一文。文中,他首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来,构思并描述了他所设想的一种能存贮书、记录和通讯的装置。

2)1948年,美国数学家维纳(N.Wiener)成为第一个指出电子计算机将能够在图书馆运作中大显身手的学者。

3)1978年,美国著名图书馆学家兰卡斯特(F.W.Laneaster)发表了《走向无纸的

时代》和《电子时代的图书馆员》两部论著,第一次向世人详细描述了电子图书馆的前景。

4)1979年,英国不列颠图书馆的哈利(A.J.Harley)提出了“虚拟图书馆”的概念。

5)1988年,美国国家科学基金会(NSF)的伍尔夫(W.Wulf)撰写国际合作白皮书,正式提出了数字图书馆的概念。

与此同时,在一些发达国家,如英国、加拿大、日本等国对此极大关注。由于Internet 的迅猛发展彻底地改变了传统信息服务的格局,引发了信息采集、加工、传输及获取方式的根本改变,数字图书馆应运而生。我国在1999年也将数字图书馆纳入国家、大学和科研机构的三至五年发展重点之列,并先后涌现出了一批重大成果。

通过网络传输的信息资源是按统一标准规范加工整合过的数字化信息资源,它包括:图书、戏曲、音乐、舞蹈、电影、文化旅游、农业科技、科普知识、法律知识、文化新闻等。它超越了人们意识中图书的概念。

通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,虽然称之为“馆”,但并不是图书馆实体。是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。

4.数字图书馆的类型

美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各国的数字图书馆的建设起到了极大的推动作用。充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,例如IEEE的早期数字图书馆会议录全文,部分可能要通过付费方式,例如ACM(美国计算机协会)的技术报告等。

目前国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:

5.数字图书馆教育的目的

(1) 让学生了解和掌握数字图书馆各类知识;

(2) 让学生掌握网络检索各类资源的基本技能;

(3) 帮助学生选择最合适的信息检索工具;

(4) 引导学生利用网络重组信息资源和完成相关或非相关的学习、研究任务;

(5) 指导学生对各类信息进行合理利用和正确评价;

(6) 提高学生的社会意识、法律意识和心理行为意识。

6.数字图书馆的结构

不论计算机技术怎样发展,网络结构多么复杂,图书馆信息服务的基本模型始终如一,这就是“信息源—图书馆—读者”构成的三角架构,图书馆充当一个知识整理的中间人的角色。新时代图书馆的信息服务能够更为全面、及时、准确、高效,使信息社会中图书馆得到的作用和效益发挥到极限。

数字图书馆的基本结构图示如图:

二、中国国家数字图书馆

中国国家图书馆是中国的国家图书馆,中国国家图书馆旧称北京图书馆,一般简称“国图”。

中国国家图书馆馆藏宏富,品类齐全,古今中外,集精撷萃。作为国家藏书机构,中国国家图书馆依法接收中国大陆各出版社送缴收藏的出版样书,此外还收藏中国大陆的非

正式出版物,例如各高校的博士学位论文均在中国国家图书馆的收藏之列。是图书馆学专业资料集中收藏地和全国年鉴资料收藏中心。从藏书量和图书馆员的数量看,中国国家图书馆(即北京图书馆)是亚洲规模最大的图书馆,世界上最大的国家图书馆之一,是世界著名的国家图书馆。

中国国家图书馆的藏书可上溯到700多年前的南宋皇家缉熙殿藏书,最早的典藏可以远溯到3000多年前的殷墟甲骨。国家图书馆的馆藏文献中珍品特藏包括善本古籍、甲骨金石拓片、中国古旧舆图、敦煌遗书、少数民族图籍、名人手稿、中国少数民族文献、革命历史文献、家谱、地方志和普通古籍等260多万册(件)。外文善本中最早的版本为1473-1477年间印刷的欧洲“摇篮本”。这部分藏品极为珍贵,闻名遐迩,世界瞩目。截至到2005年,中国国家图书馆的藏书容量达2500多万册,其中价值连城的古籍善本就有200余万册,著名的《永乐大典》、《四库全书》等举不胜举。其中尤以“四大专藏”即“敦煌遗书”、“赵城金藏”、“永乐大典”和“文津阁四库全书”最受瞩目。2007年6月8日,中国国家图书馆获得国家文化部颁布的首届文化遗产日奖。

三、超星数字图书馆及使用

1. 概况及特点

北京世纪超星信息技术发展有限责任公司成立于1993年,长期致力于纸张图文资料数字化技术及相关应用与推广,是国内外数字图书馆和档案自动化方面最重要的整体解决方案提供商和图文资料数字化加工服务商,是国内数字图书资源最丰富的商业化数字图书馆和加工能力最强的纸张资料数字化加工中心。2000年1月,超星数字图书馆正式开通,标志着世纪超星全面转向基于互联网的数字图书业务。

2.超星阅览器(Superstar Reader)

超星阅览器(SSReader)是超星公司拥有自主知识产权的图书阅览器,是专门针对数字图书的阅览、下载、打印、版权保护和下载计费而研究开发的。可以阅读网上由全国各大图书馆提供的、总量超过100万册的PDG格式数字图书,并可阅读其它多种格式的数字图书。超星阅览器具有文字识别、个人扫描功能是国内外用户数量最多的专用图书阅览器之一。

3.超星数字图书馆的使用

购买超星数字图书馆有两种方式:镜像方式和个人流量计费方式。

(1)镜像方式

比较有经济实力的实体图书馆很多都以镜像的方式引进超星数字图书馆全部或部分图书的使用权。

(2)个人流量计费方式

这种阅读方式适合个人购买超星数字图书馆的使用权的用户,或者一个单位内使用电子图书频率不高的单位,读者通过购买超星读书卡的方式成为超星数字图书馆的会员

第三章信息检索基础知识

第一节关于信息

一、信息知识文献

1、信息是由客观世界一切事物发出的、体现它存在和运动状态的信号和消息。信息是普遍存在于自然界、人类社会和人类思维活动中,并随着自然界和人类社会的发展而不断产生新信息。信息具有存储性、传递性、共享性、开发性、时效性。

信息无时无处不在,与人类发展历史须臾不可离,从结绳记事到人上月球,从日常生活到科学研究,人们都在自觉不自觉地利用信息。信息是普遍存在的,一切信息来源于自然界,来源于人类社会,人们的生产、生活、学习、科研以及社会活动都是信息产生的来源。

2、知识是人类社会实践的总结,是人的主观世界对客观世界的概括和反映。人类在社会实践中通过信息对自然界和人类社会发展的运动规律的认识,再通过大脑的重新组合和系统化,就获得知识。

3、文献两个古代概念连在一起使用最早见于《论语·八佾》。

宋代朱熹注:“文,典籍也;献,贤也。”《尔雅·释言》解释说:“献,圣也。”

《中华人民共和国国家标准·文献著录总则》(GB3792.1-83):文献是“记录有知识的一切载体。”

文献有三个要素:要具有一定的知识内容;记录方式;记录知识的物质载体。

二、信息源

信息源既信息的来源。信息源可以积累信息,因此信息源和吸收源之间就形成了信息位差,也称信息势。信息势的存在是信息流和信息交流活动产生的前提。常见的有:口头信息源、实物信息源、文献信息源。

三、各类信息源及其特征

掌握按出版类型划分的十种类型信息及其主要特征。

1、图书( Book ):是一种常用的重要信息源,有单卷本、丛书、专著等版本形式,图书内容丰富、全面、可靠、理论性强、论据充分,提供较为直观的第一手资料。

2、期刊( Journals/Magazine/Periodical ):又称杂志,是指定期或不定期连续出版,并刊载时序号或数序号的出版物。

3、科技报告( Science & Technical Report ):科技报告是有关某一专题研究成果或科研工作记录的报告。

4、会议文献( Conference Document/Conference Paper ):指国内外各种重要会议上发表的论文和报告。

5、学位论文( Dissertation/Thesis ):是高校、科研机构的毕业生为获取某种学位而撰写的论文,包括学士论文、硕士论文和博士论文。

6、政府出版物( Government Publication ):指各国政府部门及其专设机构所发表出版的文献。一般分为行政性文件和科技文献。

7、专利文献( Patent Document ):指专利形成过程中产生的一系列官方文件和有关出

版物的总称,如专利公报、专利文摘、分类表、检索工具、说明书以及与专利有关的法律文献等。

8、标准文献(Standard Literature ):是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定。

9、科技档案( Science and Technology Record ):是生产单位或研究部门在技术活动中形成的技术文件、图纸、图片、原始技术记录等资料,包括任务书、协议书、技术指标、审批文件、研究计划、技术措施、生产工艺等。

10、产品样本(Promotion Material):是对产品的性能、构造、原理、用途、使用方法、操作规程、产品规格等所作的具体说明。

第二节信息检索的含义及类型

一、信息检索的含义

信息检索通常是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法和过程。

信息检索的原理就是将检索提问标识与存贮在检索工具中的标引标识进行比较,凡是双方标识一致的或信息标引的标识包含着检索提问标识的,则将具有该标识的信息从检索工具中输出,输出的信息就是检索命中的信息。

二、信息检索的类型

由于用户的信息需求多种多样,信息检索技术也在不断发生变化,进而产生了多种类型的信息检索。

1、根据检索的内容和查找的对象,信息检索可分为:

①文献检索(Document Retrieval):以文献(包括文摘、題录或全文)为检索对象。

②数据检索(Data Retrieval):以各类数值性数据为检索对象。

③事实检索(Fact Retrieval):以从文献中的事项为检索内容,又称事项检索。

2、根据检索(组织)方式分:信息检索分手工信息检索和机器(计算机)信息检索。

①手工检索(Manual Retrieval) :以手工的方法,利用纸质检索工具,包括图书、期刊、目录卡片等来检索信息资料。

②计算机检索(Computer-based Retrieval):利用计算机检索系统,从存储在计算机里的大量数据中检出用户所需要的信息的一种检索手段。

3、按照检索的运行性质,信息检索分为定题检索和回溯检索。

4、按信息组织方式划分

①全文检索(Full-text Retrieval):检索系统中存储的是具有完整内容的著作、文章等,用户可根据检索需求从中获取有关的章、段、句、节等信息。

②超文本检索(Hypertext Retrieval):超文本是一种按信息之间关系非线性地存贮、组织、管理和浏览信息的计算机技术。超文本检索是以超文本信息资源为检索对象。

③多媒体检索(Multimedia Retrieval) :以文字、图像、声音等多媒体信息为检索内容的检索。

④超媒体检索(Hypermedia Retrieval):用超文本技术管理多媒体信息,即就是超媒体。超媒体检索是以超文本与多媒体两种技术结合的超媒体信息资源为检索对象。

第三节信息检索语言和工具

一、信息检索语言

1、信息检索语言的概念

语言是一种人们用以交流沟通的重要工具。人与计算机对话,需要有计算机语言,人与检索系统对话来实施检索,则需要有检索语言(retrieval language)。

检索语言是用于描述检索系统中信息的内部及外部特征和表达用户信息提问的一种专门语言。

检索的匹配正是通过语言的比较匹配来实现的。检索语言也称索引语言,后者是从检索系统的标引角度出发的,而前者是从用户的信息检索角度出发的。

2、信息检索语言的作用

信息检索语言的作用表现在两个层次上,见下图

3、信息检索语言的种类

4、信息检索语言的构成及其要求

二、检索途径

检索点(access point)是检索的出发点和匹配的依据。

从文献的特征出发,将其特征值与检索系统中标目数据进行计算比较,通过匹配达到检索目的。

每件文献均有内部特征及其相关的外部特征。

反映文献内容特征:分类号和主题词等;

反映文献外部特征:作者、名称和号码检索等。

1.分类检索(classification)途径

分类检索是从文献内容所属的学科类别出发来检索文献,它依据的是一个可参照的分类体系(classification system)。

分类体系按文献内容特征的相互关系加以组织,并以一定的标记(类号)作排序工具,它能反映类目之间的内在联系,包括从属、并列、交替、相关等。

较权威的图书分类法有:

《中国图书馆图书分类法》

《美国国会图书馆分类法》

《杜威十进分类法》

2.主题检索途径

主题(subject)检索是从反映文献内容的有关主题词出发来检索文献,主题是检索点,它对应文献主题概念。检索按主题词的音或形的字顺进行,其方式如查字典、词典。主题词有多种类型:有规范词和自由词,有单元词和多元词,有先组结构和后组结构等。主题词的合理选择与使用对检索结果的优劣直接相关。

3.作者检索途径

作者(author)检索是从文献的作者姓名出发来检索其文献。“作者”广义上还应包括:汇编者(compiler)、编者(editor)、主办者(sponsoring body)、译者(translator)等

此外,还有代表机构、单位的团体作者(corporate author),包括作者所在单位(author's affiliation)。

4.题名检索途径

题名(title)检索是从各种事物的名称出发来检索文献信息。这些名称包括:书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等等,也包括人

名和机构名。检索的对象既包括对应的文献,也包括有关的信息、事项等。比如

个人电话簿(white pages)或公司电话簿(yellow pages),查找的是号码信息。

5.号码检索途径

号码包括文献的编号(number)、代码(code)等,它们是文献信息的一些特有的外部标识,号码检索以号码特征来检索文献信息。号码多种多样,通常用数

字、字母或用它们结合的形式或以分段的方式来表示其各部分的含义。

如科技报告有报告号,还有其合同号、拨款号等;

如专利文献有专利号、入藏号、公司代码等;

如分类号也是号码(特殊的号码检索),等等。

它们各自按号码顺序,或以数序、或以字序、或以混合序列检索。

三、检索工具

即检索性工具书刊,是指积累、报道和查找文献线索的书刊,它是在一次文献的基础上,按照规划和需要编制的二次文献,主要包括书目、索引、文摘和工具书指南。

(一)书目

1、定义

书目即图书目录,是著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道书刊文献的工具。

我国古代书目:按经、史、子、集四部分类编排;

现行书目:大多按《中国图书馆分类法》分类编排;

机读书目都能提供分类、主题、标准书号、题名、著者、出版社、出版时间等多种检索途径。

2、书目的类型

古典书目:有官修书目、史志目录、私家书目、版本目录、推荐书目等。

汉朝刘向在典校古籍时,撰有《别录》。后来,他的儿子刘歆以《别录》为基础撰成《七略》,这是我国第一部分类目录。

现代书目:

(1)登记书目、通报书目、新书目录、推荐性书目、书目之书目

(2)综合性书目、专题(学科)书目、地方文献书目、个人著述目录

(3)馆藏目录、联合目录

(4)现行书目、回溯性书目、新书预告目录、古籍目录

(5)图书目录、报纸目录、期刊目录、丛书目录、方志目录、乐谱目录、非书资料目录

(6)印刷型书目、机读目录、网络版书目

3、书目的作用

(1)揭示和报道文献信息

(2)指引读书治学门径

(二)、索引

1、索引概述

索引是将报刊书籍中某些重要的或有意义的信息,如书名、刊名、篇名、主题、人名、地名等分别摘录出来,按一定方式编排,并注明出处,以供检索的工具。

索引旧称“韵编”、“通检”、“备检”、“引得”(英语Index音译),报刊论文篇名索引也称为“题录”。

2、索引的类型

(1)书籍索引:摘取书籍中的具体内容编制的检索书刊。有字、词、句索引,有人名索引,有地名索引,有篇目索引,有书目索引等。

(2)报刊索引:摘取报刊中论文篇目并注明出处的检索书刊。

(3)书刊索引:把图书文献和报刊论文篇目混合编制的检索工具,多用于专题性索引。

(4)会议录索引:是专门揭示会议文献的检索工具。

(5)引文索引:是以文献资料后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系编排而成的索引。

①《史记人名索引》②《唐诗鉴赏辞典》③《唐诗鉴赏辞典》名句索引部分④《现代英语语法》⑤《现代英语语法》索引部分

3、索引的作用

(1)查询论文资料线索

(2)了解学科学术动态

(3)多途径提供深层次的信息

(4)检索工具的辅助补充

(三)、文摘

1、文摘概述

文摘是用简明扼要的文字摘录文献内容的精华,如论点、论据、数据、结论、提要等,

按照一定方式编排的检索工具。文摘一般都要注明原文出处,因而它同时兼有索引功能。

2、文摘的类型

A.按文摘内容范围划分:综合性文摘、专业性文摘。

B.按文摘编写目的划分:

⑴指示性文摘:主要揭示文献的主要内容和基本观点,也称为“简介”、“提要”。

⑵报道性文摘:是在忠实于原作基础上进行浓缩编写的摘要。它一般用500~800字揭示原文的基本内容、观点、方法、数据、结论、推理的结果等。

⑶题录性文摘:主要著录文献的外表特征,有时作少量的说明和注释。

⑷摘录式文摘:读者在阅读过程中对原文中的妙语佳句、精彩段落、公式数据进行原样摘抄,同时注明出处,以便事后引用的摘录方式。

C.按文摘出版形式划分:期刊式文摘、附录式文摘和卡片式文摘。

3、文摘的特点及作用

(1)通报最新科学文献

(2)节省阅读时间

(3)逾越语言障碍了解学科动态

(4)文摘和索引相互补充

最右图像为《读者文摘》(1922年创刊号)

(四)、工具书指南

工具书指南是收录、报导、评论工具书的工具书,是一种专题注释和评介工具书的书目,也称为工具书举要、工具书选录、工具书简介、工具书使用方法、工具书手册。

国外的工具书指南通常是综合性的,往往大范围地收录工具书,主要反映本国出版的各类工具书。

我国工具书指南既有综合性的,也有社会科学和科学技术各大部类的,还出现了大量单一学科的工具书评介著述。

工具书指南多数是书本式,也有连续出版介绍新工具书的“年报”,还出现了、磁带版、光盘版和网络版等。

《美国工具书年报(ARBA)》以及一些工具书辞典、概论、指南等

以上多为手工检索工具,除此还有机械检索工具(是手工检索工具向计算机检索系统过渡的中间检索工具)、数据库、计算机检索系统等。

(四)检索工具(数据库)的构成

四、信息检索方法

1.常用法:检索工具法

顺查法:由远到近的顺时间查找,可以提高查全率。

倒查法:由近到远的查法,重点是放在近期文献。

抽查法:根据课题研究的特点,抓住该课题研究发展迅速,出版文献较多的年代,

抽取一段时间(几年或十几年)或一段时间内的几个点,再进行顺时查找的检索方法。

2.追溯法:从已有的文献后列参考文献入手,逐一查找原文,从查到的文献后

面的参考文献在逐一查找,直到找到。

3.分段法(循环法):即分段查找法,实际上是两种查找方法的结合。

第四节 信息检索技术与策略

一、信息检索技术

信息检索技术是指利用现代信息检索系统,如联机信息检索、光盘数据库检索和网络

信息检索.全文检索等有关的信息采用相关技术,主要包括布尔逻辑检索技术、位置逻辑

检索技术、截词检索技术和限制检索技术。

①布尔逻辑检索技术

利用布尔逻辑算符进行检索词的逻辑组配,是常用的一种检索技术。在联机检索中,

按照所研究课题的要求,虽然已选定检索词,但是这些单项检索词,尚不能准确地表达用

户对课题提问的语法要求。这时利用布尔逻辑运算符进逻辑组配,才能满足要求。

布尔逻辑组配符有:AND (*)、OR (+)、NOT (-)

★逻辑与:用“AND ”或“*”算符表示,

是一种具有概念交叉或概念限定关系的组配。如要检索“对虾养殖”方面的有关

信息,它包含民“对虾(Shirmp )”“养殖

(culture)”两个立概念。“对虾 AND

殖”或“Shirmp AND culture ”表示两个

概念同时包含在一条记录中。如左图对虾

与养殖交叉阴影部分。使用逻辑与检索技

术,缩小检索范围,增强了检索的专指性,

可提高检索的查准率。

★逻辑或:用“OR ”或“+”算符表示,

是一种具有概念并列关系的组配。如上述

“对虾”可用“Shirmp ”和“penaeus ”

两个词来表达,采用”shirmp OR

penaeus ”,表示这两个并列同义概念在

一条记录或同出现在一条记录中出现。如

左图示“shirmp ”与“penaeus ”的全部。

使用逻辑或技术,扩大了检索范围,能提

高检索信息的查全率。

★逻辑非:用“NOT ”或“-”表示,是一

种具有概念排除关系的检索词组配。如检

索“不包含核能的能源”方面的有关信息,

检索词“Energy ”。“Nuclear ”采用逻辑

非组配为“Energy NOT Nuclear ” ,表示

从“Energy ”.检索出的记录中排除含有“Nuclear energy ”的记录。如左图示。使用逻辑非可排除不必要的概念,能提高

信息检索的查准率,但也会将相关信息剔

除,影响信息检索的查全率。

用布尔逻辑算符组配检索词构成的检索提问式,逻辑算符AND 、OR 、NOT 的运算次序,

在不同的检索系统有不同的规定。检索人员要先了解检索系统的规定,避免逻辑运算次序处理不当造成错误的检索结果。

②位置逻辑检索技术

位置逻辑检索持续术是以数据库原始记录中的检索词之间的特定位置关系为对象的

运算,又称全文检索。它是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术。这种检索技术增强了选词的灵活性,采用具有限定检索词之间位置关系功能的位置逻辑符进行组配运算,可弥补布尔检索技术只是定性规定参加运算的检索词在检索中的出现规律满足检索逻辑即为命中结果,不考虑检索词词间关系是否符合需求,而易造成误检的不足。在不同的检索系统中,位置逻辑算符的种类和表达形式不完全相同,使用位置逻辑检索技术时,注意所利用系统的使用规则。

在位置逻辑符中,常用的位置逻辑算符有(W )与(nW )、(N )与(nN )、(S)、(F )。

★邻词位置逻辑算符:(W )与(nW )和(N )与(nN )

(W ):表示两个词间不得插有其他词或字母,但允许有一空格和标点符号,词序不能

颠倒。即使用(W )算符连接的检索词,已构成一个固定的词组。如:GAS (W )CHROMATOGRAPH 表示检索结果为GAS CHROMATOGRAPH 和GAS —CHROMATOGRAPH 形式才为命中。

(nW ):是由(W )衍生而来,表示两个词间允许插入0至n 个字母,但前后的词序不

许颠倒。如:LASER (1w )PRINTER 表示检索结果中具有“LASER PRINTER ”、“LASER COLOUR PRINTER ”和“LASER AND PRINTER ”形式的均为命中记录。

(N ):表示两词间不能插入任何词,但两词词序可以颠倒。如:“WASTEWATER (N )

TREATEMENT ”表示检索结果中具有“WASTEWATER TREATEMENT ”和“TREATEMENT WASTEWATER ”形式的均为命中记录。

(nN):表示两词间允许插入n个词,且两词词序可以颠倒。

★子字段位置逻辑符:(S)表示两词必须在同一检索字段中,两词的词序可变,中间插入词的数量不限。如:“HIGH (w) STRENGTH (S) STEEL”表示只要在同一个句子中检索出含有“HIG STRENGTH ”和“ STEEL”形式的均为命中记录。

★字段位置逻辑符:(F)表示两个词必须同时出现在同一个字段中,词序可以变化。如:“AIR (W) POLLUTION (F)CONTROL”,表示只要在同一字段中检索出含“AIR POLLUTION”和“CONTROL”形式均为命中记录。

③截词检索技术

截词检索技术是预防漏检提高查全率的一种常用检索技术。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,可节省输入的字符,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。在截词检索技术中,较常用的是后截词和中截词。按所截断的字符数分,有无限截词和有限截词两种。

★后截词,从检索性质上,是满足前方一致的检索。

无限后截词:主要用于同根词。如solubilit用solub?处理,可检索出含有solubilize,solubilization,soluble等同根词的记录。由此可知,在词根后加一个“?”,表示无限截词符号。

有限后截词:主要用于词的单、复数,动词的词尾变化等。如book 用 book? ?处理,表示截一个词,可检索出含有book和 books的记录; acid???表示截两个词,可检索出含有acid,acidic 和acids的记录。由此可知,“?”为截词符,截几个词就在词根后加几个“?”。

中截词:中截词也称屏蔽词。一般来说,中截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。如organi?ation可检索出含有organisation和organization的记录。由此可知,中截词使用的符号为“?”,即用“?”代替那个不同拼写的字符。

从以上各例可知,使用截词检索具有隐含的布尔逻辑或(OR)运算的功能,可简化检索过程。

④限定检索技术

使用截词检索,简化了布尔逻辑检索中的逻辑或功能,并没有改善布尔逻辑检索的性质。使用位置逻辑检索,只能限制检索词之间的相对位置,不能完全确定检索词在数据库记录中出现的字段位置,特别在使用自由词进行全文检索时,需要用字段限制查找的范围。常用的字段代码有标题(TI)、文摘(AB)、叙词或受控词(DE或CT)、标识词或自由词(ID或UT)、作者(AU)、语种(LA)、刊名(JN)、文献类型(DT)、年代(PY)等。这些限制符在不同的系统有不同的表达形式和使用规则,在进行字段限制检索时,应参阅系统及有关数据库的的使用说明,避免产生检索误差。

二、信息检索策略

(一)、检索策略的制定

检索策略就是在分析课题内容的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

(二)、检索步骤

信息检索步骤

信息检索步骤也是检索的过程,它是通过分析检索课题,选择检索工具或者检索系统,

按照一定的方法和途径查找信息的过程。包括分析课题、选择检索工具或者检索系统、选择检索方法、确定检索途径、索取原始文献信息。

现代信息检索作业论文

信息社会,人们把信息、物质与能量一起称为人类社会赖以生存发展的三大要素。信息是促进社会经济、科学技术以及人类生活向前发展的重要因素。一个国家的科技进步和社会发展起来越取决于对信息的开发与利用,谁能充分开发和有效地利用信息资源,谁就能抢占科学技术发展的制高点。 社会的信息化环境使社会对人才的要求更高,信息素质成为现代化人才必备的基本素质之一。当今,信息呈爆炸式增长,不仅如此,信息载体也发生了巨大的变化,除传统纸介质信息外,每天都有大量的磁载体信息、电子版信息及各类网上信息涌现出来,这些浩如烟海的信息的多样性、离散性与无序性及其复杂的检索界面和使用方法,增加了信息利用的难度,极大地影响了人们获取信息的质量与效率。 信息检索方法是实现检索方案中的检索目标所采用的具体操作方法和手段的总称。检索的方法很多,要检索过程中应根据检索系统的功能和检索者的实际需求,灵活运用各种检索方法,以达到满意的检索效果。而检索方法大致有以下几种:1、顺查法,2、倒查法,3抽查法,4追溯法,5分段法,6浏览法。 顺查法:顺查法即根据课题所涉及的学科范围,从有关问题提出的最初年代入手,由远而近、逐年查找,直到查找的信息资料充足为止的方法。这种方法适用于对某一课题的普查,能查找到相当长时期内国内外发表的全部相关文献资料,这种方法查得的信息资料比较全面,漏查的可能性小,查全率较高。其不足之处是工作量大,费时费力。 倒查法:倒查法也称逆查法,即根据所查课题的时间范围,由近期向远期回溯查找文献资料的方法。此法适用于一些新课题、新观点、创新理论、革新技术等信息资料的检索,重点查检近期的信息资料,检索是按时间顺序由近期的新内容往远期旧内容逐年查找。其特点是速度快、效率高、省时、新颖性强,但漏查率比顺查法高,查得的信息资料不及顺查法的全面、系统不。 抽查法:抽查法是针对某一学科发展变化的特点及特定的发展阶段,查检特定时间范围内信息的一种方法。具体是以该学科文献信息发表的年代作为检索入口,来进行信息检索。此方法的特点是省时、省力,能获得较多的相关的信息资料。利用抽查法必须注意所查学科的特点及发展史,不然漏查的概率大,检索效率不高。 追溯法:追溯法是利用原始文献后面所附的参考文献和有关论著的引文注释进行追踪检索的一种方法。其检索到的文献系统性较强,内容比较集中,不足之处是漏检和误检的概率大,查检效率不高。 分段法:这是将常用法与追溯法交替使用的一种方法。既利用工具书检索文献,又利用文献后面的参考文献进行追溯,两种方法交替使用,直到满足读者需要为止。这种方法可根据文献和本单位工具书收藏的情况,分期分段交叉运用不同的查找方法,既能获得一定时期内的文献,还可节约查找时间。 浏览法:浏览法又称直接查找法。就是检索者从本专业最新核心期刊或者其他文献中直接阅读原文或浏览最新目次而获取原文的方法。因为浏览法查得的文献往往不全面、不系统,且局限性较大,所以不能作为查找文献信息的主要方法。 综上所述,文献检索方法很多,常常要因人因事而异,根据检索要求灵活应用,尽可能避免漏检和误检,以提高文献的查全率和查准率。 在浩如烟海的信息中,不设置检索点犹如大海捞针,很难找到所需要的信息资料。为了更好地利用信息,人们根据每件信息的内部和外部特征而设置了检索点,以此作为检索信息的入口。一般来说,设置的信息检索点主要有分类、主题、名称、著者、代码等。所以检索界面应该给用户提供较好的检索起始方式。没有任何内容的屏幕或空白的登陆表格都无法给用户提供有关如何开始检索过程的信息。在这一阶段,用户通常无法给出有关其信息需求的全面详细的描述。研究表明,用户倾向于以一个简短的查询作为起点,仔细观察相应结果,之后修改查询,如此循环往复。最初的查询可以看成一种“试水”,通过它可以得到有关可能返回的检索结果以及如何重构查询的信息。因此,信息存取界面的一项任务就是帮助用户选

信息检索试题

信息检索试题 单项选择题: 1、以下各项属于二次信息的是(A ) A、索引 B、期刊 C、学位论文 D、百科全书 2、下列文献中属于一次信息的是( A ) A、专利说明书 B、百科全书 C、目录 D、综述 3、年鉴属于下列哪一类别( D ) A、零次信息 B、一次信息 C、二次信息 D、三次信息 4、( C )是出版周期最短的定期连续出版物。 A、图书 B、期刊 C、报纸 D、学位论文 5、为了有效地存储和传播知识,人类利用各种( C )来记录信息。 A、知识 B、文献 C、载体 D、视听资料 6、报道范围主要为能源方面的科技报告为(D )。 A、AD B、PB C、NASA D、DOE 7、了解各个国家政治、经济、科技发展政策的重要信息源是( B ) A、科技报告 B、政府出版物 C、标准文献 D、档案文献 8、利用截词技术检索“?英语考试”,以下检索结果正确的是(D ) A、英语四级考试 B、英语考试成绩 C、英语考试报名 D、六级英语考试 9、我国最早的分类法是( B) A、《中经新簿》 B、《七略》 C、《四库全书总目》 D、《隋书经籍志》 10、《四级英语阅读与完型填空》这本图书的分类号是( D )。 A、G636.33 B、G216.2 C、I247.4 D、H319 11、按照《中国图书馆分类法》,《新编六级英语阅读解析》这本书应属于哪个类目(A )。 A、H大类 B、I大类 C、T大类 D、O大类 12、《信息检索》这本书的分类号为G252.7,这是按照( B )分类。 A、科图法 B、中图法 C、杜威分类法 D、刘国钧分类法 13、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A ) A、检索出除了中年教师以外的在职人员的数据

试信息检索试题

试信息检索试题 V:1.0 精选试题 试信息检索试题 2 2 020- -4 4- -1 1 信息检索试题一、单项选择题 1、具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( )。 A 图书 B 会议文献 C 学位论文 D 期刊 2、( )文献是最基本的文献形式,( )文献是文献的发展方向。 A 印刷型、缩微型 B 声像型、电子型 C 印刷型、电子型 D 缩微型、声像型 3、机检的效果与检索人员的素质有着密切的关系。人员的素质主要包括( )。 A 对检索策略的掌握程度 B 对数据库的掌握程度 C 对检索语言的掌握程度 D A、B、C三项 4、下列文献中属于二次文献的是 A 综述 B 索引 C 手册 D 论文

5、下列不是特种文献的有 A 专利文献 B 学位论文 C 政府出版物 D 电子图书 6、()是用来描述文献信息的内容特征、外部特征,形成信息标识并赖以组织信息的依据。 A 分类语言 B 主题语言 C 检索语言 D 自然语言 7、计算机检索系统中的全文字段主要适用于( ) A 课题包含的概念较少,通过摘要字段查到的文献很少。 B 课题包含的概念较多,通过篇名字段查到的文献很少 C 课题包含的概念较少,通过篇名/关键词/摘要字段查到的文献很少 D 课题包含的概念较多,通过篇名/关键词/摘要字段查到的文献很少 8、利用图书馆的公共查询系统(OPAC)查找图书时,如果检索途径选择主题词,则下列检索词不正确的是 A C语言 B O11 C 计算机 D 磁控管 9、信息资源检索如按检索结果的内容划分可分为三大类,以下不属于此划分法的是 A 文献信息检索 B 多媒体检索 C 数据信息检索 D 事实信息检索 10、专利文献提供技术信息具有以下特点

《现代信息检索》完整备课教案

《现代信息检索》 授课教案 2010年9月

学期授课计划说明

六安职业技术学院教案 2010~2011学年度第 1 学期编号 1 信息工程系计算机教研室任课教师熊冠静课程名称《现代信息检索》 授课章节第1 章现代信息检索概述

教学过程主要环节设计 一.导入新课: 本章基本内容 随着科学技术的飞速发展,现代社会进入了知识时代,文献信息资源层出不穷。文献信息资源的类型按载体形式可分为印刷型、缩微型、视听型、机读型。按出版形式可分为图书、连续出版物、非书资料、舆图资料以及电子资源。从文献加工处理的深度划分,可分为一次文献、二次文献、三次文献。一次文献是指直接记录观察、发现、科研成果而形成的文献。二次文献是指文献工作者对一次文献进行整理、加工、编排而形成的文献,是为报道、检索、管理、利用一次文献而出现的一种文献形式。三次文献是指根据需要对一次文献和二次文献所载的内容进行选择,经分析研究、综合加工而成的文献。 1.1 检索工具的类型与作用 检索工具是指用于报道、存储和查找文献信息资源线索的工具和设备的总称,是以一次文献为基础,在广泛收集并经过严格筛选后,对其进行描述、标引或汇集,充分揭示其物质外形特征和内容特征,并按一定的规则组织而成的。 检索工具的作用在于帮助用户及时、快速、全面、系统地查找分散在各处的文献信息资源。检索工具的类型繁多,按文献信息资源的收录范围可分为综合性检索工具和专科性检索工具两大类型;按其载体形式可分为书本式工具书、卡片检索工具、光盘检索工具以及数据库。无论是书本式工具书,还是数据库均是知识时代人们检索和获取文献信息资源的工具,都具有存储和检索两种功能。但信息存储与检索的手段不同,前者采用手工检索,后者采用计算机检索。 1.2 检索汉字常用的检字法 1.2.1 汉语拼音音序法 汉语拼音音序法是一种将汉字依照《汉语拼音方案》所规定的拼音字母顺序

信息检索考试题汇总(附答案)

4.国际标准书号的英文简称ISBN,新版国际标准书号2007年正一、单项选择题(从下列各题四个备选答案中选出一个正确答案,式实施,国际标准书号由10位升至13位。(√)并将其代号写在答题纸相应位置处。每题2分,共30分) 5.检索效果的评 价指标主要有查全率和漏检率。(×) 1._C_是题录型检索工具 1.NSTL是(国家科技图 书文献中心)的简称。 A.CABIB.中国学术期刊文摘 C.全国报刊索引(自然版)D.经济纵2.(信息检索系统)是指由一定的设备和信息集合构成,具有一横定存储、检索与传送 技术设备,提供一定的存贮与检索方法及检 2.浏览超星数字图书馆,应首先安装 __D_____. 索服务功能的工作系统。体系分类表通常由(类目表、标记符号、说明和注释、类目索 3.世界上第一大联机检索系统是_A_。引)4个部分组成。 A.DIALOG系统B.OBRIT系统C.OCLC系统D.STN系统 4.正式出版的中文期刊在检索工具和数据库中一般 着录有国际 4.利用baidu搜索信息时,要将检索范围限制在网页标题中,应标准刊号(ISSN)和国内统一刊号(CN)。该使用的语法是___B_______。 5. A.site: B.intitle: C.inurl: https://www.wendangku.net/doc/d08603027.html,: (JournalofAnalyticalChemistry)。 5.国际农 业和生物科学中心英文名称的简称为_A。 6.CASHL是指(中国高校人文社会科学文献中心),其英文全称是ChinaAcademicSocialSciencesandHumanitiesLibrary,是全 6.信息 检索根据检索对象不同,一般分为___C___________。国性的、唯一的人文社科外文期刊 收藏和服务中心。2002年开始 A.二次检索、高级检索 B.分类检索、主题检索规划建设,2004年3月15日正式启动 C.数据检索、事实检索、文献检索D.计算机检索、手工检索7.电子期刊,指以(数字或称电子)形式出版发行的期刊,英文7.国际上评价期刊最有 影响力的一个指标是___A_____。为(electronic A.影响因子B.读者统计数据C.引文量D.价格 Journal),简称e-journal. 8.二次检索指的是:___C__________。 8.国家知识 基础设施(NationalKnowledgeInfrastructure,NKI)A.第二次检索B.检索了一次之

信息检索考题及答案教学文稿

信息检索考题及答案

一、单选 1、报道范围主要为能源方面的科技报告为( D、)。 2、(C报纸)是出版周期最短的定期连续出版物。 3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物) 5、年鉴属于下列哪一类别(D三次信息) 6、下列哪种文献属于一次文献(A图书)。 7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A索引) 21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。 23、布尔逻辑表达式:在职人员(中年教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据) 24、布尔逻辑检索中检索符号“”的主要作用在于( B提高查全率)。 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索) 27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。 28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。 29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。 30、利用截词技术检索“?”,以下检索结果正确的是(D ) 31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。 32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。 33、我国最早的分类法是(B 《七略》) 34、要查找吴敬琏所发表的文章,首选途径为(C责任者途径)。 I)主题较复杂、研究范围较大、研究时间较久的科研课题适用的检索方法为(A顺查法) B追溯法)检索方法而编制出来的检索II)《科学引文索引》是基于( 工具: A词典): III)下列检索工具哪个不属于事实数据检索工具( C网络检索工具) IV)按检索手段分,搜索引擎属于( D、)格式文件。 64、可以阅读( A国际标准刊号)的缩写。 65、是(

中国科学院大学现代信息检索课后习题答案

《信息检索导论》课后练习答案 王斌 最后更新日期 2013/9/28 第一章布尔检索 习题1-1 [*] 画出下列文档集所对应的倒排索引(参考图1-3中的例子)。 文档 1 new home sales top forecasts 文档 2 home sales rise in july 文档 3 increase in home sales in july 文档 4 july new home sales rise 习题1-2 [*] 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; 解答: breakthrough 1 0 0 0 drug 1 1 0 0 for 1 0 1 1 hopes 0 0 0 1 new 0 1 1 1

patients 0 0 0 1 schizophrenia 1 1 1 1 treatment 0 0 1 0 b. 画出该文档集的倒排索引(参考图 1-3中的例子)。 解答:参考a。 习题1-3 [*] 对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么? a.schizophrenia AND drug 解答:{文档1,文档2} b.for AND NOT (drug OR approach) 解答:{文档4} 习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。如果不能的话,那么我们能达到的时间复杂度是多少? a.Brutus AND NOT Caesar b.Brutus OR NOT Caesar 解答: a.可以在O(x+y)次完成。通过集合的减操作即可。具体做法参考习题1-11。 b.不能。不可以在O(x+y)次完成。因为NOT Caesar的倒排记录表需要提取其他所有词项对应的倒 排记录表。所以需要遍历几乎全体倒排记录表,于是时间复杂度即为所有倒排记录表的长度的和 N,即O(N) 或者说O(x+N-y)。 习题1-5 [*] 将倒排记录表合并算法推广到任意布尔查询表达式,其时间复杂度是多少?比如,对于查询 c.(Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 我们能在线性时间完成合并吗?这里的线性是针对什么来说的?我们还能对此加以改进吗? 解答:时间复杂度为O(qN),其中q为表达式中词项的个数,N为所有倒排记录表长度之和。也就是说可以在词项个数q及所有倒排记录表长度N的线性时间完成合并。由于任意布尔表达式处理算法复杂度的上界为O(N),所以上述复杂度无法进一步改进。 习题1-6 [**] 假定我们使用分配律来改写有关AND和OR的查询表达式。 a. 通过分配律将习题1-5中的查询写成析取式; 12 b. 改写之后的查询的处理过程比原始查询处理过程的效率高还是低? c. 上述结果对任何查询通用还是依赖于文档集的容和词本身? 解答: a. 析取式为:(Brutus And Not Anthony And Not Cleopatra) OR (Caesar AND NOT Anthony AND NOT Cleopatra) b. 这里的析取式处理比前面的合取式更有效。这是因为这里先进行AND操作(括号),得到的倒排记录表都不大, 再进行OR操作效率就不会很低。而前面需要先进行OR操作,得到的中间倒排记录表会更大一些。 c. 上述结果不一定对,比如两个罕见词A和B构成的查询 (A OR B) AND NOT(HONG OR KONG),假设HONG KONG一 起出现很频繁。此时合取方式可能处理起来更高效。如果在析取式中仅有词项的非操作时,b中结果 不对。 习题 1-7 [*] 请推荐如下查询的处理次序。 d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

信息检索题库(含答案)

注意: 1、通读教材,根据页码提示完成下列题目。 2、最后一次上机课在线测试,范围不超出如下题 目。 第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D)。A、AD B、PB C、NASA D、DOE{第7页} 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文{第6页} 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献{第6页} 4、了解各个国家政治、经济、科技发展政策的重要信息源是(C)A、科技报告B、政府出版物C、标准文献D、档案文献{第8页} 5、年鉴属于下列哪一类别(D)A、零次信息B、一次信息C、二次信息D、三次信息{第5页} 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书C、综述D、文摘{第4页} 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述{第4页} 8、以下各项属于二次信息的是(A )A、索引B、期刊C、学位论文D、百科全书{第4页} 二、多选 9、二次信息主要包括(CD)等。A、手册B、年鉴C、目录D、题录{第4页} 10、信息的属性包括(ABCD)A、客观性B、时效性C、传递性D、共享性{第3页} 11、信息素质的内涵主要包括(ABC)。A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页} 12、以下类型的信息属于三次信息的是(BC)。A、目录B、词典C、百科全书D、科技报

告{第4页} 三、判断 13、档案文献具有原始性特点,客观真实地反映了历史。(∨){第8页} 14、年鉴和百科全书属于二次信息。(×){第4页} 15、图书一般不能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。(∨){第6页} 16、文献信息源是各种信息源中检索与利用的主体。(∨){第3页} 17、一次信息也称为第一手资料,如书目和索引。(×){第4页} 18、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。(×){第4页} 19、知识被包含于信息,是信息的组成部分。(×){第2页} 20、专利说明书属于二次信息的范畴。(×){第4页} 第二章 一、单选 21、(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。A、查全率 B、查准率 C、误检率 D、漏检率{第43页} 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D)。A、G636.33 B、G216.2 C、I247.4 D、H319{第21页} 23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)A、检索出除了中年教师以外的在职人员的数据B、中年教师的数据C、中年和教师的数据D、在职人员的数据{第34-35页} 24、布尔逻辑检索中检索符号“OR”的主要作用在于(C)。A、提高查准率B、提高查全率C、排除不必要信息D、减少文献输出量{第35页} 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C)。A、目录B、题录C、索引D、文摘{第30页} 26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A )A、全文检索B、文献检索C、超文本检索D、超媒体检索{第14页}

现代科技信息检索期末试题

《现代科技信息检索》期末试题 学号____________ 姓名___________ 请从以下六道试题中任选五道完成。 一、查找我校图书馆有关“信息论与编码”方面的中文图书?如果图书馆没有收藏某图书(电子版、纸本都未收藏),可从哪些途径获得该书的书目信息和馆藏信息?(20分) 二、利用我校购买的“中国知网(CNKI)”数据库进行检索:(20分) 1、查找2005年以来有关“数字信号处理“的期刊论文 2、查找作者单位为“中南民族大学电子信息工程学院”的所有期刊论文。 三、我校购买的IEEE/IEE Electronic Library数据库进收录了哪些学科的文献?利用该数据库查找“Digital Signal Processing”方面的文献。(20分) 四、影响查全率和查准率的因素分别有哪些?请结合自己的检索实践,回答如何分别提高查全率和查准率。(20分) 五、网络信息检索工具有哪些评价标准?请列出6种以上的主要指标。并以“光频检测器”为关键词,分别选用两种搜索引擎查找相关资料,参照搜索引擎评价标准,简单评价分析这两种搜索引擎。(20分) 六、动物体细胞克隆技术是世纪生物领域中最令人振奋的新技术之一,它不仅对农业与畜牧业生产具有现实意义,同时对生命科学相关领域的基础研究、临床医学和畜牧业等快速发展提出了新的研究课题。请利用你所掌握的信息源查找有关克隆技术的相关文献,完成下列提问。(20分) 1、克隆的含义是什么? 你是通过何种途径获取关于克隆含义的信息? 2、克隆技术已展示出广阔的应用前景,概括起来大致有以下四个方面: 培育优良畜种和生产实验动物 生产转基因动物; 生产人胚胎干细胞用于细胞和组织替代疗法; 复印濒危动物物种,保存和传播动物物种资源 请选择合适的文献信息源,分别就这四个方面的应用查找一篇文献,并将文献基本信息填写如下。 3、请在网上查找有关克隆技术的新闻,选取一条将其基本信息记录下来。

现代信息检索作业

运城学院 《现代信息检索》 系别:应用化学 专业:化学 班级:1101 姓名:张丹 学号:2011080145

这个学期我学习了想《现代信息检索》这门课程,从中学到了很多关于信息检索的知识,以下就是我对这门课程的总结。 信息社会,人们把信息、物质与能量一起称为人类社会赖以生存发展的三大要素。信息是促进社会经济、科学技术以及人类生活向前发展的重要因素。一个国家的科技进步和社会发展起来越取决于对信息的开发与利用,谁能充分开发和有效地利用信息资源,谁就能抢占科学技术发展的制高点。 社会的信息化环境使社会对人才的要求更高,信息素质成为现代化人才必备的基本素质之一。当今,信息呈爆炸式增长,不仅如此,信息载体也发生了巨大的变化,除传统纸介质信息外,每天都有大量的磁载体信息、电子版信息及各类网上信息涌现出来,这些浩如烟海的信息的多样性、离散性与无序性及其复杂的检索界面和使用方法,增加了信息利用的难度,极大地影响了人们获取信息的质量与效率。 信息检索方法是实现检索方案中的检索目标所采用的具体操作方法和手段的总称。检索的方法很多,要检索过程中应根据检索系统的功能和检索者的实际需求,灵活运用各种检索方法,以达到满意的检索效果。而检索方法大致有以下几种:1、顺查法,2、倒查法,3抽查法,4追溯法,5分段法,6浏览法。 顺查法:顺查法即根据课题所涉及的学科范围,从有关问题提出的最初年代入手,由远而近、逐年查找,直到查找的信息资料充足为止的方法。这种方法适用于对某一课题的普查,能查找到相当长时期内国内外发表的全部相关文献资料,这种方法查得的信息资料比较全面,漏查的可能性小,查全率较高。其不足之处是工作量大,费时费力。 倒查法:倒查法也称逆查法,即根据所查课题的时间范围,由近期向远期回溯查找文献资料的方法。此法适用于一些新课题、新观点、创新理论、革新

大学—医学信息检索——考试题库与答案

单选题 1、下列哪个文献的类型是属于零次文献:B 2、我国首次开通国际联机情报检索是在(C)。 3、我国首次开通国际联机情报检索是在(A)。 4、下列属于文献的外表特征的选项是(D)。 5、下列哪个文献的类型不属于三次文献( A)。 6、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是( A)。 7、用Google准确搜索重庆医科大学应用技术学院有关资料应使用(C) 8、下列哪一过程是文献检索过程的最后一步(A)。 9、中文医学文献文摘式检索工具是(D)。 10、通用载体通常指的是(A)。 11、关键词可帮助读者在检索中:(D ) 12、下列属于二次文献的是:(A) 13、下列属于文献内容特征的是(B )。 14、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是:(A ) 15、用Adobe Reader可以阅读下列哪种格式的文章。A 16、下列哪一过程是文献检索过程的最后一步:(C) 17、下列属于文献内容特征的是:(A ) 18、下列哪一个是供读者使用的查阅IM的指南(D) 19、利用《中文科技资料目录》(医药卫生)查找有关“中药治疗高血压”方面的文献,如果从主题途径查找,本课题的检索策略是(A)。 20、下列属于三次文献的是:(D ) 21、下列哪个文献的类型不属于一次文献(C )。 22、属于文献内容特征的选项是(D) 23、某护士检索有关“哮喘患者自理行为”方面的文献,她从现在的开始往前逐年进行文献24、查找,此种检索方法称为:(A) 25、不属于文献外部特征的是(B)。 26、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现以下哪个字段代表的是文献的“著者”? :(D) 27、在《中文科技资料目录》(医药卫生)中,护理学的分类号为(D)。 28、在中国生物医学文献光盘数据库(CBMdisc)的记录中,代表文献“题目”的字段是(A )。 29、使用搜索引擎进行信息检索时,下列措施中对提高查全率没有帮助的是D 30、CBMdisc35个字段中AF代表的是(A)。 30、在中国生物医学文献光盘数据库(CBMdisc)的记录中出现的“AU”字段代表的是:(A ) 31、下列哪个文献的类型是属于零次文献(B )。 32、下列属于文献的外表特征的选项是(C )。 33、利用综述文献后面所附的参考文献进行文献查找的方法称为(C)。 34、在中国生物医学文献光盘数据库(CBM disc)的记录中出现的“AB”字段代表的含义是:(A) 35、选项中哪一种文献属于一次文献(C )。 36、使用搜索引擎进行信息检索时,下列措施中对提高查准率有帮助的是D 37、下列哪个数据库是全文数据库?A 38、检索有关脑卒中康复效果及影响因素研究的中文相关文献,下列检索策略中,较好的检索式应为(C)

信息检索考试题汇总(附答案)

一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在答题纸相应位置处。每题2分,共30分) C 1. _是题录型检索工具 A. CABI B.中国学术期刊文摘 C.全国报刊索引(自然版) D.经济纵横 D 2. 浏览超星数字图书馆,应首先安装______. A. Apabi Reader B. Adobe Reader C. CAJ Viewer D. SSReader A 3. 世界上第一大联机检索系统是__。 A.DIALOG系统 B.OBRIT系统 C.OCLC系统 D.STN 系统 B 4. 利用baidu搜索信息时,要将检索范围限制在网页标题中,应该使用的语法是_________。 A.site: B.intitle: C. inurl: https://www.wendangku.net/doc/d08603027.html,: A 5.国际农业和生物科学中心英文名称的简称为_ 。 A.CABI B. AGRINDEX C. BA D.B of A C 6.信息检索根据检索对象不同,一般分为_____________。A. 二次检索、高级检索 B.分类检索、主题检索 C.数据检索、事实检索、文献检索 D.计算机检索、手工检索 A 7. 国际上评价期刊最有影响力的一个指标是 _______。 A. 影响因子 B.读者统计数据 C.引文量 D.价格 C 8. 二次检索指的是:_____________。 A.第二次检索 B.检索了一次之后,结果不满意,再检索一次C.在检索结果中运用“与、或、非”进行再限制检索 D.以上都不是 A 9.国际连续出版物编号____________。 A.ISSN B.OCLC C.ISBN D. CSSCI B 10.下列搜索引擎具有书名号检索功能的有_____________。A.Google B.百度 C.中搜 D.AltaVista B 11.《中文核心期刊要目总览》2004 版的“农业经济”类核心期刊有___ 种。 A.20 B.19 C.17 D.15 B 12.通过追溯检索获得的相关文献与原文献相比在发表时间上____。 A.早 B.晚 C. 相同 D. 不确定 B 13.在维普中文期刊全文数据库中“在检索结果中”检索相当于。 A.逻辑“非” B.逻辑“与” C.逻辑“或” D.逻辑“加” D 14.检索语言中,是自然语言。 A.标题词 B.主题词 C.单元词 D.关键词 A 15.在baidu搜索引擎中,要实现字段的精确检索,可以用来限定。 A.“”(双引号) B.()(括号) C.+ (加号) D.-(减号) 二、判断正误(在正确答案后面划√,在错误答案后面划×,每小题2分,共10 分) 1.专利文献根据发明创造的性质可以分为发明、实用新型和外观设计专利。(√)2. CNKI检索系统可以检索博硕士论文。(√) 3. Google不具有学术搜索功能。(×) 4.国际标准书号的英文简称ISBN,新版国际标准书号2007年正式实施,国际标准书号由10位升至13位。(√) 5.检索效果的评价指标主要有查全率和漏检率。(×) 1.NSTL是(国家科技图书文献中心)的简称。 2.(信息检索系统)是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。 3.体系分类表通常由(类目表、标记符号、说明和注释、类目索引)4个部分组成。 4. 正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号(ISSN)和国内统一刊号(CN)。 5. 缩写刊名“J.Anal.Chem.”还原成原刊名为(Journal of Analytical Chemistry)。 6. CASHL是指(中国高校人文社会科学文献中心),其英文全称是China Academic Social Sciences and Humanities Library,是全国性的、唯一的人文社科外文期刊收藏和服务中心。2002年开始规划建设,2004年3月15日正式启动 7. 电子期刊,指以(数字或称电子)形式出版发行的期刊,英文为(electronic Journal),简称e-journal. 8. 国家知识基础设施(National Knowledge Infrastructure,NKI)的概念,由世界银行提出于1998年。CNKI是指(中国基础知识设施工程),它是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于(1999)年6月。 https://www.wendangku.net/doc/d08603027.html,KI平台的检索方式有(单库检索)、(跨库检索)、(数据库导航),在单库和跨库检索中有(初级)、(高级)、(专业)三种检索方式。 10.(报告号)是识别科技报告的显著标志。 11. 专利文献著录中,除了和专利有关的(专利名称)、(发明人)和(专利权人)等之外,还著录有(专利公布号)、(国际专利分类号)、(优先权号),有的还有申请号和申请日期、公布日期等。 13. 分类检索语言又称分类法,是用(分类号)和(类名)来表达信息的主题概念,并且按照知识门类的逻辑次序将信息系统地组织和划分的语言。 14. 对于刊名缩写,国际标准化组织ISO在1972年和1974年分别发布了两个相关标准,规则要点有: 1)刊名中的(前置词、冠词、连词)均省略; 2)刊名必须有(两个)词以上才可用缩写; 3)单词的缩写大多数采用(减少音节)的方法,如“Chemistry”缩写成(chem),只有极少数常用单词用首字母表示,如“Journal”缩写成(J); 4)刊名缩写时,刊名第一个单词的首字母一定要(大写)。 .

现代信息检索课程学习心得

现代信息检索课程 学习心得 系别:生命科学系 班级:0903班 姓名:马昕 学号:2009140361 指导老师:何志林

2012-06-13 现代信息检索课程学习心得 走过了大学的四分之三,即将升入大四,也即将面临毕业论文的写作,但是对于文献的检索却知之胜少,所以这学期选修了何志林老师的现代信息检索课程,这门课程给我带来了不少收获。 文献检索课程是高校教学中不可缺少的一门课程,是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法,是信息素养教育中重要的组成部分,是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我

们来说,文献检索十分有必要,而且我们必须好好掌握这样一门课程。 科技文献检索与论文写作这门课程是最实用的课程之一,学习这门课程的目的是学会利用信息检索如何最快最准确的搜索想要的信息。文献检索作为一种工具,能通过他人的知识而对前人研究继承,发展和创新,通过研究思路和方法的学习和借鉴来进一步进行自己的研究,对于我们以后写毕业论文会有很大的帮助。文献信息资料是学习和研究工作的基础,各项学习和研究工作都将根据我们搜集到的文献信息资料来开展。信息资源越丰富,学习和研究工作成功的可能性就越大。面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息?这就需要具备文献检索的基本技能,通过文献检索,可以获取学术动态;通过文献检索可以寻找未知问题的答案;通过文献检索可以培养信息意识、提高自学的能力,可以说,同学们平时的学习及毕业论文的写作等都与文献检索密切相关。 在此次文献检索课程中,通过老师的介绍,我不仅了解到了信息检索方面的基础知识,如文献可以分为期刊,专利,会议资料,学位论文,科技报告等,并了解到了很多检索系统,如维普数据库,中国期刊全文数据库,EI,EBSCOhost ,SpringerLink ,超星电子图书,方正Apabi电子图书等。并了解到了各种数据库的特点,如:维普数据库中主要是期刊,万方学位论文数据库的检索结果多样性,EBSCO 是全球最早推出全文在线数据库检索系统的公司之一,在SCI中则可以查到各个领域的论文,研究成果,Springer则收录了各个领域的

信息检索考题

单选题(每题1分,共45题,45分) 1.下列哪种属于一次文献(未作答)正确答案:A A.期刊论文 B.百科全书 C.综述 D.文摘 2.下列哪种属于二次文献(未作答)正确答案:D A.专利文献 B.学位论文 C.会议文献 D.目录 2.学位论文是(未作答)正确答案:B A.零次文献 B.一次文献 C.二次文献 D.三次文献 3.题录是(未作答)正确答案:C A.零次文献 B.一次文献 C.二次文献 D.三次文献 2.百科全书是( D )。正确 A.零次文献

C.二次文献 D.三次文献 4.下列哪种属于三次文献(未作答)正确答案:C A.标准文献 B.学位论文 C.综述 D.目录 5.科研利用率最高的是(未作答)正确答案:D A.图书 B.学位论文 C.会议文献 D.期刊 17.用主题词进行检索,一般可检索出对应的(未作答)篇文献。正确答案:D A.1 B.2 C.3 D.多 1.计算机中使用的"0"与"1"的二进制代码是(未作答)正确答案:C A.自然信息

C.机器信息 D.人类信息 6.以下数据库中收录期刊最全的是(未作答)。正确答案:A A.维普 https://www.wendangku.net/doc/d08603027.html,KI C.万方 7.影响因子是评价(未作答)的重要指标。正确答案:D A.图书 B.报纸 C.论文 D.期刊 12.等级体系分类法以文献的(未作答)为对象。正确答案:B A.出版时间 B.学科性质 C.主题概念 D.题名 29.对工具书进行检索,最好选择(未作答)正确答案:A A.中国知网 B.中国高等教育文献保障系统 C.中刊库 D.万方学位论文数据库

20.利用分类途径进行检索,其检索标识是(未作答)正确答案:C A.主题词 B.关键词 C.分类号 D.分子式 6.主题法用(未作答)做描述文献主题的标识和检索标识。正确答案:B A.分类号 B.词语 C.阿拉伯数字 D.英文字母 21.OCR电子图书指的是( D )正确答案:B A.扫描书 B.光学字符识别书 C.直接录入的电子图书 D.格式转换电子书 1.以下(未作答)不是信息的基本要素。正确答案:B A.载体 B.数据库 C.信源 D.信宿 3.以下(未作答)不是信息的特征。正确答案:D A.共享性

信息检索考题及答案

一、单选 1、报道范围主要为能源方面的科技报告为( D、DOE)。 2、(C报纸)是出版周期最短的定期连续出版物。 3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物) 5、年鉴属于下列哪一类别(D三次信息) 6、下列哪种文献属于一次文献(A图书)。 7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A 索引) 21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。 22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。 23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据) 24、布尔逻辑检索中检索符号“OR”的主要作用在于( B提高查全率)。 25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。 26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索) 27、截词检索中,“”和“*”的主要区别在于(A 字符数量的不同)。 28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。 29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A)表示有限检索。 30、利用截词技术检索“ake”,以下检索结果正确的是(D take) 31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。 32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。 33、我国最早的分类法是(B 《七略》) 34、要查找吴敬琏所发表的文章,首选途径为(C责任者途径)。 主题较复杂、研究范围较大、研究时间较久的科研课题适用的检索方法为(A顺查法) 《科学引文索引》是基于(B追溯法)检索方法而编制出来的检索工具: 下列检索工具哪个不属于事实数据检索工具(A词典): 按检索手段分,搜索引擎属于(C网络检索工具) Adobe Reader可以阅读(D、PDF )格式文件。 ISBN是( A国际标准刊号)的缩写。 超星数字图书馆可以为我们提供( A图书的原文) 浏览超星数字图书馆,应首先安装(D、SSReader )。 下列不属于图书特点的是(D信息较新颖) CAJviewer(俗称:CAJ阅读器)是(A 超星数字图书馆)数据库的全文阅读软件。EBSCO数据库中,输入检索词“Chin﹡”表示要求查出含有(A、 Chin词干后允许有一个字母)变化的单词的文献 查找中文科技期刊数据库,如选择作者字段,检索“曙光”,精确检索和模糊检索得到的检索结果(B模糊检索多)。 对于中国期刊全文数据库(CNKI)的使用权限的说法,(A从任何公网终端都可访问其全文信息)是不正确的。 二次检索指的是(C在上一次检索的结果集上进行的检索)

信息检索考试题目参考

1. "“开放存取”一词的原型是英语单词_____是于20世纪90年代兴起的一种新型的学术信息共享的自由理念和出版机制。"; "B Open Access"; 2. "谷歌搜索引擎的词组检索即精确检索的检索算符是_________。"; "C 双引号“”"; 3. "将CNKI的书目数据导入EndNote,首先选中CNKI检索结果中需要导入的数据条目并另存,该另存的文件后缀名是什么?"; "B .txt"; 4. "想通过搜索引擎在后缀为.edu的中查找“职业教育”的容,可以使用这样的命令:"; "C “职业教育”+site:edu"; 5. "根据教材,总结常见的文献信息(按照出版、发布及外在表现)形式特征,可以把文献资源归结为()大类。"; "D 11"; 6. "《著作权法》第32条第1款规定:作者向报社、期刊社投稿的,自稿件发出之日起( )日未收到报社通知决定刊登的,或者自稿件发出之日起( )日未收到期刊社通知决定刊登的,可以将同一作品向其他报社、期刊社投稿。但收稿单位在征稿启示中对稿件是否被录用的通知有明确的时间规定时,投稿作者必须自觉遵守。"; "B 15、30"; 7. "学术论文稿宜用纸大小:"; "C A4"; "D 8K"; 8. "《中国图书馆图书分类法》(简称“中图法”)作为我国图书分类的国家标准,根据书籍容的学科属性及知识的在联系,采用字母作为学科代号,将图书划分为“A 马列主义、思想,B 哲学,C-K社会科学,N-T自然科学,Z综合性图书”五大部类,()个基本大类,是我国各级各类图书馆进行图书分类、管理、组织、利用的依据和基础。"; "B 22"; 9. "将Google学术搜索的题录数据导入NoteExpress,在“设置”中选择哪一款参考书目管理软件?"; "C RefMan"; 10. "利用容聚合浏览器,收集和组织用户定制的新闻,使网络用户可以方便跟踪最新信息的网络服务方式的标记为______。"; "C RSS"; 11. "查找图书上的与科技创新项目有关的背景知识首推_______";

相关文档
相关文档 最新文档