文档库 最新最全的文档下载
当前位置:文档库 › 信息检索语言

信息检索语言

信息检索语言
信息检索语言

第二节信息检索语言

计算机检索的基本原理是将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。由此可见,能否准确地检索出用户所需信息,关键在于能否准确地选择检索词。这里所说的“准确”,是指用户所选的检索词必须与数据库中标引文献记录所用的标引词一致。然而实际工作中,从事信息存储的人员与从事信息检索的人员绝大多数情况下不可能进行直接的思想交流,因而会造成存储信息与检索信息所依据的规则不一致,导致存入的文献检不出。为了避免这种情况发生,在信息标引人员与信息检索人员之间必须制定一种共同遵守的规则,即一种约定的相同标识和线路,这就是检索语言。

一检索语言的含义及作用

1 检索语言的概念

检索语言(information retrieval language),是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种专门语言。所谓检索的运算匹配就是通过检索语言的匹配来实现的。检索语言是人与检索系统对话的基础。

有了这种规则,信息标引人员在进行信息存储的过程中,就会对原始信息进行分析,找出其能代表信息的特征与检索语言(检索标识系统)进行对照标引,然后纳入检索系统;而信息检索人员在进行信息检索的过程中,则先对待查课题进行分析,归纳出各种信息特征,使之形成能代表需要的检索提问,然后把这些提问与检索语言(检索标识系统)进行核对,标引成检索提问标识。

如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。

2 检索语言的工作原理

(1)存储:检索系统对文献内容进行分析,概括分析出若干能代表文献内容的语词,并赋予一定的标识,如题名、作者、主题词等,作为存储与检索的依据,然后纳入到数据库中。

(2)检索:检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的语词,然后通过检索系统在数据库中匹配具有同样语词和标识的文献,找到自己所需的信息。

3 检索语言的作用

(1)保证不同标引人员表征文献信息的一致性。(2)使内容相同及相关的文献集中化。

(3)保证检索提问与文献信息标引的一致性。(4)保证检索者按不同需求检索文献信息时都能获得较高的查全率和查准率。

二检索语言的类型

1 自然语言(natural language)检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引(非依据词表的标引方法),是非规范词(uncontrolled term)。

(1)关键词(keyword):直接从信息资源名称、正文或文摘中抽出的代表信息主要内容的重要语词。

(2)题名:信息资源的名称,如论文篇名、图书书名、网站名称等。

(3)全文:从资源的内部内容中自动抽取、查找,是目前网上各类搜索引擎使用的最多的方法。

(4)引文(quotation):将文献所引用的参考文献的作者、篇名、来源出版物抽取出来进行标引。

自然语言的优点:

(1)新颖性强:一旦文献中出现某个新词语,即可直接使用这一词语作为检索入口,根本无需像受控语言那样冥思苦想地将其转换成另一规范词用于检索。

(2)检索方便:它解除了人工语言的种种限制,不需要复杂的检索规则,使用者能较快适应,易用性强。

(3)标引准确度高:自然语言采用从文献中抽词标引的方式,不容易发生误标引,适用于计算机检索。只要数据库的文献标题中含有该检索词,即视为命中,健全率较高。

自然语言的缺点:

(1)词汇量太大,给词汇的存储、加工和检索带来许多操作性方面的困难。

(2)当文献的主题很明白清楚地在标题或主题词中表达出来时,检索才会较成功,反之则失效。

(3)词汇具有模糊性,另外多义、近义、同义现象较多,给标引和检索带来困难。

2 人工语言

由人工创制的,采用规范词,用来专指某个概念或与之相应的概念。可以将同义词、近义词、相关词、多义词及缩略词规范在一起,由人工控制。包括分类检索语言、主题检索语言、代码检索语言。

(1)分类检索语言

按学科范畴及知识之间的关系列出类目,并用数字、字母符号对类目进行标识的一种语言体系,也称分类法。

中国图书馆图书分类法

美国国会图书馆分类法

杜威十进位分类法

IPC国际专利分类表

下面以《中图法》为例说明体系分类法的结构与功能。

《中图法》是体系分类法的典型代表,是现今国内图书情报部门普遍使用的一部分类法。

《中图法》的类目表由基本大类、简表、详表和复分表组成。

基本大类是分类法中的第一级类目,是对学科领域的基本划分。《中图法》共有二十二个基本大类,每个大类都用一个英文字母表示。如下所示:

A 马克思主义、列宁主义、毛泽东思想、邓小平理论

B 哲学宗教

C 社会科学总论

D 政治法律

E 军事

F 经济

G 文化科学教育体育

H 语言文字

I 文学

J 艺术

K 历史地理

N 自然科学总论

O 数理科学化学

P 天文学地球科学

Q 生物科学

R 医药卫生

S 农业科学

T 工业技术

U 交通运输

V 航空航天

X 环境科学劳动保护科学

Z 综合性图书

简表又称为基本类目表,是分别对每个基本大类,依据它的某些属性,作进一步划分后而形成的二、三级类目表。如:Q 生物科学

Q1 普通生物学

Q2 细胞学

Q3 遗传学

Q4 生理学

Q5 生物化学

详表又称主表或正表,由简表进一步细分而成的最小概念性分类表。

如:

I 文学

I0 文学理论

I1 世界文学

I2 中国文学

I20

I21 作品集

I22 诗歌、韵文

I23 戏剧文学

I24 小说

I242 古代至近代作品

I246 现代作品

I247 当代作品

I247.4 章回小说

I247.5新体长篇、中篇小说

I247.7新体短篇小说

I247.8故事、微型小说

I25报告文学

I26散文

I3/7 各国文学

复分表是供主表中某些类目共同细分而从主表中抽出的一部分类目表。

使用体系分类检索语言编制的分类表按学科或专业集中文献信息,以学科概念的上下左右关系反映事物的派生、隶属、平行的关系,较好地体现了学科的系统性,能较好地满足族性检索的要求。其次,体系分类法用字母和数字表示类目,便于组织文献排架及目录系统,又适于文献信息的收集和编制手工检索工具。但由于体系分类法使用的是号码式语言作检索标识,一方面不直观,另一方面在检索文献信息时,必须将文字主题转换成分类标识,在转换过程中,容易产生差错,造成误检或漏检,影响检索效率。此外,体系分类法采用的是先组式检索语言,因此,增补新概念困难,修改不及时,不适应新兴学科和边缘学科的检索。

(2)主题检索语言:主题检索语言是以词语作为表达主题概念的标识,按字顺编排的检索语言。

标题词语言是最早使用的一种主题语言。它以规范化的自然语义作为标识来表达文献涉及的主题概念,表达主题的词语称为标题。

单元词语言是从文献内容中抽选出来的最基本的词汇、将代表最一般、最基本的、不可再分割的概念的词作为单独标引文献的单位。

叙词语言是从自然语言中优选出来并经过规范化处理的名词术语。采用表示单元概念的规范化语词的组配对文献内容主题进行描述,也是目前使用最广泛的主题语言。

主题语言举例:下例为EBSCO出版公司Business Source Premier数据库中选定“建议主题语” (据2008年数据)

(3)代码检索语言

就事物的某一方面特征,用某种代码系统来加以标引和排列,目前主要应用于化学领域。例如。化合物的分子式索引系统、环状化合物的环系索引系统等。

3 人工语言与自然语言的关系

与自然语言相比较,人工语言的检索效率要高于自然语言,查全率和差准率都比较高,但人工语言是基于印刷性资源产生的,对标引和检索来说,标引工作量大,需要不断维护,管理成本高,用户也不易掌握。因此,在数字资源飞速发展的今天,仅使用人工语言是远远不够的。

自然语言由于主要由系统自动标引完成,灵活、新颖、检索入口多、专指性好,管理和维护的成本较低,用户也不需要特别的学习和培训;但由于目前计算机的抽词技术还无法做到从自然语言文本中自动抽取最准确、充分表达信息资源内容的词,也无法自动规范自然语言和表现概念之间的关联,检索效率很低,具体表现在搜索引擎的使用上,利用搜索引擎检索出来的内容大部分是无用信息。

因此人工语言和自然语言并不是互相对立的,比较成熟的检索系统,通常是两种检索语言并用,互为补充,以保证较高的检索效率。

检索语言的分类

检索语言的分类:按照揭示和反映信息内外部特征的不同,检索语言可划分为:分类语言:以数字、字母(或字母与数字结合)为检索标识,作为有关类目的代号。 主题语言:分为标题词语言、叙词语言和关键词语言; 名称语言:以人名、地名、机构名、篇名、书名等为检索标识; 代号语言:以文献特有的顺序号(如专利号、标准号、合同号等)为检索标识 邻近位置算符(W)W是with的缩写。(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。 邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入n个词。 句子位置算符(S)S是sentence的缩写。A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 字段位置符(F)F是field的缩写。A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。 记录位置算符(C)C是citation的缩写。A(C)B 其作用等同于A and B,均表示A和B 同时出现在同一记录内,但词序不限,也不要求在同一字段内。 截词符号 常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$” 截词类型 (1)后截断,前方一致。如:“comput*”表示computer、computers、computing等。(2)前截断,后方一致。如:“*computer”表示minicomputer、microcomputer等。(3)中截断,中间一致。如:“*comput*”表示minicomputer、microcomputers等。 1 .括号改变运算顺序。 2 .引号引号内的检索项以整体形式出现。精确匹配: “”和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 3 .个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。 【实例】在某些搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。 1. 直接法(1)顺查法(2)倒查法(3)抽查法 2. 追溯法

文献信息检索重点

1、信息:是人类在认识和改造客观世界中所依赖的和使用的一种既非物质又非能量的东西,它是客观世界中一切物质的属性,又是物质存在和运动的客观反应。 2、信息的特性:客观性、依附性、可传递性、可塑性、时效性、共享性 3、知识:人类社会实践经验的总结,是人的主观世界对客观世界的概括和如实的反应。 4、文献:是记录有知识的一切载体。 5、文献4要素: 知识信息内容,即文献的内容; 信息符号:文字,图表,声音、图像等; 载体材料:甲骨,竹筒、纸张、胶卷、磁盘、光盘等; 记录的方式及手段:刀刻,书写、录像、印刷等 6、情报:是知识的传递并起到作用的部分 7、文献的分类: 物理分类:印刷型文献、缩微型文献、机读型文献(电子型)、视听型文献(声像型) 出版类型:图书、报纸、期刊、特种文献(特种文献有:专利文献、学位论文、科技报告、标准文献、会议文献) 按文献加工层次分:零次文献、一次文献、二次文献、三次文献 零次文献:未经出版发行的文章,包括手稿、个人通信、原始记录等一次文献:也叫原始文献,首次出版发行的,包括特种文献,期刊论文,也是我们常用的。 二次文献:报道和查找一次文献的检索书刊(有目录,题目,文摘。查找以此文献的工具。)工具性、系统性、汇集性 三次文献:利用二次文献提供的线索浓缩加工而成(包括各种综述,进展报告,动态综述,手册,年鉴,百科全书。) 8、信息检索:一般是指查找满足特定需要的过程 广义上:将信息按一定方式组织和储存起来,并根据信息用户的需 要找出有关信息的过程。 狭义上:从信息集合中找出所需要信息的过程,相当于信息查检。 9、信息检索类型: 存储检索对象分:文献检索、数据检索、事实检索 信息存储和检索方式和技术分类:传统信息检索(手工)包括追溯法、工具法、综合法

文献检索作业考试答案

名词解释: 1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。广义的文献检索包括文献的存储和文献的检索两个过程。狭义的文献检索就是找出自己所需的文献。 2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。检索的匹配就是通过检索语言的匹配来实现的。 3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。如叙词语言、单元词语言、关键词语言属此类型。 4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。 5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。 6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。 7.电子图书:又称为数字图书或Ebook,是随着电子出版、互联网以及现代通信电子技术的发展应运而生的一种新的图书形式。电子图书应具有三要素:(1)电子图书内容。(2)电子图书的数字存储设备。(3)电子图书的阅读软件。 8.网络电子图书:是以电子形式出版发型,以互联网为流通渠道、以数字内容为流通介质、以网上交易为主要支付手段的图书。 9.前方一致检索:也称为后截断检索,是指在某一检索项内容中,检索前方与检索字/词完全一致的文献。前方一致检索适用于数值索引的检索项。 10.多项双词逻辑组合检索:多项是指可以选择多个检索项;双词是指一个检索项中可以输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段,每个检索项中的两个检索词可以分别使用词频、最近词、扩展词;逻辑是指个检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 11. 双词频控制检索:是指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 12. 引文:所谓引文就是参考文献

信息组织与检索

《信息组织与检索》 一.名词解释 二.1. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专着、期刊论 文、学位论文等。 三.2. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、 数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 四.3. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为 着录的基本单位,记录图书、期刊、资料等的名称、着者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 五.4.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要 而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 六.5. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。 6、文献信息资源 文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。 7、信息检索语言 信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。 8、竞争情报 竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。 9、INTERNET(因特网) Internet:因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。 因特网,源自英文的Internet,它的含义从广义上来说就是是“联接网络的网络”。这种将计算机网络互相联接在一起的方法称为网络互联。作为专有名词,它所指的是全球公有、使用TCP/IP这套通讯协议的一个计算机系统,这个系统所提供的信息与服务,以及系统的用户。因此,世界上这个最大的互联网络也被简称为“互联网”(the Internet)。 二. 判断题(对的打“√” ,错的打“×” ) 1.??通过BA、ISTP、Kluwer online、Springer Link 数据库都能检索到外文期刊论文全文。(×) 2.??在重庆维普数据库检索系统中能查到企业名录。???????????????? (×) 3.??利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印刷型图书和期刊。(∨) 4.??截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(∨) 5.??联合目录可以帮助读者确定其所需要的文献收藏在那个情报机构。(∨) 6.??综述因附有大量参考文献,所以是二次文献。(×) 7.??通过“万方数据资源系统”可以查找标准文献的全文。(∨) 三. 填空题 1.按文献载体形式划分,文献可分为印刷型、缩微型、声像型、和电子型。

信息检索题库

第一章 一、单选 1、报道范围主要为能源方面的科技报告为(D )。A、AD(军事系统)B、PB (行政系统) C、NASA(航空与宇航系统) D、DOE(原子能与能源管理系统) 2、(C)是出版周期最短的定期连续出版物。A、图书B、期刊C、报纸D、学位论文 3、(A )是高校或科研机构的毕业生为获取学位而撰写的。A、学位论文B、科技报告C、会议文献D、档案文献 4、了解各个国家政治、经济、科技发展政策的重要信息源是(B )A、科技报告B、政府出版物 C、标准文献 D、档案文献 5、年鉴属于下列哪一类别(D )A、零次信息B、一次信息C、二次信息D、三次信息 6、下列哪种文献属于一次文献(A )。A、图书B、百科全书(三次信息) C、综述(三次信息) D、文摘(二次信息) 7、下列文献中属于一次信息的是(A )A、专利说明书B、百科全书C、目录D、综述 8、以下各项属于二次信息的是(A )A、索引B、期刊(一次信息) C、学位论文D、百科全书 二、多选 9、二次信息主要包括(CD )等。A、手册B、年鉴C、目录D、题录 10、信息的属性包括(ABCD )A、客观性B、时效性C、传递性D、共享性 11、信息素质的内涵主要包括(ABC )。A、信息意识素质B、信息能力素质C、信息道德素质 D、信息职业素质 12、以下类型的信息属于三次信息的是(BC )。A、目录B、词典C、百科全书D、科技报告 附加: I)信息道德规范信息行为,主要包括(ABC)。A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息 II)根据信息的载体和表达方式的不同,信息源可分为(ACD)。A、语言信息源B、二次信息C、实物信息源D、文献信息源 III)文献的基本要素有(AC)。A、有一定的知识内容B、一定要记录在纸张上C、一种物质载体D、存在大脑中即可 三、判断

文献信息检索的含义

、文献信息检索的含义、分类、检索语言 1、文献信息检索: 文献检索含义 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。 计算机信息检索,是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。 一次文献 (primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。 二次文献 (secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献。 三次文献 (tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等。

零次文献 它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。 用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。 2、文献检索语言 文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。检索语言按原理可分为3大类: (1)、分类语言 它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 (2)、主题语言 是指经过控制的,表达文献信息内容的语词。主题词需规范,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据 (3)、关键词语言 指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标

情报检索语言研究综述

情报检索语言研究综述 80国家图书馆学刊2004年第3期(总第49期) 画被瀛 情报检索语言研究综述 沙淑欣 摘要从人工语言研究,自然语言研究,网络情报检索语言研究,自然语言与人工语言一体化研 究,兼容与互换问题研究及其他方面问题的研究六个方面对2000年至今有关检索语言方面 的文章 进行梳理,以呈现新世纪情报检索语言研究的全貌.参考文献36. 关键词情报检索语言人工语言自然语言网络环境兼容 分类号G254.0 检索语言是信息交流的工具,是知识组 织的中心环节,是信息用户开启信息资源的 钥匙,其重要性得到学术界及全社会的普遍 重视.有关检索语言的研究一直是图书情报 学,语言学,计算机科学共同关注的领域.现 对2000年至今有关检索语言方面的120余 篇(不包括《中图法》方面的文章)学术论文进 行梳理,以明确新世纪情报检索语言研究的 现状,成就,热门研究课题及其发展趋势. 1人工语言研究

对于高要求的检索来说,控制是绝对必 要的.人工语言就是对概念及其标识系统实 施严格规范的检索语言.人工语言按其结构 原理可分为主题语言,代码语言三分类语言, 种类型.近四年来对这方面研究的文章较 少,且主要集中在网络环境下的知识分类组 织,情报检索语言发展趋势,分类主题一体化 以及对《中图法》的研究上. 1.1分类法理论与实践研究 情报检索语言中的受控语言最初是为克 服很早就被纳入了情报检索语言系统的自然 语言的不足而产生的?.自汉代刘向,刘歆 的《七略》算起,图书分类法已经有2000多年悠久的历史,而且分类语言是现今所有情报 检索系统中使用最普遍的一种检索语言.新 世纪,除少量文章对国内外其他分类法做比 较粗浅概略的介绍外,大多数文章围绕《中图法》展开.据不完全统计,相关文章有360多篇,包括《中图法》与其他分类法的比较研究; 各学科文献分类研究;《中图法》类目复分,组配技术,标记体系,类目修订,类目注释等研 究.韩立栋在《<中图法>(第四版)问题述评》一文中,分析了《中图法》(第四版)中存在的类名问题,仿分问题,沿革注释问题,总论

信息检索-判断题(精心整理)较全版本

判断题 1.信息素养是由信息意识、信息知识、信息能力、信息道德四个要素构成的。(A) https://www.wendangku.net/doc/95568023.html,KI中国知网数据库可以检索到博硕士论文。(A) 3.查全率与查准率是评价检索效果的两项重要指标。(A) 4.广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要查找出特定信息的技术和过程。(A) 5.逻辑“与”是一种用于交叉概念或者限定关系的组配,可以缩小检索范围,提高查准率。(A) 6.逻辑“或”是一种用于概念并列关系的组配,可以扩大检索范围,提高查全率。(A) 7.信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等。(B) 8.界定问题过程首先需要根据待完成的任务,确定信息问题。然后根据信息问题,确定信息需要。(A) 9.概览性资料通常出现在我们所说的二次文献中。(B) 10.图书馆OPAC检索系统属二次文献数据库(A) 11.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。(A) 12.对于要求一定深度、研究性的信息问题,应主要检索搜索引擎检索网络信息源。(B) 13.选择信息源是信息检索的第一步。(B) 14.PQDT 是美国Proquest公司出版的学位论文数据库。(A) 15.根据文献内容的不同加工深度可区分为一文献、二次文献和三次文献,学位论文属三次文献。(B) 16.综述文献属于二次文献(B) 17.The mammalian cell as a microorganism;-genetic and biochemical studies in vitro puck, Theodore T.(Theodore Thomas) xi,219p.illus.24cm. ISBN 0-816-26980-7 San Francisco,Holden-Day 1972 该文献类型为期刊论文。(B) 18.通过EBSCO、EI、OCLC数据库都能检索到外文期刊论文全文。(B) 19.在超星阅览器登录个人用户名后下载的图书支持拷贝到其他机器上阅读。拷贝到其他机器阅读时,需要在阅读的机器上使用下载时用户名进行超星阅览器->“注册”菜单->“用户登录”操作。(A) 20.分类途径就是按照文献的名称体系查找文献的途径。(B) 21.检索2010年经济统计数据通常应该用2010年出版的《中国统计年鉴》。(B) 22.Effect of coating whole cottonseed on performance of lactating dairy cows. Bernard,-J,K;Calhoun,M.C;Matin,S.A. Savoy, III.:American Dairy Science Association J-dairy-sci.. June 1999.v.82 p.1296-1304.该文献类型为图书。(B) 23.主题语言较适合于期刊论文、研究报告、会议论文等单篇文献的组织和检索(A) 24.分类语言适合于图书或文集的组织和检索,提供的是从学科或专业角度查找文献信息的途径,族性检索功能强。(A)

情报检索语言

虚拟现实(VR)就是利用计算机和其它的专用硬件和软件产生一种境界的仿真,参与者可以通过视觉、听觉和触觉等感觉与仿真的内容交互操作,达到一种“真实”的感觉,所以有人也称其为“灵境”。 信息构建就是为用户提供序化、优化及美化的信息。它需要借助一切信息组织、信息呈现的技术和方法,如图形设计、可用性工程、用户经验、人机交互、图书馆学信息科学中的主题法分类法等的理论方法,在用户需求分析的基础上,对信息进行组织、布局、优化,如设计导航系统、标签系统、索引和检索系统,以及内容布局等。 超文本是一种新型的信息组织技术,它以结点为单位,结点与结点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络。 数据仓库是支持决策过程的、面向主题的、集成化的、稳定的、不同时间的数据集合。这个定义体现了数据仓库作为信息组织技术和工具的鲜明特征,如主题性、有序性等。 自动归类是指计算机通过词频统计、语法分析和语义分析等途径得到代表文献内容的类主题词,然后按照某一分类表将文献划分到某个类目的过程。 自动标引是以计算机代替人工,自动生成表达信息记录内容特征的主题、分类或其它有意义的标识,它是标引技术与计算机结合的产物,是信息组织自动化的基础。 数据管理就是对数据进行分类、组织、编码、存贮、检索和维护。 数据库(Database,DB)是存储在一起的相关数据的集合。 主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。 主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。 组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法 关键词是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。 关键词法原理的应用,常有三种形式,即题外关键词索引、题内关键词索引和单纯关键词索引 条形码是由一组粗细不一、相互平行的黑白条符组成并按一定编码规则组织起来,用来表示字母、数字、甚至汉字等信息。 信息编码是指用一个或一组按特定规则排列起来的符号来表达信息的过程,它实质上包含两个环节,一是信息的代码化;二是代码的组织。

医学文献信息检索(完整版)

医学文献信息检索 第一章绪论 1.一个国家的综合国力在一定程度上将体现为信息的拥有量、处理能力和利用水平,即信 息水平、信息能力、信息素质、信息潜能的总和。 2.NIQ-----国家信息化指标(国家智商) 3.医学生信息素养:个体能够认识到何时需要信息,能够检索、评估和有效利用信息的综 合能力。包括:信息意识、信息知识、信息能力、信息道德 4.信息能力:活动+积累+表达+甄别+利用(终极目的) 5.信息意识是前提,信息能力是核心,信息道德是方向。 6.文献信息检索:教会医学生查找文献信息,提高检索、筛选、分析、评价、管理和综合 利用文献信息的能力,最终使文献信息为我所用。包括信息存储和信息检索两个环节。 7.手工检索:常用法、追溯法、浏览法 计算机检索:浏览法、搜索法、技术法 8.外表特征途径:题名、著者、机构名、编号 内容特征途径:分类、主题、代码 第二章文献信息检索基础 (二)文献信息的类型 1.按载体形式:印刷型+非印刷型(缩微型+声像型+电子型) 2.按内容的表现形式:文献型+数据型+多媒体型 3.按出版类型:图书+期刊(利用率最高)+特种文献信息 4.按获取的难易程度:白色文献(正式出版)+灰色文献(未完全公开)+黑色文献(完全不公开)(三)文献信息级别

位论文、会议文献 二次文献将大量无序、分散的一次文献收集、整理、加工,著录其外部或内容特征。目录、索引、文摘、网络检索工具(baidu、Yahoo) 三次文献科技人员围绕某一专题,借助二次文献,在充分研究与 利用大量一次文献的基础上撰写成的新的文献。 综述、述评、进展、百科全书 零次文献未经加工、直接记录在载体上的原始信息。私人笔记、会议记录 (四)分类语言 1.分类语言:类号+类名(医药、卫生---R) 2.《中国图书馆分类法》(《中图法》)划分为5个基本部类,22个基本大类。 (五)主题语言 1.主题语言:以规范化或未经规范化的名词术语为基本词汇,以概念间的形式逻辑作为语 法和构词法形成的词语为检索标识的一种人工语言。包括标题词+关键词+单元词+叙词2.关键词:那些出现在文献的标题、摘要或正文中对表达文献主题具有一定实质意义的词 和词组。(未经过规范化) 3.叙词(主题词):经过规范化处理的,以基本概念为基础的表达文献信息主题的词和词 组。具备了概念性、描述性和组配性。 副主题词:与主题词组配,对主题词进行修饰限定的词。 4.MeSH词表:目前最具代表性,使用最为广泛的受控医学叙词表。由主题词变更表+字顺 表+范畴表+副主题词表构成。 5.数据库>文档>记录>字段 (六)检索技术 1.布尔逻辑检索:()>NOT(-)>AND(*)>OR(+) 不同检索系统使用的运算符不同:表“与”CBM---AND,VIP---*,PubMed---空格/AND 2.限定检索:将检索词限定在文献特定字段中检索。 常用字段标识符:[ALL]全部字段;[AU]作者;[TA]期刊名称;[LA]原文语种;[MH]主题词;[TI]文献标题;[TIAB]标题/文摘 3.截词检索:使用特定截断符后对检索词的局部进行检索。通常“”表单一字符,“%”表 任意字符。 4.加权检索:对检索词赋予一个值表示重要程度后进行检索。可缩小检索范围提高查准率。(七)检索程序 分析检索需求→选择检索工具→确定检索方法或途径→编辑提问式→获取文献线索与原文(八)检索效果 1.查全率= 2.查准率= 第三章中文期刊数据库检索(CBM+CNKI+VIP+万方) (一)CBM(中国生物医学文献数据库) 1.CBM属于SinoMed(中国生物医学文献服务系统) 2.CBM收录自1978年以来1800余种中国生物医学期刊,是检索国内医学文献的权威。 3.题录依据:《MeSH》、《中国中医药学主题词表》、《中图法·医学专业分类表》 4.检索方法:快速检索+主题检索+分类检索+期刊检索+作者检索 (1)高级检索:CBM提供18个检索字段。

信息检索复习资料

一、名词解释 1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。 6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。 7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。 10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。 11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。 12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。 13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。 14.手册——是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。 15.名录——是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。 16.搜索引擎——就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。 17.文献综述——是一种文献信息调研报告,又是学术论文的一种形式。它是通过全面系统的搜集某一特定研究领域的全部或大部分相关文献资料,并经过阅读、理解、分析、比较、归纳的基础上,对该课题的发展过程、发展趋势及存在的问题等,进行全面介绍、综合分析和评论而形成一种不同于一般论文的文体。 18.开放存取——又称开放访问,是国际学术界、出版界、图书情报界利用互联网进行学术信息和科研成果自由传播、免费利用的行动. 19. 一次文献:即原始文献。是作者以生产或科研为依据创作的原始文献。如专著、期刊论文、学位论文等。 20.技术档案指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 21.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 22.检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 23.追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。

检索语言

一、名词解释 查全率 是指系统在进行某一检索时 检出的相关文献量与系统文献库中相关文献总量的比率 它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。 检索语言 是根据信息检索的需要创造出来的一种人工语言 是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 标题词法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。标题词指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。 信息素质:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 二、简答题 1.简述检索语言的基本功能 答: 1) 对文献的信息内容(及某些外表特征)加以标引的功能。要求利用检索语言能够正确标引文献信息内容及其外表特征。 2) 集中文献的功能。对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率。 3) 信息组织的功能。对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索。 4) 一致性功能。便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性。 5) 获得最高查全率和查准率的功能。保证检索者在按不同需要检索文献时,都能获得最高的查全率和查准率。 6) 桥梁和纽带功能。在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,以提高信息检索的准确性。2.分类检索语言的作用 答: ①这是进行分类标引和组织分类检索工具的规范。②它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。③它是检索者从分类途径检索文献资料的指南。④它是文献工作者工作中常用的参考手册。 三、文献信息检索

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。 2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。 3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。信息是物质存在的方式、形式和运动规律的表征。人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。 4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。 5、信息资源的构成可从不同的层次和角度来划分: 一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技 报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。 二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次 文献。(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。例如词典、手册、百科全书、年鉴、各种教科书及综述等。 三、按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息 源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。 6、信息出版类型:是指记录有知识的文献出版类型。 7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。 8、信息检索的基本原理:对信息集合与需求集合的匹配与选择。 9、信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。 10、信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。 11、计算机信息检索系统根据内容不同可划分为:联机检索系统、光盘检索系统和网络检索系统。 12、检索工具按用途可分为两大类:指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献)。 13、检索工具按编著方式可分为:(1)目录型检索工具。目录主要报道实有的文献或收藏文献的情况,以一个完整的出版单位作为著录的基本单位。此类检索工具对于查找、索取原始文献具有重要作用;(2)题录型检索工具。题录是用来描述某一文献的外表特征并由一组著录项目构成的一条文献记录。题录实质上是一种不含文摘正文的文摘款目,在揭示文献内容的深度方面,题录比目录做得深入一些,但又比文摘款目浅;(3)文摘型检索工具。文摘是指对文献的内容简洁而又正确的摘录,供人们浏览和查用,使读者能以较少的时间和精力掌

当今搜索引擎技术及发展趋势

当今搜索引擎技术及发展趋势 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9T,并且仍以每4个月翻一番的速度增长。用户要在如此浩瀚的信息海洋里寻找信息,必然会“大海捞针”无功而返。搜索引擎正是为了解决这个“迷航”问题而出现的技术。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。一、分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。这类搜索引擎的代表是:、LookSmart、Open Directory、Go Guide等。2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:“天网”、悠游、OpenFind等。3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。二、性能指标我们可以将WEB信息的搜索看作一个信息检索问题,即在由WEB 网页组成的文档库中检索出与用户查询相关的文档。所以我们可以用衡量传统信息检索系统的性能参数-召回率(Recall)和精度(Pricision)衡量一个搜索引擎的性能。召回率是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统(搜索引擎)的查全率;精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统(搜索引擎)的查准率。对于一个检索系统来讲,召回率和精度不可能两全其美:召回率高时,精度低,精度高时,召回率低。所以常常用11种召回率下11种精度的平均值(即11点平均精度)来衡量一个检索系统的精度。对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的WEB网页,所以召回率很难计算。目前的搜索引擎系统都非常关心精度。影响一个搜索引擎系统的性能有很多因素,最主要的是信息检索模型,包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制三、主要技术一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。 1.搜索器搜索器的功能是在互联网中漫游,发现和搜集信息。它常常是一个计算机程序,日夜不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死连接和无效连接。目前有两种搜集信息的策略:从一个起始URL集合开始,顺着这些URL 中的超链(Hyperlink),以宽度优先、深度优先或启发式方式循环地在互联网中发现信息。这些起始URL 可以是任意的URL,但常常是一些非常流行、包含很多的站点(如!)。将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。搜索器搜集的信息类型多种多样,包括HTML、XML、Newsgroup文章、FTP文件、字处理文档、多媒体信息。搜索器的实现常常用分布式、并行计算技术,以提高信息发现和更新的速度。商业搜索引擎的信息发现可以达到每天几百万网页。2.索引器索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。

文献信息检索课程教学大纲

《文献信息检索》课程教学大纲 一、课程基本信息 课程编号: 课程名称:文献检索 学时范围:18 实验学时:10 总学分: 课程性质:是培养学生信息情报意识,掌握用手工方式和计算机方式从文献信息源中获取知识、信息和情报的一门科学方法课。 课程属性:专业任选课 先修课程:《科学利用图书馆》公选课 适用专业(方向):学院各专业 责任单位:图书馆 二、课程性质、地位和任务 性质:《文献检索》课是培养学生信息情报意识,掌握用手工方式和计算机方式从文献信息源中获取知识、信息和情报的一门科学方法课。 地位:该课程在大学生能力培养、提高综合素质方面起重要作用。 任务:使学生了解本学科及相关学科文献信息源的情况及文献信息检索的基本知识,学会常用印刷型文献检索工具与参考工具书的使用方法,熟知国内外重要的计算机网络化检索系统,懂得如何获得与利用文献信息,增强自学能力和研究能力。 该课程在技能上的目标: 1.掌握信息资源检索的手段、类型及原理。 2.掌握文献信息和数字信息资源的类型及其特点。 3.熟知国内外重要的计算机网络化检索系统,掌握计算机检索的方法和技术。 4.了解各种电子书及中外文网络数据库资源,掌握各种电子书及网络数据库的检索途径、方法和技巧。 5.能够独立地根据检索课题选用适当的检索工具或计算机数据库,并综合使用多种检索工具或数据库完成检索课题。 三、课程的内容及要求、教学重点与难点 第1部分文献信息检索概论

(1)主要教学内容: 1)信息与信息检索的概念; 2)信息检索的变革与意义; 3)信息检索手段; 4)信息检索类型; 5)信息检索系统及原理。 (2)知识点与能力点要求: 要求学生了解信息及与信息有关的几个概念,了解信息检索的变革;掌握信息检索手段、类型、原理。 (3)教学的重点与难点 信息检索手段、类型、原理。 第2部分信息资源的概念、特性及类型 (1)主要教学内容: 1)信息资源的概念; 2)信息资源的特性; 3)信息资源的类型。 (2)知识点与能力点要求: 了解信息资源的概念、特性;掌握信息资源的类型和每种信息资源的特点。 (3)教学的重点与难点 文献信息资源和数字信息资源的类型及其特点。 第3部分信息检索语言 (1)主要教学内容: 1)文献信息检索语言的定义、作用及类型; 2)分类语言,以《中国图书馆分类法》为例进行介绍。 3)主题语言; (2)知识点与能力点要求: 1)知识点:了解文献信息检索语言的定义、作用及类型,掌握中国图书馆图书分类法体系、结构与标记符号,了解主题语言。 2)能力点:能够通过分类号检索图书。 (3)教学的重点与难点

相关文档