文档库 最新最全的文档下载
当前位置:文档库 › 信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理
信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。

(1)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。

(2)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。

(3)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。检索知识包括主题词、分类号、著者、标题、机构、代码等。

(4)信息检索的一般原理:P7

(5)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子

系统、查询子系统、用户与系统交互子系统、匹配子系统)(6)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。

(7)检索系统的功能:报道功能、存储功能、检索功能。(8)信息检索理论:标引理论、检索模型、检索结果的可视化。

(9)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。

第2章信息检索模型

(1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。

(2)信息检索模型的类型:P18

(3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。

(4)布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻

辑非(NOT)

(5)布尔运算的运算次序:P24

(6)传统布尔检索模型的优缺点:

优点:1)逻辑运算符较少,便于用户学习。2)模式较易构造,可以通过简单的关系来体现检索项的联系。

3)可以将复杂的检索过程以简单的检索式表达出来。4)检索提问式较灵活,方便修改。

缺点:1)布尔检索中的关键词没有权重区别。2)检索结果分输出没有重要性是排序。3)查全率很难控制。

4)布尔检索要求用户具有很高的素质和语义提取能力。

(7)向量空间模型:一种基于统计学方法的数学模型。

(8)向量空间模型的工作原理:P27

(9)向量空间模型的优缺点

优点:1)采用自动标引技术与文献提供标引词。

2)采用部分匹配策略,使得在算法层面上的基于多值相关性的判断处理得以实现。

3)改变了布尔检索只有两种情况0和1的简单判断,标引词和文献的相关程度可在0和1之间取值,使标引者和检索者都可以比较灵活地定义标引词与文献的关系深度,改变了布

尔检索模型的僵化的缺点。

4)由于其相似的程度作为检索的标准,可从量的角度判断命中与否,从而使检索结果更趋合理。

5)检索结果可以按照与提问的相关度排序输出,便于用户通过相关反馈技术修正提问,控制检索量。

6)布尔模型的逻辑关系依然可以使用,保留了直观性和方便些。

7)向量空间模型的灵活性使它有很好的可扩展性和可改进性,为以后的更加完善奠定了基础。

缺点:1)检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系。

2)由于对于任何一个提问度需要计算全部文献库中的每一篇文献,因此,计算量大,算法复杂性较高。

3)由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。

4)有很多是假定的,在实际工作中有时会不能解决。

(10)扩展布尔检索模型:P31

(11)扩展布尔检索模型的工作原理:P32

(12)扩展布尔检索模型的优缺点:

优点:拥有矢量处理的思想,体现了加权的特点;继续保留

布尔检索的直观的操作符,具有很强的描述能力;对于输出结果可以很好的控制和排序;通过调整权重参数的取值,可以灵活选择并得到不同的检索结果;便于区分强制性短语和严格的同义解释与试探性短语和较不严格的同义关系;与传统倒排文档一致,更易接受。

缺点:扩展布尔模型由于是集成了两种经典模型的一种改进的“集成化模型”,所以它不可避免的存在着臃肿、不够自然简洁的缺点,而且不是很普及,目前在信息检索领域使用较少。

(13)概率模型:一种基于概率论原理的用以解决相对不确定性的信息检索的信息检索模型。

(14)贝叶斯定理:P37

(15)概率模型的优缺点:

优点:文档可以按照他们相关概率递减的顺序来计算秩,还可以通过反复反馈结果和用户需求,使结果得到很好的调整,相对合理得多。

缺点:索引词权值计算方法没有考虑到词频加权因素。沿用了索引词之间相互独立的基本假设。开始时需要猜想把文档分为相关和不相关的两个集合,过程比较烦琐。

(16)概率模型在处理实际问题时的困难:初始检索文件阀值比较大,由检索式检索的相关文件数量相对于精确估计的

概率而言太小。

(17)古典逻辑模型的特点:1)逻辑模型不是一个经典模型。2)逻辑检索要借助外部信息进行评价。3)逻辑检索对关键词的语境更加重视。4)对信息的联想法控制。5)逻辑检索具有不确定性。6)对多词一义的把握。7)适应信息的不完全性。

(18)逻辑模型的优点:逻辑理论具有很强的推理能力,将检索过程逻辑化可以使人们能从新的角度认识检索,并在逻辑化的基础之上建立演绎信息检索系统。在演绎信息检索系统中,用户可以增减可用规则,可以扩充或者缩小知识库,可以憎加或减少检索目标项,从而实现扩检和缩检。同时,通过因入更多的谓词、丰富系统的知识库、允许查询目标语句中包含更多的谓词,演绎信息检索系统也容易被扩展为用途更广的专家系统,使得信息检索系统智能化程度更高,功能更强,换句话说,基于逻辑模型,我们可以建立智能化的、提供多种检索入口的、便于扩展的信息检索系统、

(19)逻辑模型的缺点:在逻辑模型中,信息的重要程度这一特征并不能很成功地被表达出来。基于实质蕴涵的情报检索古典逻辑模型自然也并不能完全表达出文献d与信息需求q之间的真实联系。它关注的仅是前后件之间在真假方面的逻辑关系,而并不关心前件和后件中所涉及的信息延展性问题。由于查询是依靠推理来获得相关性的文献,因此推理过程越是不确定,获得的相关性文献就越少,而这样的现象在

传统的逻辑检索模型中屡有发生。

(20)限词检索模型:通过限制检索范围,达到优化检索结果的方法。

(21)字段检索:把检索词限定在某个或某些字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。

第3章自动索引和文档组织

1、索引:著录书刊中的题名、语词、主题、人名、地名、事件及其他事物名称,并把它们按照一定的方式编排起来,指明出处是一种检索工具。

2、索引的发展历程:人工索引阶段、机辅索引阶段、自动索引阶段

3、索引的功能:检索功能、分解功能、梳理功能、聚类功能、追踪功能、导航功能、预测功能

4、常见索引的类型:主题索引、著者索引、名称索引、地名索引、题名索引、数字或代码索引、分类索引

5、索引的过程:为了方便查询而对信息指定索引款目的过程。包括信息采集、信息标引、建立索引。

6、索引建立的步骤:选题,建立主索引文件;对主索引关键词进行抽词倒排,建立目标格式文件;排序与归并。

7、信息标引分为受控标引和自然语言标引。受控标引指采用受控语言中的标识表达主题概念的标引方式,主要有分类标引和主题标引;自然语言标引是指采用自然语言语词作为标识来表达主题概念的标引方式。

8、分类标引:依据一定的分类语言,对信息资源的内容特征进行分析、判断和选择,赋予分类标识的过程。

9、分类标引的要求:准确性、充分性、一致性、适用性。

10、分类标引规则:基本标引规则、一般标引规则、特殊标引规则。

11、主题标引:对信息内容进行主题分析、确定主题概念,然后按照一定的词汇控制方式,为标引对象赋予恰当的语词标识的过程。

12、标引方式:根据文献或信息特点和使用需要确定的标引和揭示主题的形成。包括整体标引、全面标引、对口标引、综合标引和分析标引等。

13、标引方法:标题法、元词法、叙词法。

14、标引规则:

(1)选用标引词的基本规则:正式词标引规则;相对专指标引规则;标引方案优先顺序规则;适度标引规则;一致标引规则

(2)叙词组配标引的基本规则:叙词组配必须是概念组配;

组配结果要求所表达的概念清楚;叙词组配中要注意次序。

15、自然语言标引:是一种采用自然语言作为标识表达主题概念的标引方式。

16、汉语语词的切分方法:词典分词法、切分标记的分词法、基于语法语义理解的分词方法、基于神经网络的分词方法。

17、自动标引:指利用计算机从各种文献信息中自动提取有关标识的过程。

18、层次聚类法:依据一种事先决定的相似性或非相似性度量和类间距离,经过计算建立聚类图,在根据聚类图决定分类结果。

19、文献自动分类:指首先分析被分类对象中的特征,将其与各种类别中对象所具有的共同特征或一定的分类标准、分类参数进行比较,然后将被分类对象划归为特征最相近的一类,并赋予相应的分类好的过程。

20、自动分类的基本流程:文本的预处理、文本特征的选取、分类模型的构建等。

21、决策树:P82

22、顺排文档(主文档):按照某一属性(字段)的字符顺序存入了数据库的全部记录。

23、顺排文档的检索:将用户检索表达式与顺排文档中的文献记录依次比较,就可以判断是否有匹配的文献记录。检索

可以使顺序检索,也可以使分块检索和折半检索。

24、顺排文档组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护。但在查询的时候需要对所有的文档进行扫描以确保没有遗漏,这样就使得检索时间大大延长,检索效率低下。

25、倒排文档:将主文档中的可检字段(如主题词、著者)抽出,按某种顺序重新排列起来所形成的一种索引文档。

26、倒排文档的建立:索引词选择;对抽出的内容进行排序,便于归并相同内容;对相同内容进行归并,把合并后的内容放入倒排文档的主键字段,统计每一数据的频次作为目长,把每一内容后的记录号顺序放于记录号集合字段。

27、倒排文档的更新:P86

第4章词汇控制

1、词汇控制:通过对词形、词义和词间关系等的控制,达到信息源语言、标引语言和检索语言三者之间的有效沟通,从而实现信息的有效组织以及用户对信息的有效检索和利用。

2、词汇控制的原则:正确性、单义性、简明性、兼容性、系统性、稳定性、族性

3、词汇控制的内容:

(1)词量控制:对词表所收词汇的数量的控制。

(2)词量控制的方法:词汇组配、词汇替代、语义分解法、词汇合理选择

(3)词类控制:对词表所收词汇的种类的控制。

(4)词类控制的方法:确定选词范围、设置停用词表

(5)词形控制:根据主题标引和检索的需要对字面形式不同,但含义相同的词汇加以控制使一个主题概念只具有一个语词形式。

(6)词形控制的方法:控制语词形体、控制外来语和数字的用法、控制外文的词形、控制词序、控制语词长度。

(7)词义控制:对多义词或同形异义词加以控制,使其意义明确,含义单一。

(8)词义控制的方法:加限义词、加注释、加定义

(9)词间关系控制:对语词之间的等同关系、属分关系和相关关系等加以控制,以形成一个便于揭示词间关系的语义网络。

(10)先组度控制:对语词先组程度的控制。

(11)句法关系控制:按照事先确定的句法关系,把若干词汇组合起来表示某一特定的论题,以避免产生语义含混的现象。

(12)句法控制的方法:P94

4、词汇控制工具包括分类词表、主题词表、分类主题一体化词表。

(1)分类词表:《杜威十进分类法》、《国际十进分类法》、《冒号分类法》、《中国图书馆分类法》

(2)主题词表:《医学标题表》、《汉语主题词表》

(3)分类主题一体化词表:是指分类系统与主题系统实现完全兼容,既能充分发挥各自特有的功能,又能互相配合,发挥最佳的整体效应。

5、词表评价体系:P115

/6、受控词表的使用:P119

第5章自动文摘技术

(1)文摘:用浓缩、简明的短文,描述信息载体的主要内容和原始数据,向使用者报道、传递最新信息和信息查询线索的一种工具。

(2)自动文献:利用计算机自动地从原始文献中提取文摘。按照文本分析方法的不同,自动文摘分为基于统计分自动文摘、基于理解的自动文摘、基于结构的自动文摘、基于模板的自动文摘。

(3)自动文摘的处理过程:第一步是文本分析,这个阶段是自动文献的基础,主要是寻找最能代表原文内容的成分;第二步是转化过程,通过摘录或概括的方法压缩原文;第三步

是重组原文内容,生成文摘。

(4)基于统计的自动文摘(摘录型文摘):根据统计学的方法将权重高的句子作为文摘句。不足:摘要内容不完整;摘要内容不简洁;语句不连贯。

(5)基于统计的自动文摘一般步骤:待摘文本信息录入;词频信息统计;计算句子权重;选取候选句子;加工生成摘要。(6)基于理解的自动文摘:建立在人工智能、自然语言处理的基础上的,它利用语言学知识对文字进行复杂的语法分析,语义分析和语用分析,获取语言结构,还利用相关学科领域知识进行分析、推理和判断,最后生成文摘。优点:简洁精炼、全面准确、可读性强。不足:语料范围限制;框架的拟定。P136

(7)基于理解的自动文摘步骤:待摘文本信息录入;文本分析(语法分析、语义分析、运用分析和信息提取);文摘初稿形成。

(8)基于结构的自动文摘;:将文本信息视为句子的关联网络,选择与很多句子都有联系的中心句子即可侯成摘要。(9)基于结构的自动文摘不足:P140

(10)自动文献的评价P140

(11)自动文献技术的研究进展P147

第6章用户接口

(1)用户接口,全称是系统-用户接口,又称用户界面、人机界面或人机接口,是指用户使用计算机系统的综合操作环境,它是由人、计算机硬件和软件三者结合而成,承担用户与系统之间的交流功能,是两者之间实现通信不可缺少的模块。

(2)用户接口模块流程:识别用户;接收提问;提问校验;转化问题;检索;输出结果。

(3)用户接口的特征:支持多种类型的用户;支持多种用户认证方式;支持灵活的机构管理;支持灵活的用户授权管理;支持灵活的用户信息管理;支持对收费用户的计费。

(4)用户接口的功能:自动登录功能;访问多个数据库的功能;数据库选择功能;帮助功能;检索式构造功能;查询功扩展;相关反馈功能;下载和上载功能;用户视图定义功能;后处理功能;自然语言处理功能。

(5)用户接口的组成:面向用户部分(负责直接与用户交互,也称外部界面)、面向系统部分(负责与系统内部各部分交互,也称内部界面)、转换部分(负责内部界面与外部界面之间的信息转换)

(6)用户接口的主要形式:命令语言形式、菜单选择方式、表格填充方式、直接操纵方式、自然语言的人机对话方式(7)用户接口设计的原则:易用性、一致性、易学性、宽容性、有效性、美观性、针对性

(8)用户接口设计的内容:用户接口需求分析;用户接口使用的便利性;用户向系统提问的查询方式;查询中的交互性;用户查询接口的简易型和检索能力的矛盾;多媒体查询接口的特殊性。

第7章信息检索系统的评价

(1)信息检索的相关性:检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。(2)相关性的本质特征:关系;直觉的;多维的;动态的。(3)相关性判断:指信息检索中判断者在某一时刻对某种相关性的一种赋值操作。

(4)相关性判断标准:二元的判断标准、多元的判断标准、多维的判断标准。

(5)相关性的影响因素:信息源、信息需求的表示、时间与环境、用户判断者的特性。

(6)信息需求的表示的四个层次:真正的信息需求、感觉到的信息需求、查询请求、查询表达。

(7)信息检索系统评价的步骤:确定系统评价对象及目的;选择系统评价方式;制定系统评价方案;实施系统评价方案;评价结果生成评价。

(8)检索试验评价法的实施过程:抽样;测试;评价数据的收集和记录;数据处理与分析。

(9)查全率:衡量系统在实现某一检索作业时检出相关文献能力的一种测量指标。

(10)查准率:衡量系统在实施某一检索作业时检索精确度的一种测度指标。

(11)影响查全率与查准率的因素:相对值的的影响;检索方式的影响;时限的影响;检索过程中的影响因素。(12)涵盖率:用户已知的相关文档集合中被检索出的相关文档所占比率。

(13)新颖率:用户检索出的相关文档集合与以前未知的相关文档所占比率。

(14)相对查全率:检索系统检出的相关文档数量和用户期望得到的相关文档数量的比率。

(15)查全效果:用户期望得到的相关文档数量与为了得到这些相关文档而在检索结果中审查文档数量的比率。(16)搜索引擎的性能评价指标:P203

(17)信息检索系统评价试验:P206

第8章联机信息检索

1、联机信息检索:指用户利用检索终端,使用一些特定的指令和检索语词,提供通信网络与存储大量信息的检索系统联机,以人机对话方式从检索系统的数据库中查找所需的特定

文献检索考试

1信息信息是物质存在的一种形式,一般指数据,消息中所包含的意义,可以使 消息中所描述的事件的不定性减少。 2信息的属性:1普遍性 2客观性 3中介性 4无限性 5扩散性 6可知性 7可贮性 8共享性 3知识:知识是人类在认识和改造世界的社会实践中获得的对事物本质的认识和结 晶。是人类通过信息对自然界,人类社会及思维方式玉运动规律的认识和概括。是人类大脑通过思维重新组合的系统化了的信息,是信息中最有价值的部分。 4知识的属性:1意识性2信息性3实践性4规律性5渗透性6继承性 。 5情报:是人们为一定目的搜索的有使用价值的知识或信息 6情报的基本属性有哪些? 1:知识性和信息性2:针对性3:竞争性4:时效性5:保密性 7文献:是记录有知识和信息的一切物质载体 8文献的基本要素:1知识信息内容 2信息符号 3载体资料 4载体形态 5制作方式 9文献特点:1文献数量大,增长速度快。2载体多样化3文献类型复杂4 语言种类复杂5内容广泛分散交叉重复。6文献知识周期缩短,文献实效性强。7传播速度快 白色文献:白色文献是一切正是出版并在社会成员中公开流通的文献,包括图书, 报纸,期刊等。这类文献多通过出版社,书店,邮局等正规渠道发行。向社会所有成员公开。其蕴涵的信息大白于天下,人人均可利用,这是当今社会利用率最高的文献。黑色文献:一,人们未破译或未识别其中信息的文献,二,处于保密状态或不愿公布其内容的文献,如为解密的档案,个人日记,私人信件等。 灰色文献:指非公开发行的内部文献或限制流通的文献。 一次文献:指首次公开的文献,也称原始文献。一般是以作者本人在科研和生产中所取得的成果为基本素材而创作或撰写的文献。一次文献是作者最初公布其发现或发明内容的文献。 二次文献:是在一次文献的基础上,按照一定的原则对各种形式的一次文献尽心加工,整理,简化,压缩,组织之后形成的系统或,条理化的文献。是为了管理和利用一次文献而编辑,出版和积累起来的工具性文献。

信息检索复习提纲及答案

“信息获取与利用”复习大纲 1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的 实际工作,谈谈提高信息素养的途径。 答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。标准:⑴能够独立决定所需信息种类和程度。⑵能够高效地获取所需信息。⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。⑷能够有效地利用信息达到某一特定的目的。⑸能够在信息利用过程中遵守相关的法律法规。途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。 2.信息、知识、情报的概念?举例说明概念间的区别和联系文献? 答:信息,由事物发出的消息、指令、数据等所包含的内容。如花的生长方向。知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。如每天吃一个苹果有利健康。情报,是激活了、活化了的知识,是为特定目的服务的信息。如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。 3.文献有那些类型?将文献划分成这些类型的依据是什么? 答:纸张文献、缩微文献、电子文献、音像文献。依据知识内容、记录载体、记录方式。 4.科技文献的作用是什么? 答:⑴科技进步的阶梯。⑵传递科技信息或知识。⑶加速科学技术的进步,促进了社会的发展。 5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么? 答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。 期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。 6.特种文献有哪几种类型,简述其中任意两种的特点。 答:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案。会议文献特点,文献论题集中,内容新颖,丰富、专、深、学术性强,能反映出一个国家、一个地区、国际上当前某一科学技术领域的最新成就、最高水平和发展趋势。标准文献特点,新陈代谢频繁。 7.一次文献、二次文献、三次文献的概念。 答:一次,原始创作,即作者以本人的研究成果为基本素材而创作的文献。 二次,为了管理和利用一次文献,有文献信息工作者对其进行加工整理后所得到的产物,包括书目、索引、文摘等。三次,利用二次文献,选用一次文献内容而编纂出的成果。如词典、手册、百科全书等。 8.解释目录检索系统、文摘检索系统、全文检索系统分别是什么?并就每一类 系统具出一个实例。

信息检索原理与技术资料整理

信息检索原理与技术 资料整理 华中师范大学 信息检索原理与技术

第一章信息检索概论 1.1信息检索基础简述 1.信息:事物发出的信号所包含的内容。 2.知识:知识是人类的主观世界对客观世界的概括和反映,是大量有组织的信息,是关于 事实和思想的有组织的陈述,提供某种思考的判断和某种实验的结果。 3.知识的分类: ①“知事”(know-what):指关于事实方面的知识,也可理解为know-when、know- where,即在什么样的时间(know-when)、什么样的地点或条件下(know-where) 能解决什么样的问题。 ②“知因”(know-why):指自然原理和规律方面的科学理论,知识的产生是在专门研 究机构如实验室和大学完成的。 ③“知道怎样做的知识”(know-how):指做某些事情的技艺和能力,被称为技术情报 和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术。 ④“谁以及是怎样创造知识的”(know-who):侧重对创造思想、方法、手段、过程及 特点等的了解。 4.文献:文献是记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。 构成三要素:①构成文献内核的知识信息 ②负载知识信息的物质载体 ③记录知识信息的符号和技术 特点:知识性(本质)、传递性、动态性。 分类标准: 内容加工程度划分: ①一次文献信息:指作者以自己的研究成果为基础创作和撰写的、未经过加工的原始 文献。 ②二次文献信息:指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书 目信息,它具有汇集性。 ③三次文献信息:是对一次、二次信息综合、分析等深加工的产物,如评论、进展报 告、评述、百科全书、年鉴、指南、期刊书目等。 载体形式划分:书写型、印刷型、缩微型、声像型、机读型五大类。 5.文献信息链:文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造, 直至产生新知识,是一个不断演进的运动过程。 6.信息、知识和文献三者之间的关系(重点):信息>知识>文献 信息、知识和文献的联系在于:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容。它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的; 知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映。它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的; 文献是知识的一部分,是进入人类社会交流系统的运动着的知识。 具体来说,三者之间的关系为:信息>知识>文献。

文献检索试题和答案

文献检索试题和答案 TTA standardization office【TTA 5AB- TTAK 08- TTA 2C】

文献检索课习题卷答案 一、不定项选择题(共50分,每题1分,少选多选均不给分) 1.信息是“用来消除不确定性的东西”,是那个科学家提出来的( D.申农) 2.现代社会中,人们把( B.信息、物质、能量)称为构成世界的三大要素 3.以下属于一次信息资源的是:( B.学位论文) 4. 属于一次信息资源的有(A 会议记录 B 专着 C 专利说明书 D 研究报告) 5. 关于文献,下列说法错误的是( CD )。 A 文献记录的是显性知识 B 检索工具书都属于二次文献 C 文献可以没有载体 D 文献记录的是隐性知识 6. 关于文献,下列说法正确的是:( A 私人笔记属于零次文献 B 学位论文属于一次文献C 百科全书属于三次文献 ) 7. 关于信息资源,下列说法错误的是( A )。 A. 信息资源同时只能被一个使用者所利用 B. 信息资源必须依赖一定的载体才能体现出来 C. 从某种意义上讲,信息资源的价值取决于信息的时效性 D. 信息资源的扩散速度与传递技术的发展成正比 8.推广优秀职员的营销经验使公司业绩大提高,职员经验交流说明了信息具有(C.共享性) 9.关于信息的特征,下列说法正确的是( D.信息需要依附于一定的载体形态) 10.下列叙述中,其中( D )是错误的。 A. 信息可以被多个信息接收者接收并且多次使用 B. 信息具有时效性特征 C. 同一个信息可以依附于不同的载体 D. 获取了一个信息后,它的价值永远存在 11.信息素养的核心是( C.信息能力) 12.关于检索语言,下列说法正确的是( C 中国图书馆图书分类法属于体系分类语言)13.图书的外部特征有( A、着者 B、价格 C、书名 D、出版社) 14.以下检索途径,哪些是反映信息外部特征的(A 题名途径 B 着者途径 C 代码途径) 15.《中国图书馆图书分类法》(简称《中图法》)将图书分成(A. 5大部类,22个基本大类) 16.按照中国图书分类法,下列分类号排序正确的是(C F123、、F13 ) 17.长篇小说《射雕英雄传》的分类号为(A ) 18.根据《中图法》的分类标准,鲁迅《朝花夕拾》的分类号是( B. ) 19.巴金长篇小说《家》的分类号为( A ) 20.利用文献后所附参考文献进行检索的方法叫( A.追溯法)。 21.利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是( B. 倒查法)22.逻辑算符包括( ABCD )算符。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.以上三项 23.关于布尔逻辑检索,下列说法正确的是( BD ) B.多个检索词间使用“逻辑与”匹配可以缩小检索范围 D多个检索词间使用“逻辑非”匹配可以缩小检索范围 24.布尔逻辑检索算符有(A and C not D or) 25.二次检索指的是( C 在检索结果中运用“与、或、非”进行再限制检索)

百度搜索引擎工作原理

以及其他信息。 搜索引擎基本工作原理

与全文搜索引擎相比,目录索引有许多不同之处。 首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。 其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其象Yahoo!这样的超级索引,登录更是困难。 此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。 最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。 目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定(也有例外)。 目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象Yahoo! 这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注),在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。 新竞争力通过对搜索引擎营销的规律深入研究认为:搜索引擎推广是基于网站内容的推广——这就是搜索引擎营销的核心思想。这句话说起来很简单,如果仔细分析会发现,这句话的确包含了搜索引擎推广的一般规律。本文作者在“网站推广策略之内容推广思想漫谈”一文中提出一个观点:“网站内容不仅是大型ICP网站的生命源泉,对于企业网站网络营销的效果同样是至关重要的”。因为网站内容本身也是一种有效的网站推广手段,只是这种推广需要借助于搜索引擎这个信息检索工具,因此网站内容推广策略实际上也就是搜索引擎推广策略的具体应用。 百度谷歌 编辑 查询处理以及分词技术 随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象。搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘的金矿。

《文献检索》期末考试复习题及答案

《文献检索》试题1 一、单项选择题 1.信息成为情报必须具有的三个基本要素是( C )。 A.选择、综合、分析 B.综合、筛选、重新组合 C.知识、传递、效益 D.筛选、组合、系统化 2.下面对查全率和查准率描述错误的是( A )。 A.若某检索工具的查全率较高,则查准率也会相对较高 B.查准率为检出的相关文献量占检出文献总量的百分比 C.查全率和查准率是反映文献标引深度的两个最主要的指标 D.查准率和查全率存在互逆关系 3.下面对叙词语言描述正确的是( A )。 A.叙词语言是后组式语言 B.叙词语言是非规范性语言 C.叙词语言是字面组配 D.叙词直接取自文献中有实际意义的词 4.下面哪项不是代查代检的服务项目?( D ) A.专题文献检索服务 B.论文发表快速通道检索证明 C.论文收录与引用情况报告 D.电子阅览服务 5.个性化导读服务的原则是( C )。 A.预测性原则与科学性原则 B.选择性原则与针对性原则 C.主动性原则与双向性原则 D.综合性原则与及时性原则 6.读秀电子图书的专用全文阅读器是( C )。 A. DjVu B.Acrobat Reader C. ApabiReader D.SSReader 7.中国生物医学文献服务系统(SinoMed)中能检索出含有“肝炎疫苗”、“肝炎病毒基因疫苗”、“肝炎减毒活疫苗”、“肝炎灭活疫苗”等文献的检索式是( B )。 A.肝炎?疫苗 B.肝炎%疫苗 C.肝炎*疫苗 D.肝炎$疫苗 8.EMBASE com数据库中检索韩冬季(Han Dongji)的文章,检索式输入错误的是( C )。 A.Han D.J B.Han D J C.Han DJ D.Han D. 9.支持视觉搜索的数据库是( D )。 A.PubMed B.SinoMed C.EMBASE.com D.CINAHL 10.通过Web of Science数据库检索北京大学附属医院师生发表的文献,可用的检索式是( B )。 A. Peking Univ AND hosp B.Peking Univ SAME hosp C. Peking Univ WITH hosp D.Peking Univ NEAR hosp 11.以下不属于特种文献的是( B )。 A.专利文献 B.期刊论文 C.学位论文 D.会议论文 12.我国发明、实用新型和外观设计三种类型专利的有效期分别为( C )。 A. 20年、15年、10年 B.10年、20年、10年 C.20年、10年、10年 D.15年、10年、10年 13.下面错误描述Google的是( B )。 A.Google属于综合性搜索引擎 B.Google属于元搜索引擎 C.Google属于通用型搜索引擎 D.Google不属于专题搜索引擎 14.下面为开放获取期刊网站的是( D )。 A.NSDL B.维基百科 C.读书公园 D.DOAJ 15.关于参考文献的著录格式,以下说法正确的是( D )。 A.我国国家标准规定著者6人以内全部著录,6人以上加“等”字

文献检索考试内容

文献检索考试内容 信息:是客观存在的事物现象,是生物体或具有一定功能的机器可以感知的客观事物发出的一切有意义的信号或消息。 信息的功能:1)信息是人类和一切生物赖以生存的基本要素2)信息是人类思 维的材料和结果3)信息是一切知识的来源4)信息是人类一切实践活动的指南 (信息是决策的依据、信息是一切有效管理的前提) 为了分享人类共同的知识财富、研究成果,人们必须通过一种科学的方法从取之不尽的信息源中去识别和获取所需要的那部分信息,这个过程就是(信 息)检索 信息检索的意义与作用:是打开知识宝库的钥匙。信息检索是开发信息资源的 有效途径。是科研工作的前提和基础。减少投入,减少浪费,提高效率。拓宽 视野,开阔思路,提高信息素质和创新能力。是科学决策的前提 是信息素质教育的主要内容。促进国民信息素质,强化科技创新能力。 减少语言障碍,最大限度地获得有用信息。 文献的类型: 1〉按载体形式区分:印刷型或称纸型、缩微型、机读型或称电子型、声像型, 又称视听型资料 2〉按出版形式区分(十大文献情报源): 图书会议文献档案产品资料 期刊政府出版物专利文献 报纸学位论文标准文献 (红字为科研常用类型) 3〉按文献的加工级别区分: 一次文献(又称原始文献) 二次文献(又称检索性文献) 三次文献(又称参考性文献) 信息社会涵义及主要特征: 1)大量信息。 信息的特点:快速增长、老化,流动性强。总体量极大,质量相差明显。 人类利用信息的特点: 生有涯而知无涯 解决特定问题所需知识总是有限的、在量上是可控制的 在不断增长的信息海洋中获取特定信息越来越困难 社会快速增长的信息知识与特定需要之间的矛盾日益激化。 2)社会民众具有较高的信息素质 ①能确定信息需求的特点和范围; ②能有效和充分地获取所需信息; ③能评价信息及其来源,利用其知识基础和价值系统选择适当的信息; ④能有效地利用所获取的信息实现待定的目标; ⑤了解信息使用的经济、法律和社会问题,在信息获取和利用时自学遵守道德 规范和有关的法律问题。 信息检索基本原理:即检索者的检索提问词与存储于检索系统中的检索标引词进行匹配对比、取得一致,即为检索命中。 信息检索的类型:

图书馆信息检索技能大赛大纲

“图书馆信息检索技能大赛”大纲 ---湖南农业大学图书馆第二届“资源与服务”宣传月系列活动七 读者有效地利用图书馆检索文献信息,必须掌握三个方面问题。一是要了解图书馆的书 刊类型情况,二是要知道图书馆馆藏布局,三是要懂得查找、利用信息检索的方法。 信息检索分为事实型检索、数值型检索、文献型检索三种类型。 文献检索主要是检索图书、期刊论文; 数值型检索以特定的数值为检索对象,比如查找某一统计数据; 事实型检索以特定的事实为检索对象,比如查找名词术语解释、了解某机构简介等; 一、基础篇 1、图书分类 图书馆采购每一种文献之后,要根据分类法对其分类。《中国图书馆分类法》,简称“中 图法”,是我国图书馆或情报机构使用较多的一部综合性分类法。结构体系上,《中图法》分为:五个基本部类,22个大类。22个基本大类,用英文大写字母(L 、M 、W 、Y 未设类)作为其顺序标识符号,一个字母标志(表示)一个大类。在22个基本大类下,又用阿拉伯数字为标识符号依次展开各级类目,构成类目详表,然后用著者号码区分法细分,再把分类号和著者号组合成索书号。即: 2、文献类型 以文献载体(制作材料)的物理形态划分,文献资源可分为印刷型、缩微型、声像型和电 子型等文献类型。 以文献的出版形式进行划分,文献可分为图书、期刊、会议文献、学位论文、科技报告、 专利文献、标准文献、政府出版物等类型。 查找信息时一定要明确自己所查文献信息的学科范围、查找文献的目的,以免影响检索 效率。 3、书刊排架与检索 索书号的组配方法很多,本馆采用由分类号和种次号组成的索书号。索书号主要用于馆 藏文献的排架,按《中图法》分类。种次号以每种书为单位,按同类书分编的先后顺序排列,按种编号。如:袁隆平的《爪哇稻及其亚种间杂种优势的研究》的分类号为:S511.035.1/16 湖南农大图书馆远程检索系统是本馆提供的最基本的网上服务项目,也是读者通过图书 A 马克思主义、列宁主义、毛泽东思想、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书

文献检索与利用试题与答案

2008—2009 学年第二学期《文献检索与利用》考试题 命题教师:王春香审题教师: 专业、班级:07 经济()考试时间: 一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在答题纸相应位置处。每题 2 分,共 30 分) 1. _C_ 是题录型检索工具 A. CABI B.中国学术期刊文摘 C.全国报刊索引(自然版) D. 经济纵横 2.浏览超星数字图书馆,应首先安装 __D_____. A. Apabi Reader B.Adobe Reader C. CAJ Viewer D.SSReader 3.世界上第一大联机检索系统是 _A _。 A.DIALOG系统 B.OBRIT系统 C.OCLC 系统 D.STN系统 4.利用 baidu 搜索信息时,要将检索范围限制在网页标题中,应该使用的语法 是 ___B_______。 A.site: B.intitle: C. inurl: https://www.wendangku.net/doc/7f4126849.html,: 5.国际农业和生物科学中心英文名称的简称为_A。 A.CABI B. AGRINDEX C. BA D.B of A 6.信息检索根据检索对象不同,一般分为 ___C___________。 A.二次检索、高级检索 B. 分类检索、主题检索 C. 数据检索、事实检索、文献检索 D. 计算机检索、手工检索 7.国际上评价期刊最有影响力的一个指标是__ _A_____。 A. 影响因子 B.读者统计数据 C.引文量 D.价格 8.二次检索指的是:___C__________。 A.第二次检索 B .检索了一次之后,结果不满意,再检索一次 C.在检索结果中运用“与、或、非”进行再限制检索 D. 以上都不是 9. 国际连续出版物编号___A__________。 A.ISSN B.OCLC C.ISBN D. CSSCI 10.下列搜索引擎具有书名号检索功能的有______B________。 A. Google B. 百度 C. 中搜 D.AltaVista 11.《中文核心期刊要目总览》2004版的“农业经济”类核心期刊有_B__种。 A .20B. 19C. 17D. 15 12.通过追溯检索获得的相关文献与原文献相比在发表时间上__B__。 A.早 B.晚 C. 相同 D.不确定 13.在维普中文期刊全文数据库中“在检索结果中”检索相当于B。

信息检索复习大纲

信息检索复习大纲 第一章 1.、信息的含义:信息是客观事物经过感知或认识后的再现。 2、知识的含义:知识是人们通过客观实践对客观事物及运动过程和规律的认识。 3、文献的含义:文献是记录有知识的一切载体 知识、载体、记录是构成文献的三个基本要素。 4、信息资源的含义:信息资源是经过人类筛选、组织、加工,并可以存取和能 够满足人类需求的各种媒介信息的集合。 5 、图书:图书是作者围绕一个中心主题进行研究和探索,比较成熟的、定型的, 而不定期出版的出版物。 6、连续出版物的概念:连续出版物是一种具有统一名称、固定版式、统一开本、 连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物。 7、学位论文是大学生或研究生为取得学位资格而提交的学术论文。 8、会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关 资料。 9、专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中 产生的官方文件及其出版物的总称。 10、标准文献是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构 批准,共同使用和重复使用的一种规范性文件(GB/T20001-2000)。 11、信息素质的含义:利用大量的信息工具及主要信息源使问题得到解答的技术 和技能。 信息素质的内涵包括三个方面:信息意识、信息能力、信息道德。 12、信息能力的含义:指人们有效利用信息技术和信息工具获取信息、加工处理 信息以及创造和交流新信息的能力。 主要包括以下内容:信息需求分析和表达能力、信息获取能力、信息分析和处理能力、信息利用能力 13、互联网的应用包括:信息获取、交流沟通、网络娱乐、商务交易。 第二章 1、信息检索广义概念:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,全称“信息的存储与检索”。 2、信息检索过程::(1)分析检索需求;(2)确定检索标示;(3)选择检索系统和检索工具;(4)实施检索操作;(5)索取原始文献。 3信息检索按检索对象内容划分包括:文献检索、数据检索、事实检索、多媒体检索。 4、手工信息检索直接发源于图书馆的参考咨询工作和文摘索引工作。 5、分类语言是一种按学科范畴和体系来划分事物的语言,它是以数字、字母符

文献检索考试范围

文献检索期末考试复习题 一、名词解释 1.二次文献信息 2.学科化服务 3.网络电子图书 4.专利文献 5.引文分析法 6.书目数据库 7.个性化导读服务 8.双词频控制检索 9.专利法 10.网络信息资源 11.参考数据库 12.情报调研 13.多项双词逻辑组合检索 14.引文 15.开放获取 16.核心期刊 17.OPAC 18.引文检索 19.同族专利 20.文献计量学 21.检索语言 22.馆际互借 23.引文索引 24.知识产权 25.搜索引擎 26.文献检索 27.科技查新 28.电子图书 29.前方一致检索 30.专利 二、简答题1 1.试述书刊外借的两种模式及其优缺点。 2.中国专利的类型包括哪些? .简述Web of Science数据库提供的分析工具有哪些? 4.简述电子图书的特点。

5.简述Web of Science数据库被引参考文献检索途径(要求举例说明)。 6.简述会议文献的功能。 7.简述电子图书的类型。 8.简述专利文献的检索途径有哪些? 9.从文献的外部特征入手,鉴别文献信息的质量应从哪几方面考虑? 10.主题语言有几种?简要阐述其特点。 11.简述文献传递服务与馆际互借服务的联系与区别。 12.简述搜索引擎的分类。 13.简述文献检索系统的评价因素。 14.简述OPAC主要功能。 15.PubMed数据库自动转换匹配检索的含义是什么? 16.什么是检索语言?检索语言揭示概念之间的逻辑关系有哪几种? 17.《中国期刊全文数据库》提供的检索方式有哪些? 18.简述开放获取的形式。 三、简答题2 1.文献检索的基本方法、途径与步骤。 2.计算机文献检索方法与步骤。 3.试述医学电子文献资源的类型。 4.试述电子图书的优势和发展中存在的问题。 5.举例试述生物医学信息查询的方法与步骤。 6.请结合实例论述专利文献的作用。

信息检索 教学大纲

《信息检索》教学大纲 一、课程性质与任务 教学目标: 《信息检索》是培养学生的信息意识、信息能力、信息道德的关键课程之一,旨在通过讲授、讨论和上机实习,帮助学生掌握信息检索和利用的基本方法和技能,使大学生具有一定的科学研究和实际工作能力,为将来的学习和科研打下更坚实的基础。 教学任务: 通过教学和实践,使学生具备信息检索的基础知识和基本理论,熟悉本专业及相关专业信息资源;掌握通过多种方式获取和利用信息资源的基本技能;能自如地利用图书馆拥有的资源和通过互联网查阅各种有用资料,合理有效地利用信息资源,并对丰富信息资源有良好的分析和鉴别能力。 二、课程内容 围绕信息素质标准的要求,本课程的内容包含四个层次:信息知识、信息意识、信息获取、信息利用;十二个知识模块:信息意识与信息素养的培养,信息源,搜索引擎,电子图书检索,期刊数据库检索,专利信息的检索与利用,信息检索案例分析,引文信息的检索与利用,数据与事实检索,学习、考试、留学信息检索与利用,企业与商业性信息检索与利用,学术信息检索与利用。 第1章信息意识与信息素质培养 1.1基本概念及其相互间的关系 1.2文献的类型 1.3信息检索和利用的意义

1.4 信息素质培养 第2章信息源 2.1信息源分类 2.2图书馆 2.3网络信息源 2.4开放存取 2.5信息源使用经验与技巧 第3章搜索引擎 3.1搜索引擎的原理与分类 3.2搜索引擎的使用技巧 3.3主要搜索引擎介绍 3.4学术搜索引擎介绍 第4章电子图书检索 4.1电子图书概述 4.2 中文电子图书 4.3外文电子图书 4.4其他常用电子图书简介 第5章期刊数据库检索 5.1常用中文期刊数据库 5.2常用外文期刊库数据库 5.3其他常用期刊数据库 第6章专利信息的检索与利用6.1专利及专利信息检索的意义6.2专利信息的基本知识 6.3国内专利信息检索 6.4国外专利信息检索 6.5专利检索案例分析

信息检索工具

浅谈信息检索工具

————————————————————————————————作者:————————————————————————————————日期: 2

摘要 文章由信息检索的分析和发展状况出发,阐述了一些常用的信息检索工具和相关技术。然后对常用的信息检索工具做了一个简要的评价,并由此讨论了信息检索工具的现状和发展趋势。 关键词:信息检索工具、技术、评价标准、发展趋势 Abstract Post by information retrieval and analysis of development, and expounds a number of commonly used information retrieval tools and related technologies.Then used the information retrieval tools to do a brief evaluation, and then discuss the status of information retrieval tools and trends. Keywords: information retrieval tools, techniques, evaluation criteria, trends

第一章信息检索分析及发展状况 步入21世纪,人们对信息检索的完备、准确、快捷会有更加严格的要求和期盼,与时俱进、不断完善的信息检索技术将得到越来越广泛的应用,信息的检索与访问方式无疑将发生深刻的变化。然而网上的信息浩如烟海,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各个主题都做得精确又专业,使得检索结果中出现太多无用的信息。如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了一个迫切需要解决的问题。 信息检索主要是指信息的表示、存储、组织和访问,即根据用户的查询要求,从信息数据库中检索与之有关的信息资料。信息检索的目的是获取所需信息,而这要基于比较完善的检索工具和技术。 1.1从传统检索到信息分析 目前,随着信息检索技术的发展,信息检索已经由手工检索、计算机检索发展到了网络化、智能化、认知化阶段,这一阶段的信息检索平台具备了初步的信息分析功能,从而使传统检索信息向信息分析层次发展。例如,在ISIWeb of Science检索平台上,当某一主题的检索结果出来后,检索者还可以利用该平台提供的信息分析功能,对检索结果从以下几个方面进行深入分析:①按照论文发表时间进行分析,了解不同时间阶段课题研究的状态;②按照国家分析,了解该领域的主要研究国家以及国内该领域研究情况;③按照机构分析,了解领域的主要研究机构;④按照作者分析,了解该领域的核心研究人员;⑤按照来源期刊分析,了解该领域研究论文发表的重点期刊以及对某刊物收录论文情况进一步了解;⑥按照学科进行分析,了解该课题涉及哪些学科领域以及对感兴趣学科进行更深入的分析。很显然,通过对检索结果从6个方面进行深入分析,将使读者对检索结果作进一步的深入了解。 1.2信息检索的发展状况 信息检索经过先组式索引检索、穿孔卡片检索、缩微胶卷检索发展到计算机信息检索。计算机信息检索大致可分为脱机检索、联机检索、国际联机检索、光盘检索、超文本的网络检索几个阶段。 目前,以文献单元描述体结构为基础、手工检索方式为主导的传统文献检索已发展到以信息单元组织结构为基础、网上浏览式信息查询方式的信息检索,计算机信息检索呈现联机检索、光盘检索以及网络检索多元并存的格局,面对用户群体、互相竞争、互相融合,谋求个性化基础上的共同发展。如下表所示,传统检索技术和网上检索技术无论是在检索策略还是在检索手段上都发生了本质的变化。 传统检索技术与网上检索技术的比较 传统检索技 网上检索技术 术

《信息检索工具的工作原理》教学设计

《信息检索工具的工作原理》教学设计 江苏省盐城市滨海县獐沟中学汤凤池 【教材分析】 本节课教材是《网络技术应用》选修教材第一章第三节因特网信息资源检索的第二部分。在高一信息技术必修教材中已经对网络检索,搜索引擎内容有初步涉及。本节内容旨在让学生了解搜索引擎工作原理,知识相对来说抽象,不易理解。因此选择理论和实践结合的方法,通过对预设情境任务的完成结合教材内容理解相关概念。“兵”教“兵”的模式确保了学生作为学习主体所发挥的作用。 【学情分析】 现在的高二学生经过了高一年级一学期的信息技术学习,对搜索引擎的概念已经有所了解,再加上目前计算机和网络的普及程度,绝大多数学生使用网络搜索自己想要的信息已经是很平常的事情了。但不排除在部分信息建设滞后的地方读初中的学生对网络了解的不足,因此本节课既要照顾到已经对网络搜索熟悉的同学,也要注意那些相对来说不熟悉网络的同学的掌握情况。 【教学目标】 知识与能力:在学生能够熟练掌握网络检索工具的基础上了解网络搜索引擎的基本工作原理,能够了解全文搜索引擎和目录搜索引擎的概念和特点 过程与方法:使用小组模式,采用“兵”教“兵”的形式,让熟悉网络搜索的同学去带那些平时很少上网的同学,同时小组间采用竞赛的形式来激发学生的积极性, 教师做适当的讲解引导。 情感价值观:培养学生团结互助的小组协作精神,并强化公平竞争的理念。 【教学重难点】 搜索引擎的基本原理,全文搜索和目录搜索的区别和应用 【教学方法】 任务驱动小组竞赛 【教学过程】 一、导入 我们已经可以用网络搜索引擎来检索需要的信息了,但是用了这么久的网络搜索,网络搜索引擎的原理是什么呢?这就是本节课我们一起学习的内容。 二、全文搜索引擎的工作原理 学校要建立一个主题网站,但是缺少相关的材料。 任务一:使用全文搜索来查找“我们学校”的相关资料。 任务要求:必须使用指定全文搜索引擎(百度,谷歌),每位同学至少独立搜索一项相关信

文献检索作业考试答案

名词解释: 1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。广义的文献检索包括文献的存储和文献的检索两个过程。狭义的文献检索就是找出自己所需的文献。 2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。检索的匹配就是通过检索语言的匹配来实现的。 3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。如叙词语言、单元词语言、关键词语言属此类型。 4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。 5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。 6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。 7.电子图书:又称为数字图书或Ebook,是随着电子出版、互联网以及现代通信电子技术的发展应运而生的一种新的图书形式。电子图书应具有三要素:(1)电子图书内容。(2)电子图书的数字存储设备。(3)电子图书的阅读软件。 8.网络电子图书:是以电子形式出版发型,以互联网为流通渠道、以数字内容为流通介质、以网上交易为主要支付手段的图书。 9.前方一致检索:也称为后截断检索,是指在某一检索项内容中,检索前方与检索字/词完全一致的文献。前方一致检索适用于数值索引的检索项。 10.多项双词逻辑组合检索:多项是指可以选择多个检索项;双词是指一个检索项中可以输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段,每个检索项中的两个检索词可以分别使用词频、最近词、扩展词;逻辑是指个检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 11. 双词频控制检索:是指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 12. 引文:所谓引文就是参考文献

王乃成信息检索工具的工作原理

课题:信息检索工具的工作原理 课型:新授课 课时:1 课时 教学目标: 1.了解常用的英特网信息检索工具类型;能描述信息检索工具的基本工作原理和特点。 2.体验因特网信息检索工具的优缺点。 3. 掌握常用因特网信息检索工具的使用方法,能熟练使用信息检索工具获取所需信息。 内容分析: 本节为“因特网信息资源检索”中的重点部分,介绍了全文和目录索引类搜索引擎的工作原理,这是学习的重点。教材中通过搜索奥运信息的例子来说明在网上检索信息的过程, 以达到简化原理、帮助学生理解的目的。教学中应尽量选取贴近生活的例子来说明复杂的工 作原理,降低难度,以提高学生的检索能力为最终目的。 教学过程: 1.情境引入 已搜索一首歌曲为基础,提出问题:同学们想像一下信息检索工具该如何工作呢?有几种方法能达到,让学生们互相讨论,并展开对比讨论,选出最恰当的方法。 2.教学过程 方法一:全文搜索引擎的工作原理 (1)提出问题 ①去超市购买一枝钢笔的过程。 购物→描述商品特征→取货→交给顾客 ②利用全文搜索引擎查找夏季奥运会的由来,并观察操作的一般过程。如图 1-1 ~ 1-3 所示。 图 1-1 百度检索首页

图 1-2 百度检索结果页面 图 1-3 百度检索答案举例页面 总结 全文搜索引擎检索信息的过程: 搜索关键字或词→数据库中检索→搜索结果。 (2)通过上述范例引申 从专业的角度拓展给学生讲解搜索引擎的组成。 ①搜索器:负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持 续不断地抓取网页。 ②索引器:把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器 的数据库中。 ③检索器:面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果 反馈给用户。 巩固练习:搜索江苏省2012年高考方案 进一步总结,得出全文搜索引擎的工作包括三个过程。 ①搜索器在因特网中发现、搜集网页信息。 ②索引器对所搜集的信息进行提取和组织,并建立索引库。 ③由检索器根据用户输入的查询关键词,在索引库中快速检出相关文档,进行文档与查询内容的相关比较,对检出的结果进行排序,并将查询结果返回给用户。 方法二:目录索引类搜索引擎的基本工作原理 (1)提出问题 ①如果去学校图书馆借阅“短篇小说集”,该怎么去做,描述一般过程。 借阅图书→找书目→找相应书籍→从书架拿出 ②利用目录类搜索引擎查找“北京大学”的信息,如图 1-4 ~ 1-7所示。

文献检索考试重点

文献检索复习资料 第一章 一、文献是记录有知识的一切载体,包含知识内容、信息符号、载体材料和记录方式四个基本要素。其中载体材料包括龟甲、兽骨、丝帛、感光材料等。 二、文献按载体划分,可分为印刷型、缩微型、视听型和电子型。电子出版物的问世是信息时代的重要标志,极大的提高了信息的传递速度,加速了社会信息化的进程。 三、n一次文献是依据作者本人的研究成果创作的文献,如图书、期刊论文、会议论文等。其在形式上具有多样性,内容上具有原创性,出处上具有分散型,是文献的主体,也是文献检索利用的主要对象。 四、n二次文献按照一定的方法对一次文献进行整理加工,使之有序化,如目录、索引、文摘等。二次文献不具有原创性,只是对一次文献的整理加工,起报道和揭示的作用,从而方便人们对一次文献的查考。其最大优势是提供的文献线索集中、系统、有序,有助于人们即全面又迅速地了解有关领域的情况。 五、n三次文献是围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,经筛选、分析、综合和浓缩等深度加工而形成的文献,如字典、手册、年鉴等。其在内容上具有综合性,功效上具有参考性,便于人们了解事实数据和比较成熟的知识。 六、从零次文献、一次文献、二次文献到三次文献,是一个有分散到集中,由无序到有序,由博而略的对知识进行不同层次的加工过程。 七、公开出版的图书都有标记标准书号ISBN号;公开发行的期刊也有国际标准连续出版物编号ISSN号。年鉴也属于连续出版物。 第二章 八、n文献检索从广义上讲是指把文献按一定方式组织和储存起来,针对用户需求找出文献的过程,包括信息组织和信息检索两个过程。从狭义上讲单指信息检索,即文献的查找过程。 九、信息组织是文献检索的前提和基础,文献检索是信息组织的目的和归宿。 十、信息检索按检索对象可分为文献检索、数据检索和事实检索。按检索方式可分为手工检索和计算机检索。 十一、我国在1979年底成立了“全国文献工作标准化技术委员会”,1983年正式发表了全国文献著录标准系列中的《文献著录总则》。 十二、《图书在版编目数据》中规定图书的检索数据排印次序为:书名检索点、作者检索点、主题词、分类号。 十三、《七略》是我国最早的一部图书分类法,首创“七分法”。《四库全书》分为“经、史、子、集”4部分类体系。此外还有《别录》。

考研图书情报硕士考试大纲及命题要求

考研图书情报硕士考试大纲及命题要求 考试内容包括《文献资源建设》、《情报信息检索》两门应用基础性课程。考试指导范围如下。 《文献资源建设》考试指导范围 一.考试目标 《信息资源建设》是图书情报领域的一门核心课程。作为图书情报硕士专业学位入学考试科目之一,《信息资源建设》主要考察考生是否初步掌握信息资源建设的基本概念、基本理论和基本方法,是否了解图书馆信息资源建设的基本业务流程,特别是在网络环境下图书馆信息资源建设的特点和规律,检验考生是否初步具备运用信息资源建设的理论与方法分析和解决信息资源建设中实际问题的能力。 二. 考试要求 本科目考试要求达到:(1)弄清信息资源建设及其相关的概念;(2)初步掌握信息资源建设的基本理论及其发展脉络;(3)了解信息资源建设的主要领域和基本内容;(4)了解并初步掌握文献信息资源建设的基本理论、业务流程和基本方法;(5)了解并初步掌握数字信息资源建设的理论、内容与方法;(6)理解信息资源共建共享意义、内涵、模式、实现途径和条件等。 三.考试内容 第一章信息资源建设概论 第一节信息与信息资源 信息是人类社会发展所必需的资源、信息资源的定义 第二节信息资源的类型和特征 信息资源的类型、现代信息资源的整体特征与发展趋势 第三节信息资源建设 信息资源建设的含义、信息资源概念的演变、信息资源建设的主要内容、信息资源建设理论体系、信息资源建设的意义 第二章信息资源建设的基本理论 第一节信息资源建设的支撑理论 系统理论、经济学理论、信息管理理论在信息资源建设中的应用 第二节信息资源建设的基本理念 信息资源建设是国家信息化发展战略的重要组成部分、信息资源建设始终是图书馆重要而神圣的使命、信息资源建设的根本目的是信息资源的利用、信息资源建设既要重视“拥有”也要重视“存取”、信息资源共享既是一种观念,也是一个过程 第三节信息资源建设的原则 实用性原则、系统性原则、特色化原则、共建共享原则 第三章信息资源建设的影响因素 第一节现代信息技术的发展与信息资源建设 现代信息技术发展概况、新的信息环境对信息资源建设的影响

相关文档
相关文档 最新文档