文档库 最新最全的文档下载
当前位置:文档库 › 基于粗糙集的CBR系统案例检索策略

基于粗糙集的CBR系统案例检索策略

基于粗糙集的CBR系统案例检索策略
基于粗糙集的CBR系统案例检索策略

中医药文献检索作业

文献信息检索的意义和作用包括以下几个方面 文献信息检索的意义和作用包括以下几个方面: (一)、掌握文献信息检索技能是当代大学生所应具备的基本技能之一。 当代社会日趋复杂,瞬息万变,整个世界进入一个新技术革命发展的信息时代,诸如“信息社会”、“信息高速公路”、“数字图书馆”、“数字城市”、“数字地球”、“网络出版”、“电子图书”、“知识经济”等新生词汇不断出现,以致信息知识贯穿、渗透到人们的生产、生活与科研等各个领域,并且决定着我们的生活、学习和工作。这种时代迫切要求大学生掌握多种基本技能。其中,文献信息检索与电脑、外语形成所谓的三大基本技能(三者都是信息时代所应具备的技能与手段,运用目的都是为了传播与利用信息知识,通过信息知识认识问题与解决问题或者说是认识世界与改造世界)。掌握文献信息检索技能可以提高自己查检、鉴别、选择与利用文献信息的能力,有利于获取新的信息,吸收所需的专门知识,从而更好地进行自学、从事科研和开展各种管理活动。 (二)、掌握文献信息检索技能有助于同学们打开人类知识的宝库。 图书馆、文献信息部门和档案馆等社会文献信息交流机构都是人类知识的宝库。掌握文献信息检索技能,学会利用这些社会文献信息交流机构可使同学们掌握打开这些知识宝库的钥匙,进而获取与利用所需的文献信息和专门知识。 (三)、掌握文献信息检索技能有助于同学们了解和把握有关学科的起源和发展过程。 掌握文献信息检索技能,可以了解前人在各个领域中所取得的积极成果和有关学科的发展概貌,从而找到读书治学的门径,确定读书的重点和方向。 (四)、掌握文献信息检索技能有助于同学们扩大视野,了解和把握有关学科中出现的新思想、新观点与新知识。 掌握文献信息检索技能,学会获取文献信息的本领,可以及时了解有关某一学科或研究课题的发展水平、发展动向与发展趋势,从而促使自己根据新的情况有所发现、有所创新。像英国伟大的科学家牛顿说得那样“站在巨人的肩膀上”去获得成就。从这个意义上说,谁掌握更多文献检索与利用的知识和技能,谁就能在科研活动中节省查寻文献信息的时间和精力,从而相对延长科研活动的有效时间。 (五)、掌握文献信息检索技能有助于同学们获取有关的参考知识和文献信息。 美国有一所大学的门上雕刻着一句名言:“知识的一半就是知道在哪里去寻求它。”俄罗斯著名的文献学家、目录学家布留索夫在其所著《论目录学对科学的意义》一文中写道:“有人说,学问与其说是知识的储蓄,倒不如说是善于在书海中找到知识的本领”。这话无疑是正确的。掌握文献信息检索技能,可使同学们独立自主地解决自己在学习、生活和工作中所遇到的疑难问题。 (六)、掌握文献信息检索技能是接受终身教育的必要手段。 当前,世界范围内图书文献的数量增长异常迅猛,已经呈现“信息爆炸”、“信息污染”,“知识爆炸”、“知识污染”的复杂局面。面对如此广泛巨大,且在不断猛增的文献信息与知识量,任何图书馆、文献信息部门和档案馆均无法全部收藏。任何人别说是通晓各门学科知识,像过去说到古人“学富五车”,上知天文,下知地理,各门知识无所不知,就是通读某一学科或某一领域的全部文献都相当困难,哪怕大致浏览涉猎也是如此。我国著名科学家钱学森说过:“现在光浏览一下世界上一年内发表有关化学的论文和著作,一个化学家如果每周看40个小时,也要读48年”。就同学们来说,即使是拼命地学习,也无法在大学期间学完将来从事工作所需掌握的全部知识。何况有些学科知识还存在着陈旧老化的问题。这就要求同学们在毕业后还要接受终身教育,不断扩大和完善自己的知识结构。所以,同学们应将刻苦学习、掌握知识与培养文献信息检索与利用技能结合起来,学会用最少的时间和精力选取和掌握更多的专门知识,培养接受终身教育的基本功,以便获得最佳的学习效果。

文献信息检索的含义

、文献信息检索的含义、分类、检索语言 1、文献信息检索: 文献检索含义 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。 计算机信息检索,是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。 一次文献 (primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。 二次文献 (secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献。 三次文献 (tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等。

零次文献 它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。 用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。 2、文献检索语言 文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。检索语言按原理可分为3大类: (1)、分类语言 它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 (2)、主题语言 是指经过控制的,表达文献信息内容的语词。主题词需规范,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据 (3)、关键词语言 指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标

粗糙集理论及其应用综述

控制理论与应用 CONTROL THEORY & APPLICATIONS 1999年 第16卷 第2期 Vol.16 No.2 1999 粗糙集理论及其应用综述* 韩祯祥 张琦 文福拴 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述. 关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制 A Survey on Rough Set Theory and Its Application Han Zhenxiang, Zhang Qi and Wen Fushuan (Department of Electrical Engineering, Zhejiang University.Hangzhou,310 027,P.R.China) Abstract: Rough set theory is a relatively new soft comput ingtool to deal with vagueness and uncertainty.It has received much attention of the researchers around the world.Rough set theory has been applied to many area s successfully including pattern recognition,machine learning,decision support, process control and predictive modeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is also given. Key words: rough set; uncertainty; data analysis; soft computing; rough control 1 引言(Introduction) 粗糙集(Rougn Set,RS)理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS理论是由波兰学者Pawlak Z在1982年[2]提出的.1991年Pawlak Z出版了专著[3],系统全面地阐述了RS理论,奠定了严密的数学基础.该书与1992年出版的RS理论应用专集[4]较好地总结了这一时期RS理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注. 2 粗糙集理论的基本概念(Basic concepts of rough set theory) 2.1 知识与不可分辨关系(Knowledge and indiscern ibility relation) 在RS理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定

《文献信息检索》习题答案文献信息检索(答案)

《文献信息检索》习题答案 一、单选题 1、文献是记录有知识的(A) A.载体 B.纸张 C.光盘 D.磁盘 2、如果需要检索某位作者的文献被引用的情况,应该使用(C)检索。 A.分类索引 B.作者索引 C.引文索引 D.主题索引 3、下列哪种文献属于二次文献( D.) A.专利文献 B.学位论文 C.会议文献 D.目录 4、纸质信息源的载体是(D) A.光盘 B.缩微平片 C.感光材料 D.纸张 5、《中国图书馆分类法》(简称《中图法》)将图书分成( A.) A.5大部分22个大类 B.5大部分26个大类 C.6大部分22个大类 D.6大部分26个大类 6、利用文献末尾所附参考文献进行检索的方法是(C) A.倒查法 B.顺查法 C.引文追溯法 D.抽查法 7、广义的信息检索包含两个过程(B) A.检索与利用 B.存储与检索 C.存储与利用 D.检索与报道 8、中国国家标准的代码是(A) A.G B. B.CB. C.ZG D.CG 9、( D )是报道文献出版或收藏信息为主要功能的工具。 A.题录 B.索引 C.文摘 D.目录 10、逻辑运算符包括(D) A.逻辑与 B.逻辑或 C.逻辑非 D.A,B和C 11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于() A.一条文摘,一篇完整的文献 B.一条文摘,一条题录 C.一篇完整的文献,一条题录或文摘 D.一条题录,一条文摘 12、《中国学术期刊全文数据库》提供的文献内容特征检索途径有(B) A.机构 B.篇名/关键词/摘要 C.中文刊名 D.作者 13、根据反映新内容的程度从大到小,下列文献类型的排序正确的是:(A) A.会议论文,科技期刊,科技报告,科技图书 B.科技图书,科技期刊,科技报告,会议论文 C.科技报告,会议论文,科技图书,科技期刊 D.以上都不对 14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B) A.书目数据库 B.指南数据库 C.全文数据库 D.数值数据库 15、下列检索工具中,主要收录化学与化工类文献的是:(D) A.SCI B.OCLC C.EI

文献检索学习心得体会(精选3篇)

文献检索学习心得体会(精选3篇) 文献检索学习心得体会一:学习文献检索心得体会本学期,我们学习了一门很特别而且很有用的学科,名字叫文献检索,这门课程给我带来了不少收获。文献检索课程是高校教学中不可缺少的一门课程, 是素质教育中重要的组成部分,是当代大学生必须掌握的基本技能。文献检索教育是培养我们大学生的信息意识,使我们掌握用手工方式和计算机方式从各种文献或互联网中获取知识和信息的一种科学方法学,是信息素养教育中重要的组成部分, 是大学生素质教育中不可缺少的一个环节。高校的文献检索课作为我国高校情报用户教育的主要形式,是学生学习信息知识、掌握信息检索技术、普及信息素质教育的基础课,它和外语、计算机等一样是当代大学生必须掌握的基本技能。所以,对我们来说,文献检索十分有必要。而且我们必须好好掌握这样一门课程。 文献检课程从第五周开始,到十三周结束,在这期间,通过网络学习,我们对计算机检索基础知识、中文数据库检索、专利基础知识及专利数据库检索、常用英文数据库检索等检索知识和方法有了一个深刻的了解;通过上机实验,我们经过实际操作,对清华数据库、维普数据库、方正电子图书数据库以及springer数据库、ei village 2 数据库等各类中英文数据库都加深了印象。同时,学习了具体的文献检索知识,对于我们的日常的学习和工作也很有帮助,例如,当我们需要查询专业课程的相关文献用以学习的时候,我们便可以利用这些文献检索数据库来搜索到我们所需要的论文和书籍。另外,在必要的时候,为了方便搜索,我们还可以在网上申请个人图书馆,专门查询一些自己所需的不易随便下载的文献。 学习了文献检索这门课程,我才发现,通过图书馆的电子资源,我们可以查询到许许多多的有用文献,对我们的学习具有相当大的作用,另外,还让我形成了借助这些数据库进行自主学习的习惯,只要有需要,我就会在这些数据库中查询自己感兴趣的东西,用来丰富自己的综合知识。可以说,通过文献检索的学习,我了解到了很多我以前所不知道的东西,以前在需要学习资料的时候不知道在哪里找,而现在完全不用茫然无头绪了,各种数据库所包含的强大的检索功能和丰富的信息资源,给我提供了很大的帮助。 当然,文献检索这门课程很有用,可是要学好也不是很容易,我们必须多练习、多搜索,经常去查询、去摸索,并且要仔细的静下心来学习,只有真正熟悉了各种数据库的检索方法,掌握正确的检索方法,才能够快速而准确的找到自己真正所需要的文献资料。听过这段时间的学习,我要感谢老师的耐心教学,要感谢同学们的热心指导,感谢你们的帮助让我顺利完成了这门课程,并学到许多有用的东西。 文献检索学习心得体会二:学习文献信息检索的心得体会(1895字) 本学期通过选修课的形式学习了文献信息检索,但我却认为文献信息检索是一门十分重要并且值得学习的课程,因为在21世纪经济和信息全球化的今天,身边有着成千上万的信息,而且新信息的更新速度是非常快,如何能快速准确的掌握信息对于我们的学习、工作都有极大的作用,而文献信息检索作为一门可以快速且有效搜索大量有价值信息的学科就表现出了它的重要性。

粗糙集基本概念

一种对集合A的划分就对应着关于A中元素的一个知识 面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述? 粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记: A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成 R1={红,黄,兰}三个大类,那么所有 红颜色的积木构成集合X1={x1,x2,x6}, 黄颜色的积木构成集合X2={x3,x4}, 兰颜色的积木构成集合X3={x5,x7,x8}。 按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么我们就说颜色属性就是一种知识。在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个知识,假如还有其他的属性,比如还有形状R2={三角,方块,圆形},大小R3={大,中,小},这样加上R1属性对A构成的划分分别为:

A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}}(颜色分类) A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}}(形状分类) A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}}(大小分类) 上面这些所有的分类合在一起就形成了一个基本的知识库。那么这个基本知识库能表示什么概念呢?除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如 大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2}, 大三角{x1,x2,x5}∩{x1,x2}={x1,x2}, 兰色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩ {x3,x4,x6,x7}={x7}, 兰色的或者中的积木{x5,x7,x8}∪ {x6,x8}={x5,x6,x7,x8}。 而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示红色的三角形。所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一

智慧树知到《文献信息检索与利用(海南联盟)》章节测试答案

智慧树知到《文献信息检索与利用(海南联盟)》章节测试答案第一章 1、搜商的三个核心要素是 A.搜商意识 B.搜索技术 C.搜索工具 D.搜索内容 答案: 搜商意识,搜索技术,搜索工具 2、我们通常提到的三大中文数据库平台指的是 A.中国知网 B.万方平台 C.EBSCO D.维普期刊 答案: 中国知网,万方平台,维普期刊 3、搜索引擎主要分为以下几类 A.垂直搜索引擎 B.全文搜索引擎 C.目录索引 D.元搜索引擎 答案: 垂直搜索引擎,全文搜索引擎,目录索引,元搜索引擎 4、以下说法你认为正确的是 A.搜索是一种思维

B.搜索是一种语法 C.搜索是一类网站 D.搜索是一种理念 答案: 搜索是一种思维,搜索是一种语法,搜索是一类网站,搜索是一种理念 5、常见的搜索引擎如: A.百度 B.谷歌 C.万方数据平台 D.必应 答案: 百度,谷歌,必应 6、在搜索中我们常提到的”B,A,T”指的是 A.百度 B.阿里 C.腾讯 D.百链 答案: 百度,阿里,腾讯 7、 Google 创立于哪一年? A.1992 B.1998 C.2004 D.1989 答案: 1998

8、课题“Investigation on computer applications in the machine tool design”,哪些词是检索词? A.1992 B.1998 C.2004 D.1989 答案: 2004 9、在“虫部落”社区,数据搜索可以查到是: A.百度指数 B.微指数 C.搜狗指数 D.阿里指数 答案: 百度指数,微指数,搜狗指数,阿里指数 10、 2015年《高等教育信息素养框架》提出 A.权威的构建与情景 B.信息创建的过程性以及信息的价值属性 C.探索式及对话式学术研究 D.战略探索式检索 答案: 权威的构建与情景,信息创建的过程性以及信息的价值属性,探索式及对话式学术研究,战略探索式检索 第二章 1、图书馆有哪些类型? A.国家图书馆

粗糙集理论分析及其应用研究

1、前言 随着信息技术的飞速发展和广泛应用,面对信息系统中不完整、不精确或不确定的数据如何有效分析处理?如何发现隐藏在信息系统中的有用知识和潜在的规律?为了解决这些问题,学术界和研究者们采用了粗糙集理论。粗糙集理论是由波兰数学家 Z.Pawlak 在1982年提出的[1],它是一种分析处理不完整性、不精确性、不确定性知识的数学工具。该理论不需要任何初始或附加信息,直接利用已知的知识库,将知识库中的不确定或不精确的知识进行近似的划分,并对所划分的知识域确定其支持程度。 目前,该理论已成为信息科学和认识科学领域的研究热点之一,随着研究的深入,该理论得到了很大的发展和壮大,并已成功应用于人工智能、模式识别与分类、知识发现与决策分析、专家系统、数据挖掘、故障检测、金融、医学、生物学等领域。 2、粗糙集的基本理论定义 粗糙集理论是一种研究不完整、不确定性知识的数学工具[2]。在信息系统中,对知识的理解和表示是人们首先思考的问题,同时也是比较难解决的问题,从目前研究来看,对这些问题的解决,粗糙集理论和技术是比较理想的方法。 定义1:(信息系统)设一个信息系统[3]S=(U,A,V,f),这里, 粗糙集理论分析及其应用研究 覃宝灵 (佛山科学技术学院信息与教育技术中心 广东佛山 528000) 摘要:本文阐述粗糙集理论的基本概念,探讨粗糙集理论中知识约简和规则提取的重要性,通过分析、比较,把这些理论和技术应用于实际中,取得了显著的效果,对其在信息系统中的应用具有一定的研究价值。 关键词:粗糙集;知识约简;规则提取;遗传算法 ①U是对象的非空有限集合,即称为论域,记为:U={x 1,x 2,…,x n }; ②A是属性的非空有限集合,记为:A={A 1,A 2,…,A m }; ③V是属性的值域集,记为:V={V 1,V 2,…,V m },且V i 是属性A i 的值域; ④f是信息函数,即f:U×A→V,f(x i ,A j )∈V j 。在信息系统中,若属性集合A由条件属性集合C和决策属性集合D组成,且C∪D=A,C∩D=Ф,则称S为决策系统,又称决策表。 定义2:(等价关系)设知识表示系统S=(U,A ,V,f),若属性集合 时,称P的不可分辨关系Ind(P) 是U上的等价关系,其中Ind(P)={(x,y)∈U × U |,f(x,a)= f(y,a)}。由Ind(P)导出的所有等价类 集合记为U/P,它构成了论域的一个划分,含有元素x的等价类,记为[x]p 。 定义3:(下近似、上近似、边界域)设是一个集合,R是一个定义在U上的等价关系。有: ①若R一(X)=U{Y∈U/R:Y∈X},则称R一(X)为X的R下近似集; ②若R一(X)=U{Y∈U/R:Y∩X≠Ф},则称R一(X)为X的R上近似集; ③若R(X)=R一(X)一R一(X),则称R(X)为集合X的边界域。若R(X)是空集,则称集合X关于集合R是清晰的;反之,称集合X为关于集合R的粗糙集。 定义4:设R是一族等价关系,且{R}∈R,若

粗糙集理论及其应用与发展研究

Computer Knowledge And Technology电脑知识与技术2008年第4卷第1期(总第28期) 粗糙集理论及其应用与发展研究 韦良 (同济大学电子与信息工程学院,上海201804) 摘要:粗糙集理论是一种研究不精确、不确定性、处理不完备知识的数学工具,目前被广泛应用于人工智能、模式识别、机器学习、决策支持和数据挖掘等领域。该文通过介绍粗糙集理论及特点,叙述了粗糙集理论在各领域的应用发展情况,并且展望了其未来发展趋势。 关键词:粗糙集;属性约简;粗糙集应用;数据挖掘 中图分类号:TP18文献标识码:A文章编号:1009-3044(2008)28-0172-03 Rough Set Theory and Its Application Research WEI Liang (Electronics and Information School,Tongji University,Shanghai201804,China) Abstract:Rough set theory is a math theory which processes non-accurate,uncertain and incomplete knowledge.Currently,it has already been applied successfully in the area of Artificial Intelligence,Pattern Recognition,Machine Learning,Decision Analyzing and Data Mining etc.This paper introduces the rough set theory and its characteristics,reviews the development of this theory in different fields,and suggests evolutional trend in the coming future. Key words:rough set;attribute reduction;rough set application;data mining 1引言 波兰数学家Pawlak于1982年提出的粗糙集理论是一种新的处理模糊和不确定性知识的数学工具[1]。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集理论能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。以粗糙集理论为基本框架的知识发现过程的研究,越来越引起人们的关注,特别是将粗糙集理论与机器学习、模式识别、数据库理论等相结合,并融合其它有效的数学工具与方法的研究,显示出基于粗糙集理论的多种软计算方法相结合算法在知识发现和优化过程中的强大的优越性,为知识发现的理论基础提供了一定的依据。目前粗糙集理论已成为人工智能领域中一个较新的学术热点,引起了越来越多科研人员的关注。 2粗糙集理论的基本概念 设U是非空有限论域,R是U上的二元等价关系,R称为不可分辨关系,序对A=(U,R)称为近似空间。坌(x,y)∈U×U,若(x,y)∈R,则称对象x与y在近似空间A中是不可分辨的。U/R是U上由R生成的等价类全体,它构成了U的一个划分。可以证明,U上划分可以与U上的二元等价关系之间建立一一对应。U/R中的集合称为基本集或原子集。若将U中的集合称为概念或表示知识,则A= (U,R)称为知识库,原子集表示基本概念或知识模块。任意有限的基本集的并和空集均称为可定义集,否则称为不可定义的。可定义集也称为精确集,它可以在知识库中被精确地定义或描述,可表示已知的知识。可以验证所有可定义集全体可构成U上的一个拓扑。 令知识库K=(U,R),集合X哿U,R是一个等价关系: 分别称RX为X的R下近似(Lower Approximation)和RX为X的R上近似(Upper Approximation)。称集合BN R(X)=RX-RX为X 的R边界域;POS R(X)RX为X的R正域;NEG R(X)=U-RX为X的R负域。 下近似RX包含了所有使用知识R可确切分类到概念X的元素。上近似 RX则包含了所有那些可能是属于概念X的元素。概念的边界区域BN R(X) 由不能肯定分类到这个概念X或其补集X中的所有元素组成。关系如图1 所示。 刻画粗糙集的方法有以下两种:一种是用表示近似精度的数值表示粗 糙集的数字特征;数字特征表示粗糙集边界域的相对大小,但没有说明边 界域的结构。另一种是用粗糙集的拓扑分类表示粗糙集的拓扑特征。拓扑 特征给出边界域的结构信息,但没有给出边界域大小的信息。 由等价关系R定义的集合X的近似精度如下: 收稿日期:2008-07-03 作者简介:韦良(1982-),男(朝鲜族),黑龙江牡丹江人,在读硕士研究生,研究方向:数据挖掘,人工智能,粗糙集应用。 图1概念的上近似、下近似和区域表示 ISSN1009-3044 Computer Knowledge And Technology电脑知识与技术 Vol.4,No.1,October2008,pp.172-174 E-mail:eduf@https://www.wendangku.net/doc/bc14099384.html, https://www.wendangku.net/doc/bc14099384.html, Tel:+86-551-56909635690964 172 本栏目责任编辑:唐一东人工智能及识别技术

文献信息检索(1)

《文献信息检索》 10生化制药吴红然 16号 文献信息检索:文献检索含义 文献信息检索或情报检索,是指将文献信息按一定的方式组织和储存起来,并能根据用户的需要取出所需特定信息的整个过程。它的全名为信息存储与检索。通常所说的信息查询或检索只是名称的后一半,或是"狭义"的信息检索。文献检索分为数据检索:以文献中的数据为对象的一种检索。如某公式、某化学分子式等。事实检索:以文献中的事实为对象,检索某一事物发生的时间、地点或过程文献检索:以文献为对象,查找某个课题的有关文献的一种检索。 文献检索的意义 文献检索是利用文献获取知识、信息的基本手段。无论对读书治学和宏观决策的需要来说,都有着重要的意义。 文献检索是读书治学的基本功。文献检索技能是智能的重要组成部分。无论是在求学还是在工作期间,都需要进行各种智能的培养和训练。掌握了文献检索方法如同有了打开知识宝库的金钥匙、泛舟书海的指南,它有助于指引读书治学门径,对在校大学生来说,正是接受这种技能训练的黄金时代。 文献检索是科学研究的组成部分。科学研究首先是从课题调研掌握资料起步的。文献检索有助于掌握本课题研究的进展动态,开拓思路、避免重复劳动,把研究水平提到新的高度。科研成果的评估与鉴定,也需要通过文献检索——资料的查新活动,才能作出正确的结论。特别是在社会科学文献检索系统尚不完备的条件下,文献检索能力的高低,往往影响着科研成果的价值。 文献检索是科学决策的先导。信息化时代的经济管理、政治控制、艺术创造乃至心理状态的演变等,均受到各种社会信息的影响。适时掌握有关信息才能实现有效的管理。因此说,文献检索是进行科学决策的先行工作。邓小平同志“开发信息资源,为四化建设服务”的题词,不仅深刻地揭示了信息是宏观决策的重要智力资源,也指出开发信息资源的目的。从信息开发手段来说,也是对文献检索意义的高度概括。 总之,文献检索能力是从事物质文明生产和精神文明建设不可缺少智能之一。在某种意义上说,国家经济实力的差距,归根结底是国民吸收社会信息能力上的差距。而文献检索能力正是衡量吞吐社会信息能力的一个重要标识。 文献检索的作用 学习文献信息检索首先避免重复研究或走弯路,我们知道,科学技术的发展具有连续性和继承性,闭门造车只会重复别人的劳动或者走弯路。研究人员在选题开始就必须进行信息检索,了解别人在该项目上已经做了哪些工作,哪些工作目前正在做,谁在做,进展情况如何等。这样,用户就可以在他人研究的基础上进行再创造,从而避免重复研究,少走或不走弯路。其次节省学习者的时间,科学技术的迅猛发展加速了信息的增长,加重了信息用

文献信息检索

《文献信息检索技术与方法》教学大纲 一、课程基本信息 课程名称:文献信息检索技术与方法 课程编码: 课程类别:管理学 适用专业:全校所有专业 课程学时:24 课程学分:1.5 课程简介:信息及网络时代,各种信息成指数级地增长,信息丰富了,但很难及时地找到我们 需要的信息。《文献信息检索技术与方法》教给学生检索技能、技巧与方法的同时,培养学生 动手的能力,思维的方法和其他一些信息科学(情报学)的基本知识。 选用教材: 罗爱静,于双成?医学文献信息检索(第3版).人民卫生出版社,2015 谢志耘.医学文献检索.北京大学医学出版社,2010 参考书: 夏立新等.信息检索原理与技术.科学出版社,2009 彭奇志.信息检索与利用教程.中国轻工业出版社,2006 二、 课程教育目标 培养学生的信息检索技能、技巧与方法,增强学生的信息素养 三、 课程学时分配 内容 课程的意义与基本概念 文献信息检索原理与方法 文献信息检索技术 常用文献检索系统 常用学术信息检索系统 检索结果评价与检索策略调整 医学研究论文写作 四、课程教学内容、要求及学时安排 第一章课程 的意义与基本概念 【教学内容】 1.1文献信息检索的意义:信息素养 1.2信息、知识与文献 1.3文献与信息的分类及其特点 【教学要求】 1 ?熟悉文献信息检索的意义:信息素养 2 ?掌握信息、知识与文献的概念内涵 3.了解文献与信息的分类及其特点 【教学方法】多媒体、讲授、问答、回顾、比喻、举例、分析与归纳 【学时】1 第二章 文献信息检索原理与方法(重点) 早 氏代 第一早 第二早 第三章 第四章 第五早 第六章 第七章 学时 1 2 3 1 6

粗糙集理论与应用发展

粗糙集理论与应用发展 1、引言 粗糙集( roughs ets,RS)理论是20世纪80年代初由波兰科学家Pawlak提出的[1]。其主思想就是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它从一个新的角度将知识定义为对论域的划分能力,并将其引入数学中的等价关系来进行讨论,从而为数据分析,特别是不精确、不完整数据分析提供了一套新的数学方法。同时,粗糙集理论具有无需提供除问题所需处理的数据集合之外的任何先验信息,仅根据观测数据删除冗余信息, 比较不完整知识的程度—粗糙度、属性间的依赖性与重要性,抽取分类规则等的能力。近几年,这个理论已得到空前的发展,无论在理论本身研究方面,还是在理论应用方面都取得了令人瞩目的成果。 2、粗糙集理论简介 粗糙集理论是建立在分类机制的基础之上的,不可区分关系的概念是粗糙集理论的基础。信息系统S由论域U和等价关系集A构成,表示成S=(U,A),不可区分关系ind(A)是信息系统S上的一个等价关系,它是A上全部等价关系的交集。信息系统S所表示的知识可理解为*对论域U划分的结果。不可区分关系的等价类构成了信息系统表示的知识的最小粒度,这个粒度内的对象不可区分。正是由于知识的粒度性,造成使用已有知识不能精确地表示某些概念。为此,在不可区分关系基础上定义了上下近似,使粗糙集理论能够有效地逼近这些概念。令XCU是论域上对象的一个集合,BCA是一族等价关系,CXIs表示元素x在B 下的等价类,则B( X )二 {xEU}Cxls(=X)B( X) 二

粗糙集理论介绍(对于初学者来说,很经典的滴)

粗糙集理论介绍面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记:A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成R1={红,黄,兰}三个大类,那么所有红颜色的积木构成集合X1={x1,x2,x6},黄颜色的积木构成集合X2={x3,x4},兰颜色的积木是:X3={x5,x7,x8}。 按照颜色这个属性我们就把积木集合A进行了一个划分(所谓A的划分就是指对于A中的任意一个元素必然属于且仅属于一个分类),那么我们就说颜色属性就是一种知识。在这个例子中我们不难看到,一种对集合A的划分就对应着关于A中元素的一个知识,假如还有其他的属性,比如还有形状R2={三角,方块,圆形},大小R3={大,中,小},这样加上R1属性对A构成的划分分别为:A/R1={X1,X2,X3}={{x1,x2,x6},{x3,x4},{x5,x7,x8}} (颜色分类)A/R2={Y1,Y2,Y3}={{x1,x2},{x5,x8},{x3,x4,x6,x7}} (形状分类)A/R3={Z1,Z2,Z3}={{x1,x2,x5},{x6,x8},{x3,x4,x7}} (大小分类) 上面这些所有的分类合在一起就形成了一个基本的知识库。那么这个基本知识库能表示什么概念呢?除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的{x1,x2}这样的概念以外还可以表达例如大的且是三角形的{x1,x2,x5}∩{x1,x2}={x1,x2},大三角{x1,x2,x5}∩{x1,x2}={x1,x2},兰色的小的圆形({x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7},兰色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。而类似这样的概念可以通过求交运算得到,比如X1与Y1的交就表示红色的三角。所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2.A/R3)一起就构成了一个知识系统记为R=R1∩R2∩R3,它所决定的所有知识是A/R={{x1,x2},{x3},{x4},{x5},{x6},{x7},{x8}}以及A/R中集合的并。 下面考虑近似这个概念。假设给定了一个A上的子集合X={x2,x5,x7},那么用我们的知识库中的知识应该怎样描述它呢?红色的三角?****的大圆?都不是,无论是单属性知识还是由几个知识进行交、并运算合成的知识,都不能得到这个新的集合X,于是我们只好用我们已有的知识去近似它。也就是在所有的现有知识里面找出跟他最像的两个一个作为下近似,一个作为上近似。于是我们选择了“兰色的大方块或者兰色的小圆形”这个概念:{x5,x7}作为X的下近似。选择“三角形或者兰色的”{x1,x2,x5,x7,x8}作为它的上近似,值得注意的是,下近似集是在那些所有的包含于X的知识库中的集合中求并得到的,而上近似则是将那些包含X的知识库中的集合求并得到的。一般的,我们可以用下面的图来表示上、下近似的概念。这其中曲线围的区域是X的区域,蓝色的内部方框是内部参考消息,是下近似,绿的是边界加上蓝色的部分就是上近似集。其中各个小方块可以被看成是论域上的知识系统所构成的所有划分。整个粗集理论的核心就是上面说的有关知识、集合的划分、近似集合等等概念。 下面我们讨论一下关于粗糙集在数据库中数据挖掘的应用问题。考虑一个数据库中的二维表如下:元素颜色形状大小稳定性 x1 红三角大稳定 x2 红三角大稳定 x3 黄圆小不稳定 x4 黄圆小不稳定 x5 兰方块大稳定 x6 红圆中不稳定 x7 兰圆小不稳定 x8 兰方块中不稳定 可以看出,这个表就是上面的那个例子的二维表格体现,而最后一列是我们的决策属性,也就是说评价什么样的积木稳定。这个表中的每一行表示了类似这样的信息:红色的大三角积木稳定,****的小圆形不稳定等等。我们可以把所有的记录看成是论域A={x1,x2,x3,x4,x5,x6,x7,x8},任意一个列表示一个属性构成了对论域的元素上的一个划分,在划分的每一个类中都具有相同的属性。而属性可以分成两大类,一类叫做条件属性:颜色、形状、大小都是,另一类叫做决策属性:最后一列的是否稳定? 下面我们考虑,对于决策属性来说是否所有的条件属性都是有用的呢?考虑所有决策属性是“稳定”的集合

●信息检索的意义和作用

第1章绪论 主要内容:本章主要阐述信息检索的意义和作用,叙述信息、知识、情报和文献的基本概念,并根据文献划分的不同标准,讲述文献的各种类型及特点。 人类迈入21世纪时,社会信息化已成为不可阻挡的时代潮流,信息已经成为最重要的战略资源之一。但随着现代科学技术尤其是计算机技术和网络技术的迅猛发展,社会信息量激增,信息呈现出爆炸式的增长趋势。然而在信息的汪洋之中,存在着大量虚假信息和无用信息,这使得获取有用的信息资源变得越来越困难。因此,信息检索能力已成为新时代人才的一项必备技能。而作为新时代的大学生,信息检索能力的培养显得尤为重要。 1.1 信息检索的意义和作用 如何检索和利用信息资源,是一门学问,是现代人才的必备素质,也是一个人知识和能力可持续发展的重要条件。教育部和国家教委早在1984年就要求各高校开设文献检索课,并作为必修课,目的就是培养大学生的信息意识和获取文献信息的技能。近几年,随着计算机和通信技术的发展,社会信息进程加快,信息、物质、能源成为人类社会的三大财富,谁拥有信息谁就拥有财富,信息对于经济和社会的发展、科技文化的进步都起着重要的作用,谁掌握了最新信息,谁就掌握了主动权。信息在社会生活中越来越重要,信息检索与利用这门课的作用也日益重要。 1.1.1 增强信息意识 信息意识,即人的信息敏感程度,是人们对自然界和社会的各种现象、行为、理论观点等从信息的角度理解、感受和评价。通俗地讲,就是面对不懂的东西,能积极主动地去寻找答案,并知道到哪里、用什么方法去寻求答案,这就是信息意识。它的评价内容包括:(1)对信息科学的认识;(2)对信息的社会作用、经济价值的认识;(3)对特定信息需求的自我识别;(4)能充分、正确地表达出对特定信息的需求。

粗糙集考试资料整理

粗糙集:等价关系和分类;精确集和粗糙集;属性间的依赖程度。(一张表,互信息和依赖程度都计算) 1、粗糙集基本概念: 粗糙集(Rough Set)理论是波兰数学家Z.Pawlak于1982年提出的,是一种新的处理含糊性和不确定性问题的数学工具。相对于概率统计、模糊集等处理含糊性和不确定性的数学工具而言,粗糙集理论有这些理论不具备的优越性。统计学需要概率分布,模糊集理论需要隶属函数,而粗糙集理论的主要优势就在于它不需要关于数据的任何预备的或额外的信息。 1982 年, 波兰学者Z. Paw lak 提出了粗糙集理论, 它是一种刻划不完整性和不确定性的数学工具, 能有效地分析不精确,不一致( incon sisten t),不完整( incomp lete) 等各种不完备的信息, 还可以对数据进行分析和推理, 从中发现隐含的知识, 揭示潜在的规律. 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分.粗糙集理论将知识理解为对数据的划分, 每一被划分的集合称为概念.粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用已知的知识库中的知识来(近似) 刻画.该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论, 模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性. 在粗糙集理论中,"知识"被认为是一种分类能力.人们的行为是基于分辨现实的或抽象的对象的能力, 根据事物的特征差别将其分门别类的能力均可以看作是某种"知识". 2、关系、等价关系和分类 关系R:设U是一个非空集合,R是U上的一个关系,如果R是U×U的一个子集。例如,实数集中的“>”关系就是2维平面中的子集{(x, y):x >y};整数集中的“整除”关系就是Z×Z中的子集{(a, b):存在q∈Z,使得b = ra};等等。 等价关系:满足反身性,对称性和传递性的关系。例如,相等关系,三角形的相似关系。 等价关系与集合分类:一个等价关系可以给集合一个分类(等价类);集合的一个分类也对应一个等价关系。等价类。最细的分类和最粗的分类。 由等价关系R产生的关于集合U的分类(等价类)就是这个集合包含的知识。 分类过程中, 相差不大的个体被归于同一类, 它们的关系就是不可分辨关系( indiscernability relation). 假定只用两种黑白颜色把空间中的物体分割两类, {黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的, 因为描述它们特征属性的信息相同, 都是黑色. 如果再引入方,圆的属性, 又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时, 如果两个同为黑色方物体, 则它们还是不可分辨的. 不可分辨关系也称为一个等效关系(equivalence relationship ), 两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系.

相关文档