文档库 最新最全的文档下载
当前位置:文档库 › CELTS-3学习对象元数据规范

CELTS-3学习对象元数据规范

CELTS-3学习对象元数据规范
CELTS-3学习对象元数据规范

:学习对象元数据规

(一)什么是学习对象元数据

学习对象是指一切可为教学和培训目的服务的对象,可以是物理的:如实验器材、课本等;也可以是数字的:如教学软件,网络课件等。学习对象的粒度也可大可小,小到一图片,大到一门课程,都属于学习对象的围之。典型的学习对象包括多媒体容、教学容、教学目标、教学软件和工具、人、组织机构等等。学习对象在不同的教学系统中被使用、重用或引用,包括基于计算机的培训系统、交互式学习环境、智能的计算机辅助教学系统等等。

元数据是关于数据的数据,用于描述数据的属性。学习对象元数据用于描述学习对象的属性,如学习对象的名称、格式、教学目的等等。如果现在把“学习对象元数据规”看作是一个学习对象,那么下面就是它的一些典型的属性,即元数据:

学习对象元数据的作用在于:

●用户可以在不操作学习对象的情况下通过元数据信息来了解学习对象的一些有用的属

性,从而可以获取和更好地利用学习对象。

●通过元数据所提供的信息,可以对学习对象进行有效的分类管理和查找。

●用户可以从元数据信息中获取学习对象的评价信息,也可以把自己的评价加入到元数据

中,以便和他人共享。

●学习对象元数据为学习对象的互换和共享提供支持。

(二)本规的围

随着我们对学习需求的飞速增长,学习对象的数量也在迅速增长。学习对象相关信息或元数据的缺乏就直接影响到我们对这些对象的查找、管理和使用。本规就是为了解决这个问题而制订的。

本规定义了学习对象元数据的语法和语义,构成了一个学习对象属性的概念上的数据模型,用于描述学习对象元数据实例的结构。

本规中,学习对象元数据实例用于描述该对象的相关特征。这些特征被组合成几个不同的类别,包括通用信息、技术信息、教育信息和分类信息等等。

本规中,概念数据模型支持多种语言,这种多语言的支持适用于三个方面:学习对象所使用的语言;学习对象的元数据实例所使用的语言;学习对象的使用者所使用的语言。

本规中,概念数据模型定义了组成元数据实例的各个数据元素,并规定了各个数据元素的属性。

本规可以被别的标准所引用,例如用于定义数据模型实现(即绑定)的标准。这样,学习对象元数据实例就能被各种学习教育系统所使用,如管理、定位、评估和交换学习对象等等。

本规没有定义学习教育系统应该如何表示和使用学习对象的元数据实例。

(三)本规的目的

本规的目的是为学习者或教育者等对学习对象的查找、评估、获取和使用提供支持。同时也支持学习对象的共享和互换。如下图所示:

通过定义一个通用的概念数据模型,本规保证学习对象元数据的不同绑定之间有较高程度的语义互操作性。这样,不同绑定之间的转换就会变得直接。如下图所示:

本规意在规定一个基本的模型,在此之上能建立不同的实现。例如:用于支持代理对学习对象的自动和自适应的调度。

(四)本规的主要容

学习对象元数据规的主要容是学习对象属性的数据模型。该数据模型中的数据元素被组合成个不同的类别,如下图所示:

以上的个类别组成元数据结构的基本框架。这个类别语义明确,有利于元数据的模块化和重用。其中最后一个类别,即分类,允许用户根据任意的分类结构对学习对象进行分类。由于任何分类法都能被引用,这个类别提供了一种简单的扩展机制。

对于模型中的每个数据元素,在基本框架中作了如下定义:

●名称:数据元素的名称。

●解释:对数据元素的定义。

●属性:对数据元素属性的描述,包括必需数据元素和可选数据元素。

●大小:数据元素所允许的取值个数。

●顺序:值的排列顺序是否有意义(只适用于可取多个值的数据元素)。

●取值围:数据元素所能取的值的集合——一般以词汇表或引用另一个标准的形式出现。

●数据类型:不同的值的集合。

●例子:用于解释说明的例子。

学习对象元数据模型中的数据元素都有自己的属性:必需数据元素或可选数据元素。必需数据元素组成了学习对象元数据的核心集。任何和学习对象元数据规一致的元数据实例都必须包含核心集。任何和学习对象元数据规一致的应用程序都必须支持核心集。核心集的引入把元数据的数目减少到可以控制的围。核心集的分布如下图所示:

由上图可见,核心集中的元素都是一些十分通用的属性。

(五)本规的适用对象

本规的适用对象主要为学习对象著作工具的开发者、学习对象的开发者和教学系统的开发者。

学习对象著作工具的开发者需要对本规有较清楚的了解,尽量使自己的产品能支持学习对象元数据实例的自动生成,这样的产品将会有更多的机会被学习对象的开发者所采纳。

学习对象的开发者可以利用著作工具自动地或手工地产生符合学习对象元数据规的元数据实例,这样的学习对象会被更多的用户所接纳,因为它具有较好的互操作性。

对于教学系统的开发者,需要对本规有所了解,以便能利用符合学习对象元数据规的元

数据实例为自己的应用系统服务,包括学习对象的管理、查找、调度等等。

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

2018年系统元数据管理系统分析

2018年系统元数据管理系统分析 1. 现状分析 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。 如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。 1.1 目前的困境 使用者(决策层、业务分析人员): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具体算法和来龙去脉。

数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照规范执行,随着项目的发展和时间的推移,导致数据仓库项目的健壮性和可维护性呈几何级数下降,给数据仓库的建设带来大量的重复工作。 1.2 什么是元数据管理 元数据最本质,最抽象的定义为:data about data (关于数据的数据)。而对于经营分析数据仓库而言,形象的定义为:元数据就是数据仓库的规范。这些规范包括对各种指标的定义、解释;包括对各表中数据的来龙去脉、数据的大小和格式的定义。 元数据管理,就是要建立一套行之有效的规范以及该规范的管控体系,实现从管理到查询到综合分析的全面管控,管理层次从接口到ETL处理、业务逻辑处理、结果展现处理和指标分析的方方面面,构成数据仓库应用系统的核心和基础。做到开发者能严格遵守规范,维护者和使用者有规范可查,有力的保障数据仓库项目的健壮性和可维护性。

《元数据的作用 [元数据的构成方式]》

《元数据的作用[元数据的构成方式]》 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。 元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根

据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。 二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

国家基础地理信息系统元数据标准(草案)

国家基础地理信息系统(NFGIS)元数据标准草案(初 稿) 1. 主题内容与适用范围 本标准提供国家基础地理信息系统(NFGIS)元数据的内容,包括NFGIS数据的标识、内容、质量、状况及其他有关特征。本标准可用于对NFGIS数据集的全面描述、数据集编目及信息交换网络服务。 2. 参考标准 ISO 15046-15地理信息--元数据(CD 2.0) FGDC 地理空间数据元数据内容标准(CSDGM)v.2.0 3. 术语 3.1 元数据 是关于数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据。 3.2 元数据元素(元数据Element)元数据最基本的信息单元。 3.3 元数据实体(元数据Entity)同类元数据元素的集合。 3.4 元数据子集(元数据Section)相互关联的元数据实体和元素的集合。 3.5 信息交换网络(Clearinghouse)数据生产者、管理者和用户之间的分布式、电子连接的网络。 3.6 数据志(Lineage)数据继承信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤等情况及负责单位的有关信息等。 3.7 引用文献(Citation)数据集引用或参考使用的资料、数据集、模型、文献等。 4. NFGIS 元数据层次结构和性质 4.1 元数据层次结构 本标准规定NFGIS元数据分为三层:元数据子集、元数据实体和元数据元素。 元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 4.2 元数据性质 本标准定义三种性质的元数据子集、实体和元素:

4电子文件通用元数据规范

电子文件元数据标准 (征求意见稿) 1.范围 本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。 本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。 2.编制目的 2.1 对文件及相关实体进行标准化描述; 2.2 实现不同机构、不同系统之间文件及信息的互操作; 2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据; 2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。 3.规范性引用文件 下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 2659-2000 世界各国和地区名称代码 GB/T 2260-2002 中华人民共和国行政区划代码 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 9704-1999 国家行政机关代码编制规则 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 4880-1991 语种名称代码 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 4881-1985 中国语种代码 GB/T 3792.1-1983 文献著录总则 GB/T 13959-1992 文件格式与代码编制方法 GB/T 15418-1994 档案分类标引规则 GB/T 3760-1995 文献叙词标引规则 GB/T 9704-1999 国家行政机关公文格式 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 GB/T 7156-2003 文献保密等级代码 GB/T 19667 基于XML电子公文格式规范 DA/T12-1994 全宗卷规范 DA/T13-1994 档号编制规则 DA/T18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 1-2000 档案工作基本术语

元数据管理模块方案1.doc

元数据管理模块方案1 目录 1. 现状分析(2) 1.1 目前的困境(2) 1.2 什么是元数据管理(3) 2. 目标分析(3) 2.1 建立完善的指标解释体系(3) 2.2 建立规范的元数据管理体系(4) 2.3 建立有效的数据稽核体系(4) 3. 功能概述(4) 3.1 元数据管理(4) 3.1.1 业务元数据(5) 3.2.2 技术元数据(6) 3.3元数据分析(9) 3.3.1 血统分析(9) 3.3.2 影响分析(10) 3.3.3 重要性分析(11)

3.3.4 无关性分析(12) 3.4数据稽核(12) 3.4.1 稽核规则管理(13) 3.4.2 稽核任务调度(13) 3.4.3 稽核结果分析(14) 3.4.4 数据质量评估(14) 3.4.5 数据问题管理(14) 元数据管理系统概述 1.项目背景 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。 如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。

1.1 需求分析 使用者(决策层、业务分析人员): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这 些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具 体算法和来龙去脉。 数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本 上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据 业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照 规范执行,随着项目的发展和时间的推移,导致数据仓库项

ELK元数据管理规范

ELK数据接入 元数据管理规范 版本历史 目录 1概述5 1.1文档目的 5 1.2文档范围 5 1.3读者对象 5 1.4术语及定义5 2原始数据规范 6 2.1数据格式定义 6 2.2业务文档化6 3数据传输 7 3.1Filebeat传输规范 7 3.1.1数据格式 7

3.1.2配置规范 7 3.2Logstash传输规范7 3.2.1数据格式 7 3.2.2配置规范 7 3.3Kafka消息中间件数据规范7 4数据存储 7 4.1ES存储规范7 4.1.1索引格式 7 4.2HDFS存储规范8 4.3MySQL存储规范8 5附录8 1.概述 a.文档目的 本文档针对所有接入ELK平台的元数据进行约束,从数据接入方式和格式,到数据传输和存储制定标准规范,为开发者对数据的操作和二次开发提供参考。 b.文档范围 此文档包含原始数据格式规范,数据传输配置参考,以及数据最终落地和存储规范。 c.读者对象 此文档对所有内部开发人员提供元数据操作和管理约束。 d.术语及定义 ELK:Elasticsearch、Logstash和Kibana的简称。 ES:Elasticsearch的缩写。

2.原始数据规范 a.数据格式定义 所有原始数据要求能从接入处体现其关联业务,因此需要对涉及到的业务进行编号,编号规则暂定如下: i.编号由字母和数字组成,数字长度一般为4位。 ii.字母为业务名称缩写,数字为业务对应的工作编号,如lens0001。接入数据分为日志文件和HTTP实时数据两种。对于日志文件,业务编号需在文件名中体现出来。HTTP接口接入方式则根据数据的输入输出对其配置,一般来说,使用Logstash接入需保证pipeline的ID与业务编号一致,如果数据流向kafka消息中间件,对应topic的名称则为业务编号。 b.业务文档化 所有业务和对应编号信息需由统一文档进行管理,以方便查询。每个新的业务和数据接入展开时,也要求及时更新文档,备注更新日期和开发者姓名。 文档必需提供的信息包括: ●业务编号 ●业务名称 ●业务简介 ●业务开始时间 ●数据接入方式 ●数据接入路径(包括配置文件路径等) ●更新日期 ●开发者姓名 3.数据传输 a.Filebeat传输规范 i.数据格式 Filebeat主要用于数据收集和传输,它可以读取任何格式的数据并作简单的处理,我们在使用中读取的数据格式主要是json格式。

元数据仓储建设元数据规范

元数据仓储建设元数据规范 1.资源对象 资源对象为分布在全国各公共图书馆已发布的自建数字资源,类型包括但不限于数据库、图书、期刊、论文、报纸、图像、音频、视频等。 2.建设粒度 资源建设粒度,是指数字资源的记录单元,一般以具有独立名称,并可独立使用的一个资源为建设单位,如一个数据库、一种图书、一本期刊、一幅图像等,以及数据库中的子库、会议论文集或期刊中的一篇论文、一张光盘中的一个曲目。 3.元素 3.1元素说明项 在本规范中,每个元素都从标签、定义、元素的著录内容、注释、元素修饰词、编码体系修饰词及其用法、规范文档、必备性、可重复性等几方面进行定义,详见表1“元素的说明项目”。 表1:元素的说明项目

3.2元素简表 本规范包含元数据仓储建设的16个元素:名称、责任者、主题、描述、出版者、日期、类型、原始标识符、语种、关联、访问方式、发布地址、适用对象、版本、标识符、其他字段,其中必备元素有七个:名称、主题、类型、语种、访问方式、发布地址、适用对象。

3.3规范细则 3.3.1名称 标签:名称 定义:著录资源的名称 元素的著录内容:可以概括著录资源内容的词、词组、符号等。 注释:(1)若资源本身没有名称则需要编目者补充上,并在描述项进行说明。 (2)名称要能反映资源的内容,不能用图1、讲座1等名称作为资源名称。 必备性:必备 可重复性:可重复 著录范例: 例:名称:玉虎坠

3.3.2责任者 标签:责任者 定义:创建资源内容的主要责任者或者对资源内容做出贡献的其他实体。 元素的著录内容:一般为个人、团体的名称,可以包括除责任方式以外的修饰成份,如责任者的生卒年、朝代、国别、外文原名等。 注释:由个人或团体的名称来表示。 元素修饰词:责任方式 必备性:有则必备 可重复性:可重复 著录范例: 例1:责任者:孙绍俊 例2:责任者:(清)曹雪芹 3.3.2.1责任方式 标签:责任方式 定义:责任者与著录资源之间的责任关系。 元素修饰词的著录内容:著录责任者创建资源内容或对该内容做出其他贡献的方式,如著、编著、主编、拍摄、录制、主唱、主讲、主演等。 注释:若多个责任者有相同的责任方式,则著录一种责任方式,若多个责任者有不同的责任方式,则责任者和责任方式对应著录。 必备性:有则必备 可重复性:可重复 著录范例:

国家基础地理信息系统(NFGIS)元数据标准草案(初稿)

国家基础地理信息系统(NFGIS)元数据标准草案(初稿):1. 主题内容与适用范围 本标准提供国家基础地理信息系统(NFGIS)元数据的内容,包括NFGIS数据的标识、内容、质量、状况及其他有关特征。本标准可用于对NFGIS数据集的全面描述、数据集编目及信息交换网络服务。 2. 参考标准 ISO 15046-15地理信息--元数据(CD 2.0) FGDC 地理空间数据元数据内容标准(CSDGM)v.2.0 3. 术语 3.1 元数据 是关于数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据。 3.2 元数据元素(元数据Element) 元数据最基本的信息单元。 3.3 元数据实体(元数据Entity) 同类元数据元素的集合。 3.4 元数据子集(元数据Section) 相互关联的元数据实体和元素的集合。 3.5 信息交换网络(Clearinghouse) 数据生产者、管理者和用户之间的分布式、电子连接的网络。 3.6 数据志(Lineage) 数据继承信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤等情况及负责单位的有关信息等。

3.7 引用文献(Citation) 数据集引用或参考使用的资料、数据集、模型、文献等。 4. NFGIS 元数据层次结构和性质 4.1 元数据层次结构 本标准规定NFGIS元数据分为三层:元数据子集、元数据实体和元数据元素。 元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 4.2 元数据性质 本标准定义三种性质的元数据子集、实体和元素: ?必选(Mandatory)──元数据的核心内容,适用于各种被描述对象,是元数据文件必须包含的子集、实体或元素。 ?一定条件下必选(Conditional )──针对不同的被描述对象特征元数据文件所必须提供的子集、实体或元素。 ?可选(Optional)──该子集、实体或元素是可选的,由用户决定是否将其包含在元数据文件中。 5. NFGIS 元数据分级和特征 5.1 元数据分级 本标准规定元数据分为两级,即: ?基本元数据──提供地理数据源基本文档所需要的最少的元数据元素集。它包括回答下列问题的元数据元素: "是否有特定主题的数据集('什么')?"、"是否有特定地区的数据集('何处')?"、"是否有特定时段的数据集('何时')?" 以及"订购或了解数据集更多情况的联系人('谁')? ?完全元数据──提供完整的地理数据源(单独的数据集、数据集系列、各种地理要素)文档所需要的必选的和可选的元数据元素集。它完整地定义全部元数据,以便标识、评价、摘录、使用和管理地理信息。 5.2 元数据特征

视频资源元数据标准及著录规则

视频资源元数据标准及著录规则 视频资源元数据标准及著录规则 内容目录 1概述 1.1著录对象 1.2引用标准 1.3著录信息源 1.4著录用语言 2元数据标准 2.1元数据结构说明 2.2元素列表 2.3各元素的详细说明 3著录细则 1概述 本标准元数据格式分参考了The Dublin Core metadata element set (ISO 15836:2003)(都柏林核心元数据集),以及Dublin Core Qualifiers(都柏林码修饰词);著录规则部分依据《非书资料国际标准书目著录》第二版ISBD(NBM)。 1.1著录对象 以计算机存储设备为载体的视频资源,包括电影、电视剧、记录片、教学片等。 1.2引用标准 W3CDTF:由万维网联盟(W3C)制定的日期和时间的编码规则,它是ISO8601的一部分。 1.3著录信息源 视频资源著录的主要信息源依次为:视频资源本身(如片头和片尾)、不可分割

的容器(如光盘)及标签。若不能从主要信息源取得信息,则依次参考:文字附件(如影视剧本、连续镜头目录、影视宣传资料)、可分割的容器、其它来源。 1.4著录用语言 除原文名称用视频资源本身的语种著录外,其他均用简体中文著录。 2元数据规范 2.1元数据结构说明 每条元数据由若干元素组成,元素分为必备元素和可选元素。必备元素就是每条元数据必须具备的元素,可选元素则不是每条元数据都要具备的,可根据实际情况决定是否采用。 元素可有修饰词。关于修饰词的说明: 1)修饰词分为元素修饰词(element refinement)与编码体系修饰词(encoding scheme)。元素修饰词对元素的语义作进一步的细化,提高元素的专指性和精确性;编码体系修饰词规定元素或其修饰词所采用的编码体系,如具体的控制词表、日期格式、语种代码等。 2)修饰词的使用参考DCMI(Dublin Core Metadata Initiative)的都柏林码修饰词Dublin Core Qualifiers。 3)修饰词应遵循向上兼容的原则,修饰词的语义不能超出被修饰词(元素)的语义,修饰词只能对元素的含义范围做进一步的限定。 本元数据标准中各元素有以下属性。 名称(Name):元素/修饰词的名称 统一资源标识符(URL):元素的唯一标识符 标签(Label):关于元素/修饰词的可读的标签 版本(Version):产生该元素/修饰词的元数据标准版本 注册机构(Registration Authority):注册元素/修饰词的授权机构

电子的文件元数据要求规范

实用标准文案 精彩文档电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行 以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检 索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议 的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation –Records Management Processes –Metadata for Records—Part 1: Principles

元数据管理模块方案

目录 1. 现状分析 (2) 1.1 目前的困境 (2) 1.2 什么是元数据管理 (3) 2. 目标分析 (3) 2.1 建立完善的指标解释体系 (3) 2.2 建立规范的元数据管理体系 (4) 2.3 建立有效的数据稽核体系 (4) 3. 功能概述 (4) 3.1 元数据管理 (4) 3.1.1 业务元数据 (5) 3.2.2 技术元数据 (6) 3.3元数据分析 (9) 3.3.1 血统分析 (9) 3.3.2 影响分析 (10) 3.3.3 重要性分析 (11) 3.3.4 无关性分析 (12) 3.4数据稽核 (12) 3.4.1 稽核规则管理 (13) 3.4.2 稽核任务调度 (13) 3.4.3 稽核结果分析 (14) 3.4.4 数据质量评估 (14) 3.4.5 数据问题管理 (14)

元数据管理系统概述 1. 现状分析 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。 如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。 1.1 目前的困境 使用者(决策层、业务分析人员): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这 些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具 体算法和来龙去脉。 数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本 上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据 业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照

CALIS特色库管理型元数据规范

CALIS 特色库管理型元数据规范 (Version 1.0 ) 2004-5-21 一、目标与原则 本方案的目标是为了实现CALIS 专题特色数据库的统一规范管理制定管理型元数据。 管理型元数据是保存信息资源的加工存档、结构、使用管理等方面的相关信息。根据CALIS 专题特色数据库“十五”期间的建设总体目标、资源特色,以及CALIS管理中心制定的《数字对象的管理元数据》,项目管理组按照特色库的需求制定了本项目管理型元数据规范,主 要包括对数字对象的管理型元数据和有关描述型元数据的管理型元数据。所有管理型元数据元素的取值都可由系统设定后自动生成。 本规范的设计遵循了简单性原则、通用性原则和可扩展性原则。由于各专题特色数据库 要处理的数字资源非常广泛,且应用背景也相当复杂,因此本规范只能提供最广泛意义上的 描述。各参建单位在建库过程中对一些具体应用可能会有更为精确的描述,可在不破坏本规范已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。 本方案的扩展规则为:各元数据标准应最大可能采用核心元数据集推荐的元数据项,并在语义上保持严格一致,对推荐的元素不能描述的特性可以增加元素,但新增加元素不能与 已有元素有任何语义上的重复。元数据的纵向扩展规则可使用子元素与属性的方式向下扩 展,子元素可多级扩展;元素与子元素可直接采用属性。 二、管理型元数据核心元素集 基本元素必备性( M =必备, A =有则必备)备注 标识号( ID )M系统自动生成 技术元数据A包括文本 /图像、音频、视频 等,由系统自动生成知识产权M 数字出处A 编目员M 入库时间M 审校员M 审校时间M 三、核心元素定义及标引规则 1.标识号( ID )元 素名称:标识号标 识: ID 1

XX银行数据管理办法.

XX银行数据管理办法 第一章总则 第一条为了提高我行经营管理的信息化水平,贯彻执行数据管理体系规划,规范数据管理和具体实施流程,加强各级经营管理机构的数据管理和应用能力,树立和发挥数据的资产价值,特制定本办法。 第二条本办法适用于我行企业数据架构管理、数据标准管理、数据质量管理、主数据管理、元数据管理、数据安全管理、数据生命周期管理、数据基础平台管理、数据应用以及数据需求与规划管理共十项数据管理领域的管理活动。 第三条本办法所指数据是在我行经营管理和日常操作中通过计算机系统形成和存储的数据,可以分为内部数据和外部数据,内部数据指我行业务运营管理过程中产生的数据,外部数据指从我行以外的来源取得的数据。 第四条我行数据管理体系建设的总体方针如下: (一)提供可用、可信数据,打造可靠的应用基础。 (二)围绕数据应用、价值呈现推动数据管理建设。 (三)以高效的应用服务能力,支持全行业务发展和创新。

第五条本办法是指导全行数据管理活动的纲领,是建立、完善和落实数据管理体系的基础,我行数据管理制度和细则都应在本办法规定的基础上制定。 第二章组织与职责 第六条数据管理组织架构是通过建立与全行数据管理和应用工作相适应的组织机构和岗位,并明确各层级权责,保持内部沟通顺畅,确保全行数据管理战略的实施。我行数据管理组织的构成分为三个层次,自上而下划分为决策层、管理协调层以及执行层。 第七条数据管理决策层是全行数据管理的最高决策机构,由信息科技指导委员会、信息科技管理委员会组成。 信息科技指导委员会的主要职责包括: (一)审批全行数据管理整体方针和策略。 (二)定期听取信息科技管理委员会对数据管理工作的汇报。 信息科技管理委员会的主要职责包括: (一)审议数据战略目标和策略、体系规划、政策制度以及数据管理领域的重大事项。 (二)统筹资源,协调解决数据管理领域重大事项。 (三)对全行数据管理工作进行监督评价。

相关文档