文档库 最新最全的文档下载
当前位置:文档库 › CALIS特色库管理型元数据规范

CALIS特色库管理型元数据规范

CALIS特色库管理型元数据规范
CALIS特色库管理型元数据规范

CALIS 特色库管理型元数据规范

(Version 1.0 )

2004-5-21

一、目标与原则

本方案的目标是为了实现CALIS 专题特色数据库的统一规范管理制定管理型元数据。

管理型元数据是保存信息资源的加工存档、结构、使用管理等方面的相关信息。根据CALIS 专题特色数据库“十五”期间的建设总体目标、资源特色,以及CALIS管理中心制定的《数字对象的管理元数据》,项目管理组按照特色库的需求制定了本项目管理型元数据规范,主

要包括对数字对象的管理型元数据和有关描述型元数据的管理型元数据。所有管理型元数据元素的取值都可由系统设定后自动生成。

本规范的设计遵循了简单性原则、通用性原则和可扩展性原则。由于各专题特色数据库

要处理的数字资源非常广泛,且应用背景也相当复杂,因此本规范只能提供最广泛意义上的

描述。各参建单位在建库过程中对一些具体应用可能会有更为精确的描述,可在不破坏本规范已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。

本方案的扩展规则为:各元数据标准应最大可能采用核心元数据集推荐的元数据项,并在语义上保持严格一致,对推荐的元素不能描述的特性可以增加元素,但新增加元素不能与

已有元素有任何语义上的重复。元数据的纵向扩展规则可使用子元素与属性的方式向下扩

展,子元素可多级扩展;元素与子元素可直接采用属性。

二、管理型元数据核心元素集

基本元素必备性( M =必备, A =有则必备)备注

标识号( ID )M系统自动生成

技术元数据A包括文本 /图像、音频、视频

等,由系统自动生成知识产权M

数字出处A

编目员M

入库时间M

审校员M

审校时间M

三、核心元素定义及标引规则

1.标识号( ID )元

素名称:标识号标

识: ID

1

定义:也称唯一标识符,是数字对象在CALIS 项目建设数据库中的唯一标识。

注释:该字段的著录遵循CALIS 特色库的统一规定。

必备性:必备

2.技术元数据

元素名称:技术

标识: techMD

定义:即技术方法元数据,是数字化主要来源资料及存储数字化内容供未来使用过程的方法。

子元素: textMD 、 audioMD 、 vedioMD 、 streamMD

注释:数字文件大致可以分为若干类别,文本,图像,视频,音频,分别引用不同的元数据。技术元数据可以根据要操作的媒体对象不同,而进行扩展。数字化过

程的加工标准参见《专题特色库数字资源加工标准使用手册》。必备性:有则必备

2.1 文本 /图像

元素名称:文本 /图像

标识: textMD

定义:描述文本、图像的数字化技术特征。

子元素:字符编码、载体规格、级别、色彩位深、分辨率、格式

注释:该字段的著录在对资源类型定义后,可由系统的默认值自动生成。

2.2 音频

元素名称:音频

标识: audioMD

定义:描述音频的数字化技术特征

子元素:采样率、量化级、通道数、比特率、文件格式、压缩算法

注释:该字段的著录在对资源类型定义后,可由系统的默认值自动生成。

2.3 视频

元素名称:视频

标识: vedioMD

定义:描述视频的数字化技术特征

子元素:分辨率(象素)、帧数(帧/秒)、视频数据速率(bps)、音频设定、音

频位速率( bps)

注释:该字段的著录在对资源类型定义后,可由系统的默认值自动生成。

2

2.4 流式媒体

元素名称:流式媒体

标识: streamMD

定义:描述流式媒体的数字化技术特征。

子元素:视音频平均位速率、语音位速率、音乐位速率、帧数(帧/秒)、适用传输速率

注释:该字段的著录在对资源类型定义后,可由系统的默认值自动生成。

3.知识产权

元素名称:知识产权

标识: rightMD

定义:著录与数字对象的存储、传输及使用有关的知识产权方面的信息。

子元素: owner、 restriction 、

属性:版权日期

必备性:必备

3.1 资源所有者

元素名称:资源所有者

标识: owner

定义:数字影像文件的版权所有者,可以是数字影像的制作者,也可以是数字影像文字的卖主或许可方。

属性:资源所有者的名称、邮件地址、电话号码、通讯地址。

必备性:必备

3.2 访问许可

元素名称:访问许可

标识: restriction

定义:说明对象使用的许可、范围以及协议条款。

属性:系统访问限制、访问许可的注释、访问许可的范围、许可开始日期、许可结束日期。

必备性:必备

4.数字出处元数据

元素名称:数字出处

标识: digiprovMD

3

定义:记录和数字对象的存档有关的信息。

子元素:处理者(process_creator)、处理时间(process_datetime)、标签(process_label)、任务 (task)

必备性:有则必备

5.编目员

元素名称:编目员

标识:

定义:记录该数字对象描述型元数据记录的编目员。

属性:编目员ID 、编目员姓名、编目员单位、编目员e-mail 、编目员电话、编目员通讯地址。

必备性:必备

6.入库时间

元素名称:入库时间

标识:

定义:资源提交到特色库本地正式库的日期。

注释:建议采用的日期格式应符合 ISO 8601 [W3CDTF] 规范,并使用 YYYY-MM-DD 的格式。

必备性:必备

7.审校员

元素名称:审校员

标识:

定义:记录该数字对象描述型元数据记录的审校员。

属性:审校员ID 、审校员姓名、审校员单位、审校员e-mail 、审校员电话、审校员

通讯地址。

必备性:必备

8.审校时间

元素名称:审校时间

标识:

定义:审校员对编目员提交的资源的审核日期。

注释:建议采用的日期格式应符合 ISO 8601 [W3CDTF] 规范,并使用 YYYY-MM-DD 的格式。

必备性:必备

4

常用项目管理工具

常用项目管理工具—本人看到的文章,共享 ---来源:不详。 随着IT行业的发展,IT行业内的项目拓展和投资比比皆是。为了提高项目管理水平,赢得市场竞争,特别是在加入WTO后在国内、国际市场上拥有与国际接轨的项目管理人才,越来越多的业界人士正通过不同的方式参加项目管理培训并力争获得世界上最权威的职业项目经理(PMP)资格认证。同时,大部分的IT行业项目管理人士正尝试使用项目管理软件对自己的项目进行辅助管理,为了方便大家的使用,现对项目管理作一简要介绍。 目前市场上项目管理软件种类较多,具有代表性的为微软项目管理软件2000,但大多以美国项目管理协会(PMI)的项目管理理论为基础,在使用过程中要注意以下内容: 一、项目管理软件特征 1.预算及成本控制 大部分项目管理软件系统都可以用来获得项目中各项活动、资源的有关情况。人员的工资可以按小时、加班或一次性来计算,也可以具体明确到期支付日;对于原材料,可以确定一次性或持续成本;对各种材料,可以设立相应的会计和预算代码。另外,还可以利用用户自定义公式来运行成本函数。大部分软件程序都应用这一信息来帮助计算项目成本,在项目过程中跟踪费用。项目过程中,随时可以就单个资源、团队资源或整个项目的实际成本与预算成本进行对比分析,在计划和汇报工作中都要用到这一信息。大多数软件程序可以随时显示并打印出每项任务、每种资源(人员、机器等)或整个项目的费用情况。 2.日程表 日程表程序主要用来对项目中各个单项资源或一组资源确定工作时间。可以用这些日程表计算出项目的进度计划。大部分系统软件都对基本工作时间设置一个默认值,比如星期一到星期五,早上8点到下午5点,中间有一小时的午餐时间。对于各个单项资源或一组资源,可以修改此日程表。例如:修改上、下班时间,按非工作时间输入公司假期,输入各种换班(白天、夜晚),包括节假日以及数量单位(小时、天、周)。汇报工作进程时要用到这些日程表,它通常可以根据每个单项资源按天、周或月打印出来,或者将整个项目的日程打印成一份全面的,可能有墙壁大的项目日程表。 3.电子邮件 一些项目管理软件程序的共同特征是可以通过电子邮件发送项目信息。这一功能使得用户不必通过打印机或屏幕显示,直接从电子邮件中获得信息。通过电子邮件,项目团队成员可以了解重大变化,比如最新的项目计划或进度计划,可以掌握当前的项目工作情况,也可以发出各种业务表格。 4.图形 对于有大量活动事项的项目工程,人工制出一份甘特图或网络图,或人工进行修改制图是一件极其乏味而又容易出错的工作。当前项目管理软件的一个最突出的特点是能在最新数据资料的基础上简便、迅速地制作各种图表,包括甘特图及网络图。有了基准计划后,任何修改就可以轻易地输入到系统中,图表自动会反映出这些改变。项目管理软件可以将甘特图中的任务连接起来,显示出工作流程。特别是用户可以仅用一个命令就在甘特图和网络图之间来回转换显示。另外,图形和表格通常有以下功能供用户使用: . 进行任务和关系的交互式操作处理。例如,通过图表连接任务,改变优先关系或通过扩展活动持续显示功能来改变活动持续时间。

石竹元数据管理软件 MetaOne Catalog_1.5

MetaOne产品简介

MetaOne 功能简介 MetaOne 基本功能 元模型/元数据管理 元数据关系维护 自动获取/批量导入 元数据版本管理 基本分析功能 元数据全文检索 系统管理 MetaOne 高级功能 元数据发布流程管理 高级分析功能 元数据分析 基本分析:血统分析、影响分析、映射分析等 高级分析:差异分析、表重要程度分析、表无关程度分析等 血统分析 元数据是企业数据资源管理、使用的基础。MetaOne 作为企业实施元数据管理的软件支撑平台,其先进的理念、成熟的技术让业界耳目一新。 元模型/元数据管理 元模型支持CWM 规范,可完全扩展;元数据展现树型化,体系结构清晰直观;支持常规数据类型,及针对企业应用的特殊类型,如大文本、枚举、公式编辑器、URL 等。 自动获取/批量导入元数据 自动获取:PowerCenter 、DataStage 、Oracle 、DB2、DB2 OLAP SERVER 、 Essbase 、TeraData 等 批量导入:Excel 格式、XMI 格式、Erwin 、PowerDesigner 等 元数据全文检索 多种组合条件的模糊查询,可在整个元数据环境随时检索所需信息 系统管理 基于角色的用户权限管理;用户可定制系统参数; 元数据发布流程管理 提供元数据发布流程管理,规范企业元数据的管理流程。可以让企业更好地管理和跟踪元数据的整个生命周期, 在元数据的流程管理中, 可以安全地创建、获取、扩展的元数据信息。 元数据关系维护 图形化的元数据关系维护,拖拉鼠标轻松实现,效果直观易于维护; 图形化维护ETL 程序内部的字段级映射关系,清晰追溯数据来源及加工过程。 元数据版本管理 元数据版本变更记录、版本变更查询、版本浏览、版本恢复

最具竞争力的十大人力资源管理软件厂商

最具竞争力的十大人力资源管理软件厂商包括: SAP公司的mySAP ERP HCM, 仁科公司的PeopleSoft, 甲骨文公司的Oracle HRMS, 铂金公司的PowerHRP Suite, 施特伟公司的HRplus, 东软公司的东软慧鼎, 明基逐鹿公司的Guru eHR, 用友公司的e-HR, 金蝶公司的HR系统, 普利斯奇正公司的e-HR。 (一)SAP公司的mySAP ERP HCM 厂商概况: SAP 是全球最大的企业管理软件供应商,成立于1972 年,总部位于德国沃尔多夫市,中国公司于1995年在北京成立。 产品特点: 在其博大精深的企业资源规划(ERP)解决方案中,SAP人力资源管理方案的正式名称是人力资本管理,即mySAP ERP Human

Capital Management (mySAP ERP HCM)。SAP对HCM概念不遗余力地推广,强调了SAP 已经把人力资源视为企业的战略资源来管理,以区别只提供传统人力资源功能的普通厂商。 在具体功能上,mySAP ERP HCM 的优势体现在能够对个人和团队贡献进行管理、衡量和奖励,能够将员工的技能、行为和激励与业务目标看齐,在最佳时间将最佳人选分配给最利于公司增值的任务上。总的来说,就是量化了人力的作用,真正把人力作为一项资源来进行调配。 mySAP ERP HCM 还有一些比较突出的特点: 1.员工培训与发展:可以制定个人培训计划、职业规划、接任计划。 2.薪资计算:支持50多个国家的工资单和规章制度要求。 3.工作排程非常完善,得益于学习了制造业在这方面的需求和管理的严密性,和Oracle/Peoplesoft相比,SAP的这一特点尤其突出。 4.人事管理:员工自助服务使员工可以随时查询、维护个人信息。 5.Portal做得,不少方面还比以易用性著称的Peoplesoft的Enterprise Portal还好。 6.组织结构管理: 有图形化的工具画组织结构图,比较方便。

元数据管理平台

元数据管理平台 技术白皮书 北京亿信华辰软件责任有限公司 2018年4月

目录 1.前言 (1) 1.1.关于本白皮书 (1) 1.2.背景介绍 (1) 1.3.产品定位 (1) 2.产品架构 (2) 2.1.概述 (2) 2.2.数据源层 (2) 2.3.采集层 (2) 2.4.数据层 (3) 2.5.功能层 (3) 2.6.访问层 (3) 3.产品功能特色 (4) 3.1.规范的元模型管理 (4) 3.2.端到端的自动化采集 (5) 3.3.全面的采集适配器 (5) 3.4.可灵活定制的采集模板 (6) 3.5.便捷的元数据检索 (7) 3.6.完善的元数据管理 (7) 3.7.强大的元数据版本管理 (8) 3.8.实时的元数据变更监控 (8) 3.9.数据地图鸟瞰全局 (9) 3.10.丰富的元数据分析应用 (9) 3.10.1.血缘分析 (9) 3.10.2.影响分析 (10) 3.10.3.全链分析 (10) 3.10.4.关联度分析 (11) 3.10.5.属性差异分析 (11) 3.11.出色的元数据检核机制 (12) 3.11.1.一致性检核 (12) 3.11.2.属性填充率检核 (12) 3.11.3.组合关系检核 (12) 3.12.自助式门户 (13) 3.13.丰富的服务接口 (13) 4.产品技术优势 (13)

4.1.系统设计原则 (13) 4.1.1.先进性 (14) 4.1.2.可维护性 (14) 4.1.3.可靠性 (14) 4.1.4.易用性 (15) 4.1.5.安全性 (15) 4.1.6.扩展性 (15) 4.2.可扩展采集适配器设计 (16) 4.3.采用MOF规范 (16) 4.4.支持基于XMI的数据交换 (17) 4.5.运用REST FUL架构 (18) 5.软硬软件环境 (19) 5.1.服务器配置推荐 (19) 5.2.客户端配置 (20) 5.2.1.客户端(建议配置) (20) 5.2.2.客户端浏览器 (20)

十大管理分析工具(精选.)

如下简要陈述现代职业经理人必备的十大管理工具,与大家共享。 一、PEST分析是指宏观环境的分析。 P是政治(Politics),E是经济(Economy),S是社会(Society),T 是技术(Technology)。在分析一个企业集团外部所处的背景的时候,通常是通过这四个因素来进行分析企业集团所面临的状况。 1. P政治法律环境 政治环境主要包括政治制度与体制,政局,政府的态度等等;法律环 境主要包括政府制定的法律、法规。 2. E经济环境 构成经济环境的关键战略要素:GDP、利率水平、财政货币政策、通 货膨胀、失业率水平、居民可支配收入水平、汇率、能源供给成本、 市场机制、市场需求等。 3. S社会文化环境 影响最大的是人口环境和文化背景。人口环境主要包括人口规模、年 龄结构、人口分布、种族结构以及收入分布等因素。 4. T技术环境 技术环境不仅包括发明,而且还包括与企业市场有关的新技术、新工 艺、新材料的出现和发展趋势以及应用背景。 二、4P分析法是营销管理中的专用工具 分别是PRICE(价格)、PROMOTION(促销)、PLACE(渠道)、PRODUCTION(产品) 三、5C是财务信用管理中的专用工具 分别是:CHARACTER(信用品质)、CAPITAL(资本金)、CAPACITY (偿付能力)、CONDITIONS(经营状况)、COLLATERAL(抵押物) 四、全面生产维修Total Productive Maintenance的缩略语 是以提高设备综合效率为目标,以全系统的预防维修为过程,全体人员参与为基础的设备保养和维修管理体系。 TPM强调五大要素,即: ——TPM致力于设备综合效率最大化的目标; ——TPM在设备一生建立彻底的预防维修体制; ——TPM由各个部门共同推行; ——TPM涉及每个雇员,从最高管理者到现场工人; ——TPM通过动机管理,即自主的小组活动来推进。(PM) 其具体含义有下面4个方面: 1. 以追求生产系统效率(综合效率)的极限为目标; 2. 从意识改变到使用各种有效的手段,构筑能防止所有灾害、不良、浪 费的体系,最终构成“零”灾害、“零”不良、“零”浪费的体系; 3. 从生产部门开始实施,逐渐发展到开发、管理等所有部门; 4.从最高领导到第一线作业者全员参与。

十大常用工具软件集锦

实用为上!十大常用工具软件集锦 随着电脑及互联网的普及,人们传统的工作方式、学习方式及思维方式逐渐发生变化,很多传统的信息查询方式都逐渐被电脑所取代,比如以前我们通常通过去书店买本词典来查询英语单词,而今我们只需安装一款免费的词典软件即可轻松查询单词甚至进行全文翻译,再比如现在很多人喜欢在网上淘宝,买到心仪的商品后很多人喜欢查询快递到达情况,我们再也无需要拿着快递单号去快递公司查询了直接在网上通过软件即可查询。为了生活的更加舒适和便捷,我们需要诸如此类的实用信息查询软件,随着这些软件大多是一些名不见经传的小软件,但是却是日常生活中实用性非常强的好工具,相信有了这些软件的帮助,我们的生活一定会更加舒适和便捷! 1.淘友必备:快递查询软件推荐——快递精灵 随着互联网的普及和人们消费观念的更新,网上购物已经被越来越多人所接受,网购成了时尚,成了不可阻挡的潮流,即使在全球金融风暴的阵阵寒流中,也依然可以看到“风景这边独好”。网购的不断发展,不仅仅给经营者和消费者带来实实在在的实惠,还带动了诸多行业的飞速发展,尤其是物流快递业,作为卖家与买家之间的纽带,快递业无疑遇到了行业发展的春天! 很多网友在网购后盼货心情急切,因此对快递跟单查询产生大量需求,一般情况下用户可以进入快递公司的网站进行查询,但是由于快递公司比较多,四处查找快递公司的网址比较不便,因此小编这里为大家推荐一款可以直接查询快递跟单信息的小工具:快递精灵。

快递查询精灵资料: 快递查询精灵软件预览: 快递查询精灵可以帮助用户查询几乎所有快递公司的跟单信息,包括邮政快递、申通快递、圆通快递等淘宝网常见合作快递单位,如图所示,用户只需在程序界面左侧输入快递单号即可轻松跟踪到快递运输情况。注意:快递查询服务必须在联网状态下进行。

元数据管理平台的建立

元数据管理平台的建立 1.1 元数据简介 元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。 元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据(structured data)。元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。 元数据的基本特点主要有: 1、元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要; 2、元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。 元数据体系构建了企业业务的逻辑框架和基本模型,从而决定了企业业务的功能特征、运行模式和系统运行的总体性能。企业业务的运作都基于元数据来实现。其主要作用有:描述功能、整合功能、控制功能和代理功能。 由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。

在数据仓库领域中,元数据按用途分成技术元数据和业务元数据。首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能: (1)描述哪些数据在数据仓库中; (2)定义要进入数据仓库中的数据和从数据仓库中产生的数据; (3)记录根据业务事件发生而随之进行的数据抽取工作时间安排; (4)记录并检测系统数据一致性的要求和执行情况; (5)衡量数据质量。 1.2 元数据管理平台体系结构 图1 元数据管理平台体系结构 关键特性

中国最流行的十大管理工具

中国最流行的十大管理工具 看一下最流行的管理工具,能够帮助我们了解企业领导的战略要务 1客户关系管理(2005 年排名: 第 1) 帮助公司了解客户并对其变化的需求作出迅速反应的 CRM,连续两年成为中国最流行的管理工具。我们调查的中国企业中,86% 都在使用这一工具,而全球水平为 83%,亚太地区其他国家的使用率为 87%。中国的管理者同样也给了 CRM 最高的满意度分数,尽管与其他国家相比,中国对它的满意度略低。 2(并列)客户细分(2005 年排名: 第 3) 将一个市场分成由离散的客户群体组成的不同细分市场,每个细分市场中的客户有共同点和相似之处,以帮助公司为每个细分市场开发不同的产品服务和相应的营销计划。尽管中国企业在这一工具的使用率上有大幅度提高,但仍然低于亚太地区其他国家。同样,对其满意度,中国公司也低于亚太其他国家的公司。 2(并列)战略规划(2005 年排名: 第 7) 牵涉到一个全面的流程,帮助公司决定业务目标以及如何分配有限的资源来实现目标。事实上,中国公司正更多地运用战略规划──一种更高层次、更为广泛的管理工具,这将帮助它们更好地利用供应链管理和精益运营这些解决具体问题的管理工具。尽管中国公司对战略规划的使用率有所提高,但是仍然低于世界其他国家。中国企业中,86% 在使用战略规划,而全球水平为 91%,亚太地区其他国家的使用率为 95%。 4业务流程再造(2005 年排名: 第 8) 全面地重新设计核心业务的流程,以实现生产力、生产周期和质量方面的大幅度改进。2005 年,中国公司中这一工具的使用率为 35%,远远低于世界其他国家。而这次调查中,中国的使用率翻了一倍多,达到 78%,高于世界其他国家 65% 的平均水平。全球范围来看,大公司使用业务流程再造这一工具比小公司更为成功。 5核心能力(2005 年排名:第 5) 帮助公司识别和投资那些能够创造独特客户价值的特殊技能与技术。开发公司核心能力的必要步骤之一是:将自己的业务能力与其他公司做比较,并在此基础上开发自己独特的业务能力。此外,企业还要为核心能力的培养设立组织性路标,并设定具体目标。 6(并列)供应链管理(2005 年排名: 第 6) 中国是大量使用供应链管理的国家之一,而它在其他国家的使用率还排不上前十位。供应链管理要求供应商、制造商、分销商、经销商和客户同步使用一个体系,跨越组织界线来紧密地交换信息、商品和服务。全球来说,供应链管理的满意度从 2005 年的第 2 位下跌到第 11 位。 6(并列)全面质量管理(2005 年排名: 第 2)

元数据管理

1.前言 数据仓库中的数据是从许多业务处理系统中抽取、转换而来,对于这样一个复杂的企业数据环境,如何以安全、高效的方式来对它们进行管理和访问就变得尤为重要。解决这一问题的关键是对元数据进行科学有效的管理。元数据是关于数据、操纵数据的进程和应用程序的结构和意义的描述信息,其主要目标是提供数据资源的全面指南。元数据不仅定义了数据仓库中数据的模式、来源以及抽取和转换规则等,而且整个数据仓库系统的运行都是基于元数据的,是元数据把数据仓库系统中的各个松散的组件联系起来,组成了一个有机的整体。2.元数据 2.1 元数据的概念 按照传统的定义,元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。 技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息。 2.2 元数据的作用 在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。 与其说数据仓库是软件开发项目,还不如说是系统集成项目[1],因为它的主要工作是把所需的数据仓库工具集成在一起,完成数据的抽取、转换和加载,OLAP分析和数据挖掘等。 3.数据仓库元数据管理现状 元数据管理的主要任务有两个方面:一是负责存储和维护元数据库中的元数据;二是负责数据仓库建模工具、数据获取工具、前端工具等之间的消息传递,协调各模

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

元数据管理方案

元数据管理方案

元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。经过元数据自动抽取,用户能够方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针正确对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word、PDF、XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。 元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。

1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: ●整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中能够是物理上集中的,也能够是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 ●根据安全级别,建立相应的访问机制 由于受到安全级别的限制,因此对于需要共享的数据要进行安全方面的限制,限制的手段能够有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 ●编目处理

十大管理工具

十大管理工具 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

管理者的常用管理工具 标签:分类: 管理者的常用管理工具序 管理者其实和领导者并非完全一样。管理者的层次从某种角度略低于领导者。领导是一门艺术,那么管理更多依靠的是技术。领导者过多依靠的是长期经验和经历所形成的个人魅力,被领导者享受的是心理精神的升华;而管理者更多的时候依靠的是授权和专业性,被管理者得到的更多的是激励和知识经验学习。 领导者关注的是企业方向、企业文化、价值责任等,他需要解答的问题多是企业是谁,为什么是这样,将来会怎样,价值判断标准是什么等等。而管理者更多关注的是选人用人、激励创新、发展战略、生产营销、财务核算等等,解答的问题多是赚钱了没有,如何赚更多的钱等等。 在中国的企业中,唐骏可以算得上是一名出色的管理者,甚至在某些角度已经上升到领导者的水平。 有一次,一个西南区的经理要辞职跳槽。当时唐骏正在澳洲参加一个非常重要的会议。 闻听此消息,唐骏打了一个电话问“你想好了吗” “我想好了”。 于是唐骏,马上请假,坐飞机辗转到昆明,而后又做几个小时的汽车找到这位经理。但是让人意料之外的是,唐骏和这位经理仅仅是聊了半个小时的当地天气等话题,然后又急急忙忙飞回澳洲继续参加会议。 第二天,很多行业杂志,纷纷发表文章,说唐骏不远万里,放下重要会议,挽留某某经理。 事后,人们问唐骏,您当时作为CEO,为什么还要对一个小小的区域经理做如此努力,而又听说你跟他没有说过一句挽留的话,只是见面谈谈家常,这又是为什么。唐骏解释说,这样做,主要是给这位经理留足面子,也让挖他的公司觉得挖到了难得的人才。 我们不难理解,在区域经理提出辞职的时候,如果挽留住他,万一挖他的那边真的是一个更好的发展机会,岂不埋没的下属;如果不挽留,那边万一是一个陷阱,岂不是把他推入人生发展的深渊。既然已经明确想好了。那么艺术性的处理,让挖人者和被挖者留足面子,同时也给自己留足面子,获得被挖者及业内人士的尊重景仰。这不愧是“一箭三雕”的做法。 这种高明的做法,多赢的结局,已经显示了唐骏不但是一个出色的管理者,也是一位成功的领导者。这就是管理者与领导者完美的结合与体现。 从现在开始,我们将一一总结过去,总结自己或者身边人的管理经验,化作点点碎碎的文字,与大家共享,并希望大家能够多多指教,让我们共同成长。 管理者的常用管理工具之一会议管理 对任何一个组织,任何一个层面的管理者来说,会议都是最重要的管理工具之一。您经常开会吗您的会议组织效率高吗让我们一起来探讨,如何开好会。 1、会前要准备材料。 准备好材料,主要是议题、方案、参与者、时间、地点的通知。这个通知不是简单的会议通知,还要有会议的讨论内容,多套的备选方案以及各个方案的优略点,主持人倾向选择的方案等等。真正的会议时间,不是讨论“可行与不可行”的问题,而是讨论“选A方案”还是“选择B方案”的表决。会议时间大部分用来表决,就要把内容印发材料,在会前通知下去。 2、会中主要用来表决。

2018年系统元数据管理系统分析

2018年系统元数据管理系统分析 1. 现状分析 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。 如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。 1.1 目前的困境 使用者(决策层、业务分析人员): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具体算法和来龙去脉。

数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照规范执行,随着项目的发展和时间的推移,导致数据仓库项目的健壮性和可维护性呈几何级数下降,给数据仓库的建设带来大量的重复工作。 1.2 什么是元数据管理 元数据最本质,最抽象的定义为:data about data (关于数据的数据)。而对于经营分析数据仓库而言,形象的定义为:元数据就是数据仓库的规范。这些规范包括对各种指标的定义、解释;包括对各表中数据的来龙去脉、数据的大小和格式的定义。 元数据管理,就是要建立一套行之有效的规范以及该规范的管控体系,实现从管理到查询到综合分析的全面管控,管理层次从接口到ETL处理、业务逻辑处理、结果展现处理和指标分析的方方面面,构成数据仓库应用系统的核心和基础。做到开发者能严格遵守规范,维护者和使用者有规范可查,有力的保障数据仓库项目的健壮性和可维护性。

元数据管理方案

元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针对的对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word、PDF、XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。 元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。 1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: 整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统

一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 ●根据安全级别,建立相应的访问机制 由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 ●编目处理 现阶段,主流格式的电子文档,主要包含:word、excel、ppt、pdf等。对主流格式的电子文档,要提供自动采集工具进行编目处理。采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文档发布后的采集效率。 对于格式特殊、内容有加密算法的文档,是很难通过抓取工具进行采集的,这些文档主要通过手工编目的方式来处理。 对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。 ●保存元数据 采集后的数据要放到数据库或者保存到硬盘上,另外要根据目录体系标准,把数据分解为元数据,然后进行存储 1.1.4数据库元数据抽取 数据中心需要抽取的数据库类型主要为Sql server,首先利用ETL工具从源数据库中将所需数据抽取至中心数据库基础业务库中,在利用元数据著录工具对抽取出来的数据进行元数据著录。

数据仓库中元数据的管理

数据仓库中元数据的管理M etadata M anagem en t i n a Data W arehouse 同济大学计算机科学与工程系(上海200092) 史金红 吴永明 【摘要】 介绍了数据仓库中四种基本类型的元数据,说明了不同类型元数据的收集和维护方法,并着重对分布式元数据的集成和管理进行了详细的阐述。 关键词:数据仓库,数据商场,决策支持,元数据 【Abstract】 T h is p ap er in troduces fou r typ es of m etadata and the m ethods of co llecting and m ain tain ing them.It focu ses on the m etadata m anagem en t and in tegrity. Key words: da ta warehouse,da ta mart, dec ision support,m etada ta 1 引言 随着社会的发展和计算机技术的进步,人们已不满足于用计算机只作简单的数据处理和事务处理。进一步用现有的数据进行分析和推理,从而为决策提供依据的需求导致了决策支持系统(D SS)的出现。90年代以来计算机技术、网络技术和数据库技术的迅速发展为D SS提供了必要的技术环境, OL T P和办公自动化普遍应用积累的大量数据为D SS提供了必要的数据基础,日趋激烈的市场竞争促进了各级管理和决策人员对D SS的实际需求,因此自从1991年W.H.Inm on提出数据仓库的概念和1993年E.F.Codd提出OLA P概念以来,已有许多商品化的数据仓库管理系统和联机分析处理工具软件面市。以上诸因素的共同作用促成许多公司、机构纷纷为提高自己的竞争能力建立数据仓库系统以进行决策支持。 元数据是成功的数据仓库的重要组成部分,它可以帮助数据仓库项目小组明确而全面地理解潜在数据源的物理布局以及所有数据元的业务定义,帮助数据仓库用户有效地使用仓库中的信息,帮助数据库管理员了解某些表的变化将对数据仓库产生怎样的影响以及不同商业过程对应的应用等等。项目小组在开发过程中应当识别元数据并将它收入到元数据商店中,实施适当的过程捕作企业数据结构和应用的变化,从而修改相应的元数据,并向用户提供适当的工具访问元数据。 2 元数据的基本类型 元数据按照其用户可以分为技术元数据和商业元数据。技术元数据提供给数据仓库的技术人员,数据仓库技术人员在仓库的开发和维护中使用这类元数据。商业元数据是商业用户在仓库中寻找他们所需商业信息的一个辅助。但是,技术人员可能也需要访问几种类型的商业元数据,如和商业用户讨论信息需求和建立企业的数据模型。同样,商业用户也需要尝试高水平的技术元数据。 元数据按其内容可以分为四个基本类型: 1)关于数据仓库潜在数据来源的信息,包括现有的业务系统、可得到的外部数据和目前手工维护的信息。例如,一个组织可以从中识别数据来源的潜在仓库数据源有:几个现有的应用程序,由财务部门保存的基于PC机的电子报表,从某一卖主处购买的销售数据,目前由顾客服务部门在纸上保存的顾客联系记录。 2)关于数据模型的信息,包括业务实体、关系、企业规则和企业数据模型。 3)关于业务数据与仓库数据结构间的映射信息。只要那些来源中的一个数据元与仓库建立了映射关系,就应该记录下这些数据元间的逻辑联系以及发生的任何变换或变动。 4)关于数据仓库中信息的使用情况。了解这类信息对更好地调整仓库性能、更多地利用现有查询以及理解仓库中的信息怎样用于解决企业问题是很重要的。 3 元数据的收集和维护 在适当的时间收集适当的元数据是成功实施元数据驱动的数据仓库的基础。为保证较高的准确

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

4电子文件通用元数据规范

电子文件元数据标准 (征求意见稿) 1.范围 本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。 本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。 2.编制目的 2.1 对文件及相关实体进行标准化描述; 2.2 实现不同机构、不同系统之间文件及信息的互操作; 2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据; 2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。 3.规范性引用文件 下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 2659-2000 世界各国和地区名称代码 GB/T 2260-2002 中华人民共和国行政区划代码 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 9704-1999 国家行政机关代码编制规则 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 4880-1991 语种名称代码 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 4881-1985 中国语种代码 GB/T 3792.1-1983 文献著录总则 GB/T 13959-1992 文件格式与代码编制方法 GB/T 15418-1994 档案分类标引规则 GB/T 3760-1995 文献叙词标引规则 GB/T 9704-1999 国家行政机关公文格式 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 GB/T 7156-2003 文献保密等级代码 GB/T 19667 基于XML电子公文格式规范 DA/T12-1994 全宗卷规范 DA/T13-1994 档号编制规则 DA/T18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 1-2000 档案工作基本术语

元数据管理方案

元数据管理方案 元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针对的对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word PDF XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。

元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。 1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: 整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 根据安全级别,建立相应的访问机制 由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/ 密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 编目处理 现阶段,主流格式的电子文档,主要包含:word、excel 、ppt 、pdf 等。对主流格式的电子文档,要提供自动采集工具进行编目处理。采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文档发布后的采集效率。 对于格式特殊、内容有加密算法的文档,是很难通过抓取工具进行采集的,这些文档主要通过手工编目的方式来处理。 对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。

相关文档
相关文档 最新文档