元数据

1.什么是元数据

元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。

2.元数据的特点[1]

①元数据是关于数据的结构化的数据,它不一定是数字形式的,可来自不同的资源。

②元数据是与对象相关的数据,此数据使其潜在的用户不必先具备对这些对象的存在和特征的完整认识。

③元数据是对信息包裹(Information Package)的编码的描述。

④元数据包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发现和检索。

⑤元数据不仅对信息对象进行描述,还能够描述资源的使用环境、管理、加工、保存和使用等方面的情况。

⑥在信息对象或系统的生命周期中自然增加元数据。

⑦元数据常规定义中的“数据”是表示事务性质的符号,是进行各种统计、计算、科学研究、技术设计所依据的数值,或是说数字化、公式化、代码化、图表化的信息。

3.元数据的类型[1]

根据功能可将元数据划分为管理型元数据、描述型元数据、保存型元数据、技术型元数据、使用型元数据。根据结构和语境可将元数据划分为三组:第一组为全文索引;第二组为简单结构化的普通格式,如DC、RFCl807、Template等;第三组为结构复杂的特殊领域内的格式,如FGDC、GILS、TEI、EAD等。

根据元数据的应用范围,可分为通用性元数据、专业性元数据、Web元数据、多媒体元数据。

4.元数据的结构[1]

①内容结构。包括描述性元素、技术性元素、管理性元素、复用性元素。

②句法结构。包括元素的分区分层分段组织结构、元素结构描述方法、DTD描述语言、元数据复用方式、与被描述对象的捆绑方式。

③语义结构。包括元素内容编码规则定义、元素定义、元素语义概念关系、元数据版本管理。

5.元数据的作用[2]

元数据是网络信息资源描述的重要工具,可以用于网络信息资源管理的各个方面,包括信息资源的建立、发布、转换、使用、共享等。元数据在网络信息资源组织方面的作用可以概括为五个方面:描述、定位、搜寻、评估和选择。

(1)描述作用:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。

(2)定位作用:由于网络信息资源没有具体的实体存在,因此,明确它的定位至关重要。元数据包含有关网络信息资源位置方面的信息,因而由此便可确定资源的位置之所在,促进了网络环境中信息对象的发现和检索。此外,在信息对象的元数据确定以后,信息对象在数据库或其他集合体中的位置也就确定了,这是定位的另一层含义。

(3)搜寻作用:元数据提供搜寻的基础,在著录的过程中,将信息对象中的重要信息抽出并加以组织,赋予语意,并建立关系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。

(4)评估作用:元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准即可对其价值进行必要的评估,作为存取利用的参考。

(5)选择作用:根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。

6.元数据的各种解决方案[1]

1.网络资源:Dublin Core、IAFA Template、CDF、Web CoIlections。

2.文献资料:MARC(with 856 Field),Dublin Core。

3.人文科学:TEI Header(Text encoding initiative Header)。

4.社会科学数据集:ICPSR SGML Codebook。

5.博物馆与艺术作品:CIMI(Computer Interchange of Museum Information)、CDWA(Categories for the Description of Works of Art)、RLG REACH Element Set、VRA Core。

6.政府信息:GILS(Government Information Locator Service)。

7.地理空间信息:FGDC/CSDGM(Federal Geographic Data Committee/Content Standard for Digital Geospatial Metadata)。

8.数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core NISO/CLIR/RLG Technical Metadata for Images。

9.档案库与资源集合:EAD。

10.技术报告:RFC 1807、ibTeX、EELS、EEVL。

11.连续图像:MPEG-7。