都柏林核心(Dublin Core)

作者: 阮一峰

日期: 2007年3月12日

珠峰培训

上一篇日志中,我介绍了元数据(MetaData),并且说只要有一个集合,就可以定义一套元数据。

这样一来,很自然的,我们就会想到一个问题:有没有可能定义一套通用的元数据,即所有的信息都可以用一套元数据来描述?

1995 年3 月,国际图书馆电脑中心(Online Computer Library Center,简称OCLC)在美国俄亥俄州小城都柏林,提出一套元数据的元素集(metadata element set),用来描述网上的信息,实际上这等于可以描述一切信息。这套元数据被称为"都柏林核心"(Dublin Core)。经过10年的发展,已经在全世界得到了广泛采用。

在"都柏林核心"的简化形式(Simple Dublin Core)中,共包含15个元素,它们是:

元素名称:题名(Title)
定义:赋予资源的名称 。
注释:资源名一般指资源对象正式公开的名称。

元素名称: 创建者(Creator)
定义:创建资源内容的主要责任者。
注释:创建者的实例包括个人,组织或某项服务。一般而言,用创建者的名称来标识这一条目。

元素名称: 主题(Subject)
定义:资源内容的主题描述。
注释:如果要描述特定资源的某一主题,一般采用关键词、关键字短语或分类号,最好主题和关键词从受控词表或规范的分类体系中取值。

元素名称: 描述(Description)
定义:资源内容的说明。
注释:描述可以包括但不限于以下内容:文摘、目录、对以图形来揭示内容的资源而言的文字说明、或者一个有关资源内容的自由文本描述。

元素名称: 出版者(Publisher)
定义:使资源成为可以获得并可用的责任者。
注释:出版者的实例包括个体,组织,或服务。一般而言,应该用出版者的名称来标识这一条目。

元素名称: 其他责任者(Contributor)
定义:对资源的内容作出贡献的其他实体。
注释:其他责任者的实例可包括个人、组织或某项服务。一般而言,用其他责任者的名字来标识这一条目。

元素名称: 日期(Date)
定义:与资源生命周期中的一个事件相关的时间。
注释:一般而言,日期应与资源的创建或出版日期相关。建议采用的日期格式应符合ISO 8601 [W3CDTF]规范,并使用YYYY-MM-DD的格式。

元素名称: 类型(Type)
定义:资源内容的特征或类型。
注释:资源类型包括描述资源内容的一般范畴,功能,种属,或聚类层次的术语。建议采用来自于受控词表中的值(例如DCMI类型词汇表[DCMITYPE])。要描述资源的物理或数字化表现形式,请使用"格式(FORMAT)"元素 。

元素名称: 格式(Format)
定义:资源的物理或数字表现形式。
注释:一般而言,格式可能包括资源的媒体类型或资源的大小,格式元素可以用来决定展示或操作资源所需的软硬件或其他相应设备,例如大小包括资源所占的存储空间及持续时间。建议采用来自于受控词表中的值(例如用"Internet媒体类型[MIME]"列表中的词定义计算机媒体格式)。

元素名称: 标识符(Identifier)
定义:在特定的范围内给予资源的一个明确的标识。
注释:建议对资源的标识采用符合某一正式标识体系的字符串及数字组合。例如正式的标识体系包括统一资源标识符(URI) (包含统一资源定位符URL)、数字对象标识符 (DOI)和国际标准书号 (ISBN)。

元素名称: 来源(Source)
定义:对当前资源来源的参照。
注释:当前资源可能部分或全部源自该元素所标识的资源,建议对这一资源的标识采用一个符合正式标识系统的字串及数字组合 。

元素名称: 语种(Language)
定义:描述资源知识内容的语种。
注释:建议本元素的值采用RFC 3066[RFC3066],该标准与ISO 639 [ISO639]一起定义了由两个或三个英文字母组成的主标签和可选的子标签来标识语种。例如用"en"或"eng"来表示English, "akk" 来表示Akkadian, "en-GB"表示英国英语。

元素名称: 关联(Relation)
定义:对相关资源的参照。
注释:建议最好使用符合规范标识体系的字符串或数字来标识所要参照的资源。

元素名称: 覆盖范围(Coverage)
定义:资源内容所涉及的外延与覆盖范围。
注释:覆盖范围一般包括空间位置(一个地名或地理坐标)、时间区间(一个时间标签,日期或一个日期范围)或者行政辖区的范围(比如指定的一个行政实体)。推荐覆盖范围最好是取自于一个受控词表(例如地理名称叙词表[TGN]),并应尽可能地使用由数字表示的坐标或日期区间来描述地名与时间段 。

元素名称: 权限(Rights)
定义:有关资源本身所有的或被赋予的权限信息。
注释:一般而言,权限元素应包括一个对资源的权限声明,或者是对提供这一信息的服务的参照。权限一般包括知识产权(IPR),版权或其他各种各样的产权 。如果没有权限元素的标注,不可以对与资源相关的上述或其他权利的情况作出任何假定。

现在,大中型图书馆几乎全部采用"都柏林核心"记录书籍信息,因此很容易在图书馆的数据库中找到实例。

[参考链接]

* 都柏林核心官方网站(英文)
* 2004年都柏林核心年会,上海
(中文)

(完)

贝米钱包

腾讯课堂

留言(5条)

站长最近写的几篇关于分类的东西很有意思啊,是在构思读书公园里电子书的新分类么?

pin的感觉很准啊,呵呵。

太期待了!

hi, this is Chen Jing. Thank you for your blog! i was searching something about Dublin Core Metadata Initiative, then your blog came out. i would like to say, you blog is cool, i like it! actually,i am doing my master in Vienna, working with the ontology using Protege. it is a little difficult for me about those computer terms as i am a forester instead of a computer scientist,hehe... sometimes i am really confused about the web language and lots of IT staff.
i hope to get more help from your blog.
if possible, can you tell me how to build a homepage like yours? something like www.chenjing.com, hehe...
KEEP IT UP!

引用陈晶的发言:
if possible, can you tell me how to build a homepage like yours? something like www.chenjing.com, hehe...

please read the following post:
http://www.ruanyifeng.com/blog/2007/04/wordpress_vs_movable_type.html

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接