本文作者: 李鹏云, 陈奕, i engyun, hen i
李鹏云陈奕(武汉大学信息管理学院)摘要论文论述了元数据向元数据转换的必要性和可行性,介绍了国内外在这方面的研究现状,并对其技术实现作出展望。关键词元数据元数据转换bstracthispaperdiscussesthenecessityandfeasibilityofthetransformfrometadatatoeta-data.talsogivestheintroductiontothedomesticandoverseasresearchconditionandmakestheprospectonitstechnologyrealization.eywordetadataetadataransform1引言随着网络时代的来临,传统图书馆正日益向数字图书馆方向转变,传奇文章图书馆资源网络化的需求随之越来越迫切。
数字图书馆的网络服务主要有两种:传统馆藏文献资源的网络化和网络文献资源的馆藏化。图书馆传统馆藏文献一般采用(achineeadableatalogue)数据格式,由图书馆专业人员负责编目和维护,其格式复杂,不具备直接放到网络上使用的可能性,从而限制了馆藏文献资源的网络化网络文献资源则由资源创作者加工而成,其网络描述能力远远超过了元数据的资源描述能力,但目前图书馆又无法直接使用。在这样的情况下,迫切需要一种扩展性好、适应能力强、可供专业和非专业著录人员使用的简单元数据格式,都柏林核心元数据集正好符合了这一要求,由此使元数据向元数据的转换成为数字图书馆建设进程中的当务之急。为了更清楚直观地展示前者向后者转换的必要性和可能性,特列出两者的字段映射表(见表1)。2元数据向元数据转换的必要性2.1元数据的缺陷机读目录(achineeadableatalogue)由美国国会图书馆制作,适用于各种文献资料的书目数据交换,并可应用于缩微品输出、联机访问、编目等诸多业务工作中11。它在各个图书馆间的联合编目和联机书目共享过程中发挥了重要作用,为实现全球范围内图书馆馆藏文献资源的共建共享奠定了坚实的基础。然而也有其自身的缺陷:2.1.1格式复杂,著录速度慢记录格式规定,一条完整书目数据的逻辑记录由四个部分依序构成,即头标区、地址目录区、控制区、可变数据区。前三个部分主要对一些基本特征进行说明,可变数据区则详细描述书目的各项数据。
这样的结构无疑不能满足馆藏文献资源的网络化要求,同时其著录效率不高,也无法适应越来越多网络文献资源著录的需求。2.1.2表述方式繁琐,数据冗长元数据的表述方式繁琐,它由一系列的数字和各种符号构成。其中有些数字及符号用于控制其数据长度和字段起始位置,实际上孤立起来看意义并不大,更重要的是造成了数据冗长,甚至一条记录可能长达几百个字符,由此难以准确定位和提炼有用的信息,给馆藏文献资源的网络化造成了一定的困难。2.1.3扩展性差数据格式的版本共有六传奇个,用于描述图书、连续出版物、地图等不同类型的文献资料。而且根据不同的国别,其格式也有所不同,如就是根据我国的具体国情制作的。但其只是在编码信息块用字段名的方式标示出不同格式的文献,而一旦出现新的文献格式,个人或图书馆在经过专家认证和相关机构的认可之前都无权为该新文献格式创造新字段名,这虽然在一定程度上保证了资源共享的效率,但同时也导致了其可扩展性的降低。2005年第2期新世纪图书馆国表1元数据和元数据的字段映射表元数据都柏林元数据集字段子字段字段说明字段修饰词(标准)a正文语种溢至06392(语言名的代码)101作品语种b中间语种(anguage)l766(两个字节代码的标准)a出版国别覆盖范围空间(oint、3166、102出版或制作国别ox、)时间(eriod、b出版地区(overage)3)题名200a正题名题名与责任说明lternative(可替换题名)(itle)200f第一责任说明题名与责任说明创作者无700a款目要素个人名称主要知识责任(reator)出版者210a出版发行地出版发行等无(ublisher)主题600a款目要素个人名称主题、e、(ubject)200耗其余责任说明题名与责任说明其他参与者无a次要知识责任个人名称次要知识责(ontributor)7024责任方式任日期reated(创建时间)alid(正确时210d出版、发行13期出版发行等间)vailable(可提供时间)ssued(ate)(出版日期)odified(修改时间)编码数据字段类型ypeocabulary(对资源内容105-192a相关类型编码数据(各资源类型)(ype)的属性和类型进行分类)a特种资料标识和文献的数量及单位xtent(说明资源的大小或者持续时c其它形态细节格式间的限定词)edium(说明资源的215载体形态项d尺寸(ormat)载体)(资源的通用描述形式的e附件标准)描述ableofontents(资源目录列表定无无无(escription)义)bstract(文摘限定词)来源430-437a来源名称继承、替代、吸收(统一资源定位标识符)(ource)a国家代码权限管理021版权我认为不是正确登记号无b版权登记号(ights)a收藏单位代码标识905馆藏信息(统一资源定位标识符)b登录号(dentifier)4(款目连接款目连接块关联sersionf、asersion、seplaced块)(elation)y、eplaces等2.1.4网络应用能力差元数据的制定就是为了方便机读目录的使用和各个图书馆书目数据的交换,缺乏与网络语言相结合的基础,难以满足图书馆馆藏文献资源的网络检索需要。2.2元数据的优点2.2.1元素集简洁,著录速度较快,有较强的网络文献针对性元数据在制定时仅是为了图书的信息资源共享,所以全面考虑了图书各方面的特点,对图书对象的描述极为新世纪图书馆2005年第2期详细,它有九个使用块,共160个子字段,如其款目连接块就有34个子字段,从各个角度揭示了被描述资源与其它资源之间的内在关系。而元数据集仅仅有15个核心元素用于描述对象,且简单易懂。2.2.2具有较强的可扩展性元数据比元数据的扩展性强,可以适应不同格式的文献资源描述。其中的格式元素(ormat)用于说明资源的物理或数字化表现形式,包括资源的媒体形式或尺寸以及有关大小及时长的标注。
它一般采用来自于受控词表中的值(如因特网媒体类型表中对计算机媒体格式的定义)。2.2.3描述方式上既有灵活性,又兼具相应的标准性元数据适合描述所有的文献,功能十分强大,但是仅凭15个非限定词仍然显得不够详细。因此,利用15个限定性元素来确保基本元素的描述更为具体,且可以根据所描述文献的具体特征和需要灵活地进行选择使用和重复使用。2.2.4具有强大的适应性在传统图书馆的著录格式中,为了实现对网络文献资源的著录,特增加了856字段(lectronicocationandccess,电子资源地址与检索),可以对网络信息资源的主机名、路径、令等进行著录及超文本的链接,尽管这样,依然无法适应网络文献资源变动性强、更新快、类型多样的发展趋势。而由网页制作者提供的元数据格式的著录信息与网页的信息相吻合,动态适应了网络信息不断变化发展的趋势,满足了网络文献资源著录内容及时更新的需要。
2.2.5具有强大的兼容性这包括两个方面:一是与不同浏览器和操作系统相兼容,元数据本身利用语言作为描述语言,而作为脚本语言具有平台无关性,从而保证了的兼容性二是与现存的其它元数据相兼容,可以作为结构化元数据来进行相互间的编码和转换。从以上几方面的比较可以看出,元数据向元数据的转换是当前数字图书馆发展过程中传奇网游要着力解决的问题,只有在这一问题妥善解决好的前提下,才能实现图书馆数字化工作的具体应用。3元数据向元数据转换的可行性前文已经论述了元数据向元数据转换的必要性,而更重要的是,它具有相应的切实可行性。元数据作为一种为储存、交换、处理和检索文献资源而精密设计的数据格式标准,其描述对象全面详尽、接齐全,元数据在一定程度上参考了它的格式特点,在吸取格式大部分优点的同时克服了其缺点(根据上文表1中两者各字段间的对比,可以看出的15个元素基本上都能在中找到相应字段),使得两者问不存在根本上的转换屏障,由此无疑为元数据向元数据的转换提供了现实可能性和切实可行性。4国内外的研究进展4.1国外的相关研究国外有许多制作元数据的工具,用户只需将描述对象的相关特征输入,就会形成规范的元数据文档。http:www.ub.1u.semetadatacreator.html就是其中之一。此工具解决了零散的对象特征向规范的元数据转换的问题,下一步就只需考虑如何将被描述对象的各个特征从已经做好的数据中解析出来。4.2国内相关研究台湾学者主要注重对元数据和元数据的相关元素进行比较研究。辅仁大学图书信息系专任副教授吴政睿经过潜心研究,制作出“中国机读编目格式(第三版)到都柏林核心集对照表”,以表格对比形式详细比较了元数据和数据格式的不同,并细化到字段级和子字段级的对比,从而为元数据向元数据的转换提供了理论准备。大陆地区的研究则相对滞后,由于大部分图书馆尚未完全意识到从元数据向元数据转换的重要性,所以无论从理论上还是实践上所做的工作都远远不够。在“中国期刊网”里输入“”、“”两个关键词,并以篇名为检索途径来检索从1994年至2004年间的相关文献,结果共返回7篇相关文献。其中有5篇专门论述元数据与元数据间的转换,并制定出相应的映射表有的文章还对转换软件的结构框架和主要功能作出了详细描述2,并“希望能通过编程来实现与之间的相互转换,使图书馆信息资源与网络信息资源合二为一”131。可见要实现这种转换,先进的编程技术是必不可少的保障。5技术展望综上所述,元数据向元数据转换具有理论上的必要性和实践上的可行性,而在现有的理论基础前提下,当务之急就是根据实际情况来研制和开发成熟的转换软件。只有真正将软件开发出来并顺利运用到现行的图书馆应用程序中,快速、批量地将元数据转换为标准规范的元数据并放置到网络上使用,才能使两者的转换真正变为现实,才能为数字图书馆的建设奠定坚实的技术基础,从而极大地加快数字图书馆建设的步伐。
参考文献1刘荣.图书情报自动化管理基础(修订版).武汉大学出版社.1998.2孙华,郑巧英.与元数据的映像与转换.上海交通大学学报,2003.9(增。a)3陈艳梅.也谈与的相互转换.图书馆学刊.2003(3)(作者信息:武汉大学信息管理学院图书馆学专业2002级在读硕士研究生,邮编:430072。收稿日期:200411-0l。
)编校:王陆军200s-ff-热血传奇第2a新世纪图书馆圈。
本文《试论MARC元数据向DC都柏林核心元数据的转换》 --- 作者: 李鹏云, 陈奕, i engyun, hen i
上一篇:思维导图在临床核医学教学中的应用
下一篇:银质针疗法在教学中的应用
Email: cz95@cz95.com ; 联系客服:15822478812