开启左侧

国外数字化资源管理软件研究概况

[复制链接]
etthink 发表于 2010-4-16 08:36:30 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
1 数字化资源管理面临的困境
图书馆拥有的数字化资源的增多,使得图书馆对数字化资源的管理碰到了前所未有的挑战。因而资源整合、统一检索等成为业内一个讨论热烈的焦点。将我们面临的问题可总结为以下4个方面。
(1)编目与检索的问题。面对各种文件类型的多媒体资源,面对各种格式的数据库资源,怎样实现对这些资源的有效编目,并通过科学合理的方式揭示给读者?一般的考虑是将数字化资源与传统 OPAC检索同等对待,资源整合是思路之一。数字化资源管理软件应该实现这方面的功能,下面介绍的网关软件在这个方面采用了不同的方式,均有不同程度的买现。
(2)电子资源使用效率的问题。随着订购电子资源的增加,不同的数据库有不同的使用方法,不同的检索界面,不同的收录范围。怎样使读者充分了解这些资源与使用方法,将他们的价值得到充分的发挥呢?下文介绍的统一跨库检索软件和链接服务器将有助于解决这个问题。解决了这个问题,也就同时意味着减轻图书馆用户培训的压力。
(3)参考链接扩展服务的需求增长。当读者越来越习惯于使用电子资源时,对参考链接服务的需求也就会越来越迫切。他们在从事科学研究过程中,希望能够从参考引文链接到全文,从文摘索引数据库链接到本地馆藏库,根据某个元数据(比如作者),从一个信息商的数据库链接到另一个信息商的数据库等等。关于参考链接的研究在国外已经有多年的历史和多个实验项目。本文将就当前的国外比较成熟的产品作一个简单介绍。
(4)多种元数据格式的处理与利用问题。XML的优势得到了人们的共识,包括国内的多个数字图书馆项目,都设计了自己的元数据格式的标准,从而使得多种元数据格式的数据库数量也在不断增加中。对图书馆而言,怎样将各种格式的元数据资源无缝整合,并提供给用户使用,成为一个要面对的现实。在下文中,将简单介绍一部分国外的成熟产品,他们的思路和实现机制将对我们有所借鉴。
笔者认为,就像在上个世纪图书馆集成管理系统的普及利用,有效地解决了编目、公共检索等问题,推动了资源共享,大大提高了图书馆管理的水平一样,上述问题的解决仍旧离不开现代科技的支持,功能强大的各种数字资源管理软件必将是最终解决上述问题的手段。
由于国外在数字化的建设方面走在了我们的前面,数字化资源的管理矛盾先于我们出现,对管理的实质问题有比较深入的了解。也由于他们的软件企业在发展历史与机制上的不同,在解决图书馆数字资源的管理问题上,有更成熟的解决方案。所以研究它们的产品实例、技术思路,对于开阔视野,帮助我们认识和分析自己的问题,对于解决这些问题时的决策,避免我们走弯路,有一定的参考价值。本文将对该类重要的产品进行概貌介绍。
国外的信息技术支持商,特别是那些长期追踪图书馆需求并为图书馆提供信息技术的知名公司,包括Innovitive,Ex Libris,Endevor,Fretwell Downing等公司,纷纷为数字时代的图书馆提供多种系列的软件工具。这些产品就像上个世纪图书馆集成管理系统在图书馆的应用和发展,极大的影响和改变了图书馆的管理运作模式、思想观念、资源共享程度以及参考服务的形势和内容一样,也将对图书馆未来的数字化发展进程产生影响。这些产品迎合了图书馆的上述问题,在国外得到越来越多的应用和推广。因为在实际工作中需要关注该领域的问题,所以下面将我调研的一些成果介绍给大家,以求抛砖引玉。关注到国际上这些公司与产品的动向与原理,将可以从一个侧面开拓我们的视野,指导我们的工作。
2 参考链接工具软件
链接软件可以在电子资源间建立链接机制,提供扩展服务。异构异平台的电子资源间的链接服务,可以揭示资源间的内容逻辑关联,避免数据库成为“信息孤岛”,为学术研究提供有力的帮助。下面介绍几种该类软件。
2.1 SFX
SIX是Ex Libris公司推出的context-sensitive的动态链接,这个链接可以基于图书馆的电子资源情况动态配置。这些资源包括:全文数据库(知识仓库),文摘、索引和引文数据库,联机图书馆目录,论文的引文,e-print和其他Web资源等,当然该公司的KS系统ALEPH500也含在内。上述各类型资源既可以作为链接源,也可以作为链接目标。
SFX的特点是支持和推广了OpenURL协议,该协议为动态、开放式链接铺平了道路。OpenURL协议框架解决了在开放的学术资源环境中定位资源时的互操作问题,它将资源间的直接链接分离,通过链接源资源使OpenURL协议将链接所需要的元数据(作者、数字对象标示或题名等信息)传递给第三方,比如SFX server,然后再由SFX Server继续实现到链接目标资源的后续流程。借助该协议,链接源和链接服务器之间可以顺畅地传递成为链接关联点的元数据。由于Ex Libris是OpenURL协议的创始者,所以SFX也从中受益,SEX的链接范围(链接源和链接目标的数量)最大,商业推广也十分成功。
在SFX服务器与链接目标资源之间,根据从链接源获得的元数据以及预设知识库配置,生成链接地址(link to syntax),完成对目标资源(如全文电子期刊库中的文献)的链接服务。ExLibris公司为SEX提供的知识库,已经预设了大部分商业数据库之间实现链接的配置工作。用户只需要根据自己的需要,将那些自己定购的数据库激活,并根据自己的定购情况作适当的修改,即可投入实际应用。该知识库的设置,也是SFX实现“合适版本”链接的关键。
在应用方面,SVX既可以单独安装应用,也可以和本公司的Metalib集成工作,提供数据网关服务的同时,提供链接扩展服务。SFX还可以和 CrossRef/DOI框架联合工作,进一步增强了链接能力。SFX有用户验证和用户授权功能模块,来保证用户的合法使用资源。
用户在使用时,通过点击SIX按钮来获得上述链接和扩展服务。SFX的合法用户会在本馆的链接数据源处看到SFX按钮。它可以在文摘索引数据库、0PAC等记录后出现,也可以在文献中的引文后出现。用户在感兴趣的记录处点击SFX按钮之后,弹出一个SFX服务菜单。SFX的一个特别之处,是它不仅仅是一个全文链接服务器,它是一个可以提供多种扩展服务的服务器。在这个菜单中,既有对全文电子期刊的链接,也可以有到本馆或其他馆OPAC、文献传递服务系统、电子书店等其他资源的服务选择项,菜单的内容根据链接源传来的元数据的情况和图书馆的政策而定,由用户从中选择感兴趣的服务。
2.2 LinkerFinder Plus
Endeavor information system是一家著名的信息技术公司,它的ILS系统Voyage在美国大学图书馆中有广泛的用户。该公司拥有两种链接产品,LinkFinder和LinkFinder Plus。 LinkFinder是Endeavor's Citation Server中使用的链接技术,链接原理是通过检索引文数据库,可以是本地的,也可以是通过Z39.50检索的远程的数据库,获得链接元数据,从而实现到电子全文的链接。而LinkFinder Plus则是借助OpenURL实现了动态的开放式链接。它本身是该公司数字化资源整体解决方案ENCompass的一个模块,也可以单独安装使用。它和SFX相比,原理与实现机制相似,没有更多的特别之处。引文数据库、数据库中的引文、0PAC等凡是支持OpenURL的电子资源都可以成为链接源,而链接目标除了可以使电子期刊库外,还可以是文摘库、搜索引擎、网上书店等各种类型的可以生成链接地址(Link to syntax)的数字资源。
LinkFinder Plus在使用上也是用户在链接源上点击LinkFinder Plus button按钮启动链接服务。不同的是,链接不再弹出服务菜单,而是根据图书馆的设置,链接到合适版本的电子全文或其它类型电子资源。
LinkFinder Plus也有和SFX知识库类似的预设数据库,方便用户对该系统的配置使用。
2.3 OL2
来自于FDI的动态链接工具。FDI(Fretwell—Downing nformatics Ltd)公司有一系列信息管理产品,如图书馆集成管理系统OLLB、数据网关产品ZPORTAL、文献传递和馆际互借系统VDX、元数据服务器Z'MBOL等,OL2是他们推出的链接产品。该公司在美、加地区有很大的市场。它的产品讲求开放性和兼容性,“Freedom By Design”是他们产品的设计理念。比如,它的OL2可以单独作为链接工具使用,也可以和ZPORTAL(该公司的网关产品)集成工作。
OL2也沿用了一种动态、开放的链接原理。OL2也支持OpenURL协议,该协议原理上允许所有那些支持该协议的数据库都成为OL2的链接源。所以,OL2既可以由ZPORTAL的检索结果作为动态链接的起点,也可以在其他数据源之间实现链接,数据库、电子期刊或OPAC目录都可以成为它的链接源和链接目标。与SFX相比较,OL2的链接应用似乎不十分广泛,重要用户有EBSCO和CAS等。FDI作为CrossRef的加入成员机构,也为CrossRef系统提供动态链接技术。
2.4 WebBridge
我们比较熟悉的Innovative公司也有自己的链接产品部件—— WebBridge。WebBridge提供灵活的链接能力,它能将图书馆的相关资源恰当地无缝链接在一起。它有两种使用方式,一种是接受来自集成管理系统(Millennium)之外的请求并返回适当的匹配结果。和前述的链接软件类似。另外一种方式是在Millennium系统之内,根据实际情况和预先设定,将述评和图书的封面图片链接,还可以是链接到合适版本的全文电子论文或电子图书、书评、相似题名、其他图书馆的馆藏、全文以及封面图片等各种类型信息。
用户可以在Web OPAC、Millennium的管理模块中,或其他数字资源如A&I和全文数据库的记录级上选择链接操作。WebBridge依据该条记录的实际信息有选择地生成一系列链接。链接将图书馆的所有资源都集成在一起,最大限度地得到使用。这些链接是动态的,内容相关的,是由图书馆定义的。并且和OpenURL,CrossRef,DOI的链接系统相互兼容。
2.5 其他链接服务器
上述链接产品,都是出自信息技术软件公司,是独立于数据商的第三方商品,其他还有Sirsi的Resolver,韩国InfoNet Service公司的KDBLink(http:// www.kdblink.com/)等。其实,数据集成商或出版商为了实现更好的商业目标,一般在自己的数据库内部除了提供数据之外,也提供链接服务。比较重要的有,ISI的web of knowledge平台,WEBSPIBS(银盘公司)系统使用的SilverLinker,CrossRef-DOI项目等。
在国内,实现链接的项目或产品报道不多,只有清华同方为CNKI的期刊、博硕士学位论文和报纸建立元数据库。实现了在中国期刊全文数据库 CJFD内部(源文件也包含在该数据库内)建立了引文-全文-目次库间的链接。并与ELSEVIER SCIENCE电子期刊数据库之间建立了部分外文引文的链接。从我获得的资料看,它的链接实现机制不同于上述产品,仍旧属于数据库内部的封闭式的链接。此外,从知识网络和知识服务网络的建设目标看,它也没有将参考链接的功能作为一个独立的部件整个服务平台中分离出来,这会影响到它的功能的开放性和标准性程度。
3 数据网关——全异平台电子资源的统一检索
数字化时代的到来,使得图书馆的资源利用环境越来越复杂。今天的用户总是希望方便快速地得到需要的资源;另一方面,数据库数量增加的同时,多种平台和多种使用界面又给用户的使用带来困扰。除了前述的链接产品之外,数据网关是另一类应运而生的重要的数字化资源的管理和利用工具。此类软件的主要目的就是为用户提供统一的检索平台,实现跨库检索。同时还提供资源编目模块,帮助有效管理和揭示资源。这样的产品一般又都与链接软件集成工作,为用户提供链接扩展服务。此外还有对版权和用户权限的管理功能。这样的产品国内外都有推出,下面分别简单加以介绍。
3.1 MetaLib
MetaLib是Ex Libris公司的一个信息门户产品。它的核心功能就是对图书馆的书目库和各种电子资源库提供统一检索的功能,兼顾资源组织和管理,引导、帮助用户有效使用资源。可供检索的资源包括全文、引文、文摘索引数据库、本地馆藏等。 MetaLib通过对知识库的配置,可以实现复杂的资源使用政策,控制哪些资源可以被哪些用户使用,掌控用户验证和版权管理。
MetaLib由4个功能模块组成。
(1)Universal Gateway——该模块实现同时对异构异平台的多个数据源统一检索。MetaLib支持Z3950、HTTP等协议,检索范围包括MARC、MAB、 XML、FAD、DC、TEI等多种标准的数据格式。返回检索结果可以是针对某个数据源的记录列表,也可以是经过去重、合并后的记录集。在检索结果的基础上,可以进行二次检索、保存检索表达式或者继续使用链接服务。
(2)ResourceStore——对所有电子资源进行组织、归类,也可以对电子资源进行编目,编目信息包括数据的学科范围、语种等,便于用户了解和利用这些资源。经过归类和编目的资源,呈现在用户进入的页面中,主要帮用户鉴别哪些是他们将会用到的资源。
(3)Personalization and User Administration——MetaLib独有的用户数据库,可以提供一系列的个性化服务功能。例如,用户可以个性化自己的检索环境,如定义检索范围;读者可以创建自己的资源列表和电子期刊列表,建立个人的电子书架、保存检索历史。尤其值得一提的是设置定题资源提醒的功能。用户如果定制了检索式,就可以定期收到系统反馈的检索结果,也就是获得SDI服务。它和 SFX完全集成,同时上述服务都是在系统的用户验证和授权机制控制之下的。
(4)Extended Service——指的是和SFX集成后, MetaLib可以成为sfx的链接源和链接目标资源,用户可以随时在MetaLib检索结果记录和相关资源之间实现链接,包括全文电子文献、参考文献、馆藏目录、文献传递服务系统、搜索引擎等资源与服务等。
3.2 ZPORTAL
Zportal是FDI(Fretwell—Downing Informtics Ltd)公司推出的类似产品。Zportal可以实现对所有资源的统一跨平台检索。在Zportal中也有对拥有的数字资源进行编目的功能,从而帮助用户在进入该系统后,随时了解自己可以使用资源的概况,选定自己的检索范围。
Zportal亦拥有用户检索权限管理模块,系统管理员来决定哪些用户可以访问哪些资源。拥有管理和统计模块,可以帮助了解资源的利用情况和利用价值。Zportal也考虑到用户的个性化的检索需求。
Zportal的特点是强调产品的标准化,全面支持包括MARC、EAD、DC、GILS和CIMI等各种记录标准。使图书馆可以将来自其他图书馆、博物馆、档案资料和Web资源视作一个整体检索和利用,而无需考虑实际存放地点。在跨库检索软件中,它是非常有竞争力的。
Zportal的另一个特性就是和和本公司链接软件 OL2协同提供服务。Zportal检索结果本身就成为链接源,为用户的深入检索和学术研究提供扩展服务。
3.3 ENCompass
它是Endeavor公司推出的数字化资源管理(Digital Library Management)解决方案。严格说来, ENCompass不仅是一个跨库检索的软件,而是一个针对今天的数字化资源环境而开发的整套整体解决方案。
Search and Discovery功能模块是ENCompass的核心功能。该公司称之为Federated Search,可以对远程和本地的多种类型数据库实现统一检索,包括OPAC。在这一点上,和该类的其他产品没有本质区别。ENCompass的检索实现途径之一是通过Z39.50协议;对于支持XML网关的数据库通过XML gateway实现检索;也可以通过HTTP协议对另外一些数据库发出检索请求和获得返回结果,有不同的实现方法。ENCompass还将应用OAI协议,以兼容更多种类型格式的元数据。
Object and Collection Management功能是ENCompass的另外两个重要功能之一。该模块使ENCompass具备资源编目和资源整合的功能。对于本地数字化资源数据,ENCompass采用“metadata loader”装载到系统内部,整合资源、统一检索。采用该模块,可以对进入系统的数字化文献、图像、视频资料等资源编目,组织成为多媒体的知识库。也可以将已有的各种类型资源进行重新分类组织,甚至将不同来源不同类型资源重新组织成新的虚拟数据库,比如“农业资源库”,“美国历史资源库”等。类似于yahoo对网站的处理,便于读者发现资源,并引导读者进一步使用这些资源。
ENCompass支持多种元数据,如Dublin Core, Qualified Dublin Core和EAD,同时还支持本地定义的元数据。ENCompass提供工具将本地的不同类型元数据加载进来,并以文件夹或数据库的形式组织起来。在解决不同类型数据的兼容性方面,ENCompass使用Crosswalking特性功能,该功能可以在不同类型元数据间建立对照关系,用于检索和统一检索结果的显示。
ENCompass特别强调对XML和XSL的支持。由于XML具有足够的灵活性可以表达和处理不同类型的数据信息,如图书馆普遍接受的DC、EAD等元数据集,结合XSL(eXtensible Style Language), ENCompass可以方便地将XML数据美观恰当地显示出来(如HTML格式)。这给了图书馆极大的显示格式本地化的便利。
ENCompass也有用户权限和授权管理模块。用户访问多种资源无需多次认证。前面提到的FinderPlus也是ENCompass解决方案的组成部分之一,也就是提供链接服务。
3.4 MAP
类似的产品还有Innovative公司的MAP(Millennium Access Plus)——资源检索网关。MAP的检索范围包括图像库、全文库,文摘索引、图书馆目录等。MAP由三个独立的部件组成:他们共同管理和控制对信息资源的检索过程,提供contextual linking链接服务,多协议元数据搜索和验证授权管理工具。
(1)WebBridge:在前面我们已经对它作了介绍,它提供资源问的链接服务。
(2)MetaFind:统一检索模块(Universal Search Interface)。
MAP的检索功能是通过MetaFind来实现的。MetaFind支持多协议检索,Z39.50,HTTP以及SQL。支持多种格式和元数据标准EAD、DC、 MARC,TEI和XML等,实现统一跨库检索系统。返回结果界面一致,由图书馆自定义。返回结果可以鉴别出不同的来源库,并且保持和来源数据库的链接。
(3)Web Access Management:用户管理和验证、授权模块。
对图书馆来说,首先要能够验证用户的身份,确保数据库的合法应用,也包括那些校园网外的远程用户。Web Access Management使用代理服务器机制来控制对数据库的访问,保证了合法用户可以在家中、办公室或世界上任何其他地方使用资源。 Web Access Management还具有用户详细使用统计功能。
3.5 其它软件
在国内专门进行这方面产品研发的有CALLS、清华同方和TRS公司等。这些软件的核心检索功能基本没有太大差别,但在用户权限管理、资源编目和组织以及和第三方链接产品的集成上,仍有不足。总的说来,商品化程度、细节处理和受检验程度不够。
4 元数据的创建、存储、转换与发布工具
今天的图书馆由于拥有了多种形式的数字化资源,所以除了MARC记录外,还会创建和利用到其他类型的元数据。对这些数据进行存储、检索和转换等处理,也将成为图书馆的日常管理项目。在各种类型的数字化资源管理软件中,很多都体现出了对元数据资源作各种处理的考虑,如前面提到的 ENCompass,Exlibris公司的Digitool等。独立的该类产品在国外也已初现端倪,产品的侧重点各有不同,但是不十分多,下面将列举两例。
该类产品和前述链接软件以及网关产品相比,解决思路还稍显薄弱,产品的定位、具备哪些功能如何实现等方面,尚未能在开发者和使用者中形成共识。这可能与实际需求的不明确性有关。但是,我认为,对元数据的互操作,无论是与其它产品集成或者独立存在,必将成为未来数字资源管理整体解决方案中的一个重要环节。
(1)Z'MBOL——(metadata indexing&searching)元数据发布系统。这是FDI公司的另一个产品。以Z39.50服务器的形式,与其他Z39.50客户端软件和Z39.50/wwww网关软件结合使用。提供开放的元数据发布服务平台,从而可以将各种元数据资源统一到数字图书馆的体系中。为多种格式元数据(MARC、EAD、GILS、XML、DC、Mail archives、USENET news directories等)建立索引(本地定义),提供统一检索;同时保留各自的原始格式。该平台是一个强大的索引工具,Z39.50是这种检索服务的基础协议。
(2)MetaSource和XML Server——他们均来自于Innovative公司。当图书馆拥有的数字化多媒体馆藏逐渐增多的时候,存储、揭示与管理这些馆藏成为一个问题。MetaSource就是一个可利用的工具。它能将这些数字化馆藏集成到传统的书目目录中或是保持不同形式单独存在。同时使他们能够互操作。数字化馆藏包括数字化的对象集合,外部搜索引入的多媒体信息,以及Dublin Core元数据等。 MetaSource由3个部分组成:Millennium Management,XML Harvester和Metadata Builder。
① Millennium Media Management创建和储存媒体对象、图像、声音文件和视频文件,创建本地数字化馆藏(档案资料,图片,报纸资料,演讲资料或视像资料等)。它也包括数字馆藏的版权管理功能,提供有控制的访问。并和Web OPAC完全集成检索,用户可以轻易地检索这些图书馆数字化的多媒体信息。
② XML Harvester使用XML技术提供自动的编目功能,可以对任何外部服务器的源数据记录创建成本地的记录,如将EAD或Dublin Core的XML转成MARC记录,或形成单独的不同的数字馆藏库。XML Harvester将来自不同XML数据库的记录集成到图书馆目录中,提供统一检索。
③ Metadata Builder提供不同的元数据框架,供图书馆使用,如EAD、DC等存储电子资源馆藏。它批输入和批输出各种XML记录,并将之索引和提供检索。
XML Server的功能比较简单,它是一个将图书馆目录以XML格式输出的工具。主要内容为书目和其他规范数据的图书馆目录,被越来越多的输出到集成系统之外,供外部交换使用,例如,建立期刊馆藏库或为了给图书馆的外部数据库建立规范控制之用。XML Server输出的XML数据可被转化成各种XML格式,如DC、EAD或HTML。XML Server将对那些不熟悉MARC的用户开放图书馆目录资源。
学教育技术,上教育技术论坛!http://www.etthink.com
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


11关注

462粉丝

7857帖子

推荐阅读更多+
会员达人更多+
广告位

最新信息

更多+

关注我们:教育技术人

官方微信

官方微博

教育技术热线:

13955453231

学教育技术,上教育技术论坛!

教育技术论坛征稿范围:教育技术应用案例、教程文章、优秀作品等。

Email:sf@etthink.com

Copyright   ©2007-2026  应用思考-教育技术论坛  Powered by©Discuz!  技术支持:且行资源    ( 皖ICP备10014945号-4 )