互操作联邦数字图书馆研究
成。NDLTD体系结构集成了多种采用不同协议(包括Harvest系统、Dienst协议、Z39.50协议和OAI协议)的异构DLs系统,允许使用多种方法定期地从联盟DLs的馆藏中提取信息,经过处理、合并后集中保存在一个联合文档(union archives)中,用户对保存在联合文档中的数据进行查询。NDLTD体系结构实现了结构(异构的)、系统(使用Dienst、Z39.50和OAI等不同的协议)、语法(包含有不同的数据格式)及语义四个层次上的互操作。
中介(mediation)结构为馆藏自治、结构异构的DLs之间的互操作提供了强有力的支持。目前这方面的主要研究工作是将中介结构(包含有实现低层信息到高层抽象转换的组件)同基于agent的系统(包含有控制复杂协商任务的智能对象)相结合。为了更好地支持互操作,各组件之间的通信通常采用标准协议(如HTTP、Z39.50、KQML或CORBA)实现。
3.2 基于数据驱动的结构
基于数据驱动的结构是一种以数据为中心的结构,它既不要求对现有DLs的结构做任何修改,也不要求联盟成员的DLs遵从某种互操作协议,只要求使用数字图书馆描述语言(DLDL)描述各自的馆藏资源(DLs的元数据及其内容)、访问方法和服务能力,并将这些描述信息登记到注册服务器中。当用户通过联邦数字图书馆(FDL)查询时,FDL根据注册服务器中保存的信息,选择出最合适的DLs执行用户的查询,并收集这些DLs返回的结果,合并整理后返回给用户。其代表是美国弗吉尼亚大学的数字图书馆研究小组提出的FDL结构,它包括三个主要部分[2]:①异构DLs的收集及其DLDL描述;②一个基于LDAP的注册服务及主XML归并agent;③一个联邦数字图书馆(即一个基于Java的应用程序,它能够支持不同DLs的集成,使用户感觉到如同使用单个数字图书馆一样)。其中,注册服务允许任何DLs通过向LDAP服务器提交其DLDL描述而成为FDL的一员。
基于数据驱动的结构要求所有加盟的DLs使用统一的数字图书馆描述语言描述各自的馆藏内容、访问方法和服务能力,其查询响应时间是应当考虑的主要因素,服务质量通常由所选择的DLs中服务最差者决定。
3.3 基于Agent的结构
Agent(包括多Agent、智能Agent和移动Agent)的理论、技术,特别是多Agent的理论、技术,为分布式开放系统的分析、设计和实现提供了一条崭新的途径,被誉为“软件开发的又一重大突破”[6]。将Agent技术引入到数字图书馆领域,不仅可以为用户提供个性化的服务,而且使系统具有较好的开放性、可扩展性和可伸缩性。基于Agent的FDL体系结构通常包括用户Agent、中介(mediated)Agents和资源Agents,它们之间通过协商、合作完成某项任务。中介Agents负责与用户Agent、资源Agents和其他中介Agents的交互。用户Agent向用户提供接口界面,接受用户输入的查询请求,转换成通用的查询语言后交给合适的中介Agents。资源Agents作为每个DLs的智能前端接口,负责执行用户的查询,其功能与中介结构中的包装层(wrappers)类似,主要用于隐藏每个DLs的异构性,使用户感到如同使用单个数字图书馆一样。美国密执根大学的数字图书馆原型系统(UMDL)[7]是这种结构的代表,它包括用户接口Agents(UIAs)、中介Agents、馆藏接口Agents(CIAs)和馆藏四个部分。其中,UIAs提供用户使用UMDL资源的接口,并负责维护用户的profiles,以便提供个性化的服务。中介Agents提供信息服务的中介,负责将来自UIAs的查询送往最合适的CIAs,并监控查询的进展情况,传递处理结果以及进行数据格式的转换等。CIAs负责管理UMDL的馆藏接口以及馆藏内容的发布等功能。UMDL利用上述三类Agents,实现了对异构信息源的跨库检索。
3.4 基于OAI互操作框架的结构
开放存档倡导(Open Archives Initiative——OAI)是一个讨论和解决DLs互操作问题的论坛,其目标是为实现DLs的互操作提供简单、有效的机制。OAI的第一次会议于1999年10月在美国新墨西哥州的圣达菲召开,会上制定了关于元数据Harvesting的技术协定——圣达菲协定[8]。该协定主要包括两部分:定义一个简单的元数据元素集——开放存档元数据集(OAMS),以便在存档之间大粒度地发现文档;定义一个公共协议——开放存档Dienst协议的子集(OA-Dienst),以便在存档之间提取OAMS和指定存档的元数据。另
OAI为解决DLs的互操作问题提出了一种简单的互操作框架。它要求数据提供者按照标准的元数据格式(如Dublin core)建立其馆藏元数据,要求服务提供者利用OAI的元数据Harvesting协议与数据提供者进行通信。这种结构的代表是Arc[10],它是第一个采用OAI互操作框架实现的联邦搜索服务。Arc能够从遵从OAI协议标准的存档中获取(Harvesting)元数据,经过处理后存入一个基于关系型数据库(如MySQL或Oracle)的搜索服务中。NDLTD[4]联邦数字图书馆也选用OAI互操作框架作为其元数据互操作的部分解决方案,以克服联盟DLs之间的异构性障碍。
OAI互操作框架实际上是通过在数据提供者和服务提供者之间定义一个标准接口来实现DLs之间的互操作,但并没有规定如何选择数据源,也没有强调如何实现服务提供者。另外,利用OAI互操作框架实现的联邦数字图书馆也存在元数据的同步更新问题,目前主要利用基于日期戳(datestamp)的“拉”(Pull)模型解决数据提供者和服务提供者之间的数据同步问题。
4 结束语
建立全球范围的互操作联邦数字图书馆是一项十分艰巨的任务,不仅包含一系列的关键技术,而且还存在着知识产权、经济、社会和法律等方面的问题。目前许多DLs都是自治的信息系统,它们具有不同的搜索界面、体系结构、通信协议和管理策略。在这些异构的DLs之间建立互操作联邦面临着以下挑战:①提供统一的接口界面以及将每个DLs映射到该界面的通用映射机构;②提供灵活的集成方式及工具以支持各种异构DLs的集成;③用户对联邦数字图书馆中每个DLs的访问应当透明。这些是建立互操作联邦数字图书馆需要进一步研究和解决的问题。
【参考文献】
1 EU-NSF digital library working group on interoperability between digital libraries(position paper), 1999, http://www. iei. pi. cnr. it/DELOS/NSF/interop. htm
2 Barry M. Leiner. The NCSTRL approach to open architecture for the confederated digital library. D-Lib Magazine, December 1998
3 Hussein Suleman, Anthony Atkins, etc. Networked Digital Library of Theses and Dissertations.  《互操作联邦数字图书馆研究(第2页)》
本文链接地址:http://www.oyaya.net/fanwen/view/61520.html
中介(mediation)结构为馆藏自治、结构异构的DLs之间的互操作提供了强有力的支持。目前这方面的主要研究工作是将中介结构(包含有实现低层信息到高层抽象转换的组件)同基于agent的系统(包含有控制复杂协商任务的智能对象)相结合。为了更好地支持互操作,各组件之间的通信通常采用标准协议(如HTTP、Z39.50、KQML或CORBA)实现。
3.2 基于数据驱动的结构
基于数据驱动的结构是一种以数据为中心的结构,它既不要求对现有DLs的结构做任何修改,也不要求联盟成员的DLs遵从某种互操作协议,只要求使用数字图书馆描述语言(DLDL)描述各自的馆藏资源(DLs的元数据及其内容)、访问方法和服务能力,并将这些描述信息登记到注册服务器中。当用户通过联邦数字图书馆(FDL)查询时,FDL根据注册服务器中保存的信息,选择出最合适的DLs执行用户的查询,并收集这些DLs返回的结果,合并整理后返回给用户。其代表是美国弗吉尼亚大学的数字图书馆研究小组提出的FDL结构,它包括三个主要部分[2]:①异构DLs的收集及其DLDL描述;②一个基于LDAP的注册服务及主XML归并agent;③一个联邦数字图书馆(即一个基于Java的应用程序,它能够支持不同DLs的集成,使用户感觉到如同使用单个数字图书馆一样)。其中,注册服务允许任何DLs通过向LDAP服务器提交其DLDL描述而成为FDL的一员。
基于数据驱动的结构要求所有加盟的DLs使用统一的数字图书馆描述语言描述各自的馆藏内容、访问方法和服务能力,其查询响应时间是应当考虑的主要因素,服务质量通常由所选择的DLs中服务最差者决定。
3.3 基于Agent的结构
Agent(包括多Agent、智能Agent和移动Agent)的理论、技术,特别是多Agent的理论、技术,为分布式开放系统的分析、设计和实现提供了一条崭新的途径,被誉为“软件开发的又一重大突破”[6]。将Agent技术引入到数字图书馆领域,不仅可以为用户提供个性化的服务,而且使系统具有较好的开放性、可扩展性和可伸缩性。基于Agent的FDL体系结构通常包括用户Agent、中介(mediated)Agents和资源Agents,它们之间通过协商、合作完成某项任务。中介Agents负责与用户Agent、资源Agents和其他中介Agents的交互。用户Agent向用户提供接口界面,接受用户输入的查询请求,转换成通用的查询语言后交给合适的中介Agents。资源Agents作为每个DLs的智能前端接口,负责执行用户的查询,其功能与中介结构中的包装层(wrappers)类似,主要用于隐藏每个DLs的异构性,使用户感到如同使用单个数字图书馆一样。美国密执根大学的数字图书馆原型系统(UMDL)[7]是这种结构的代表,它包括用户接口Agents(UIAs)、中介Agents、馆藏接口Agents(CIAs)和馆藏四个部分。其中,UIAs提供用户使用UMDL资源的接口,并负责维护用户的profiles,以便提供个性化的服务。中介Agents提供信息服务的中介,负责将来自UIAs的查询送往最合适的CIAs,并监控查询的进展情况,传递处理结果以及进行数据格式的转换等。CIAs负责管理UMDL的馆藏接口以及馆藏内容的发布等功能。UMDL利用上述三类Agents,实现了对异构信息源的跨库检索。
3.4 基于OAI互操作框架的结构
开放存档倡导(Open Archives Initiative——OAI)是一个讨论和解决DLs互操作问题的论坛,其目标是为实现DLs的互操作提供简单、有效的机制。OAI的第一次会议于1999年10月在美国新墨西哥州的圣达菲召开,会上制定了关于元数据Harvesting的技术协定——圣达菲协定[8]。该协定主要包括两部分:定义一个简单的元数据元素集——开放存档元数据集(OAMS),以便在存档之间大粒度地发现文档;定义一个公共协议——开放存档Dienst协议的子集(OA-Dienst),以便在存档之间提取OAMS和指定存档的元数据。另
外,圣达菲协定还定义了数据提供者(data providers)和服务提供者(service providers)模型。前者指存档的管理者,允许外界通过OAI协议访问其元数据;后者指从数据提供者那里获取元数据,并向用户提供高层服务的实体。目前,圣达菲协定已得到扩充和修改[9],存档内容由起初的电子版资料(e-print material)扩充到一般的学术数据(scholarly data),选用Dublin核心元素集作为公共元数据集,并将元数据Harvesting协议作为数据提供者和服务提供者之间的通信协议。
OAI为解决DLs的互操作问题提出了一种简单的互操作框架。它要求数据提供者按照标准的元数据格式(如Dublin core)建立其馆藏元数据,要求服务提供者利用OAI的元数据Harvesting协议与数据提供者进行通信。这种结构的代表是Arc[10],它是第一个采用OAI互操作框架实现的联邦搜索服务。Arc能够从遵从OAI协议标准的存档中获取(Harvesting)元数据,经过处理后存入一个基于关系型数据库(如MySQL或Oracle)的搜索服务中。NDLTD[4]联邦数字图书馆也选用OAI互操作框架作为其元数据互操作的部分解决方案,以克服联盟DLs之间的异构性障碍。
OAI互操作框架实际上是通过在数据提供者和服务提供者之间定义一个标准接口来实现DLs之间的互操作,但并没有规定如何选择数据源,也没有强调如何实现服务提供者。另外,利用OAI互操作框架实现的联邦数字图书馆也存在元数据的同步更新问题,目前主要利用基于日期戳(datestamp)的“拉”(Pull)模型解决数据提供者和服务提供者之间的数据同步问题。
4 结束语
建立全球范围的互操作联邦数字图书馆是一项十分艰巨的任务,不仅包含一系列的关键技术,而且还存在着知识产权、经济、社会和法律等方面的问题。目前许多DLs都是自治的信息系统,它们具有不同的搜索界面、体系结构、通信协议和管理策略。在这些异构的DLs之间建立互操作联邦面临着以下挑战:①提供统一的接口界面以及将每个DLs映射到该界面的通用映射机构;②提供灵活的集成方式及工具以支持各种异构DLs的集成;③用户对联邦数字图书馆中每个DLs的访问应当透明。这些是建立互操作联邦数字图书馆需要进一步研究和解决的问题。
【参考文献】
1 EU-NSF digital library working group on interoperability between digital libraries(position paper), 1999, http://www. iei. pi. cnr. it/DELOS/NSF/interop. htm
2 Barry M. Leiner. The NCSTRL approach to open architecture for the confederated digital library. D-Lib Magazine, December 1998
3 Hussein Suleman, Anthony Atkins, etc. Networked Digital Library of Theses and Dissertations.  《互操作联邦数字图书馆研究(第2页)》