网格技术的发展与数字图书馆建设
资源通过高速的互联网进行资源集成,从而提供一种高性能计算、管理及服务的资源能力。在分布式的异构环境中,网格技术能够精确定位所需的数据集,并为后续处理提供支持。人们利用这些资源就像用电源一样,不必计较这些资源的来源和负载情况。网格计算可以合理而有效地将远程资源高效地组织起来,形成网络虚拟计算机,形成超强的能力。网格已经发展成为连接和统一各类远程异构资源的一种重要的途径。
(3)网格有利于实现数字图书馆的资源共享。网格把整个因特网整合为一个巨大的超级计算机,实现网上所有资源的全面连通,能消除信息孤岛,实现计算机资源、存储资源、数据资源、信息资源、知识资源等多种资源的全面共享。网格提供单一的系统映像,具有透明性、可靠性、负载平衡等功能。网格支持对异构数据资源的访问,为用户提供统一的访问接口,选择适当的访问协议来实现用户提出的数据访问请求。网格与目前的计算机网络不同,网格能实现应用层面的连通,它主要关注的是如何消除信息孤岛,实现信息资源的智能共享。网格技术的进一步充分应用,能够极大地提高数字图书馆资源的利用效率。
(4)网格有利于数字图书馆的海量数据处理。数据图书馆所要处理的数据通常比较大,网格则能够很好地解决海量数据的计算处理和分析问题。它能将分布在不同地方的计算机连接在一起,用户只需通过客户端发出要求计算的指令,网格就把这些任务调配给各个计算机执行,然后将各个计算机计算出来的结果汇总反馈给用户,连接的计算机规模越大,计算能力就越高。此外,通过网格用户还可以在较短时间内把需要的数据从不同的数据库中找出来综合在一起,省去了多次访问不同数据库的麻烦,并能直接调用网格中的算法和程序等资源,避免许多重复性的工作。网格计算可以智能地分配计算资源,能够优化现有的计算资源,更快地解决数字图书馆的设计和利用问题;能够将应用程序的每个部分调整到最适合它的系统中去,从而以更短的时间、更低的成本解决有关应用问题。网格与数字图书馆技术有机结合起来,从而为在分布式异构环境中实施信息资源发现和知识发现提供支持。具体而言,数据网格通过提供一组服务来支持资源和信息发现,通过存储资源代理使计算可以在异构的存储资源上进行。
(5)网格有利于数字图书馆进行知识管理。网格的知识生产特性是网格与因特网两者之间质的区别,因特网本身不生产知识,人们都是先把信息知识用其他方式生产出来以后再放到网上,供用户查找利用。而网格则能根据用户的要求自动地生产知识。在知识生产的过程中,高性能计算机将起到关键的作用,它把从数据源得到的各种原始数据,运行特定的程序加工成信息和知识。网格可以自动地找有关的数据源进行综合分析和知识的发现,形成新的认识。可见,网格有利于数字图书馆进行知识管理。随着网格技术的不断发展,数字图书馆的功能和作用都会得到全面提高,在客户提出请求或查询时,网络将会自动处理分析,并把有关的结果传送到客户登录的节点上,从而使得数字图书馆的服务更加完善。
4 网格对数字图书馆的挑战
网格技术的应用对数字图书馆建设提出新的要求,其中比较突出的问题是:
(1)安全性问题。网格环境下数字图书馆的数据安全保障尤为重要。网格应用的最大难题是系统的安全性。由于网格的节点位于不同地域,节点的数字图书馆间如何安全地共享数据资源,如何保证共享数据的完整性是要着重解决的问题。网格安全主要包括网格系统安全、数据传输安全、信息存储安全等。在构建完善的安全机制的同时,还要避免安全验证耗费过多的系统资源。
(2)标准化问题。标准是网格应用的成功关键,构建网格需要对标准协议和服务进行定义。目前全球网格论坛、W3C以及Globus等标准化团体都开始了筹划工作,加快全球大网格(GGG)标准的制定。开放源代码网格标准组织——Globus正致力于开发标准的网格架构。在核心技术上,相关机构已达成共识。由美国有关机构开发的Globus Toolkit已成为网格计算事实上的标准。作为一种开放架构和开放标准基础设施,Globus Toolkit提供了构建网格应用所需的很多基本服务,如安全、资源发现、资源管理、数据访问等,许多计算机和软件厂商已宣布将采用Globus Toolkit,目前许多重大的网格项目都是基于Globus Toolkit提供的协议与服务建设的。如何把数字图书馆的标准和网格标准更好地结合起来,从而使数字图书馆在网格环境下发挥更好的作用是值得我们研究的问题。
(3)数字版权问题。由于在网格环境下信息资源的共享程度极大提高,知识产权问题相当突出。数字版权管理是数字图书馆产生和快速增长的需要,是数字化内容传播发展的一个关键问题。它需要利用法律、经
(4)基础设施问题。网格的应用对网络带宽的要求是非常高的,而目前我们拥有的网络带宽还不能达到应用网格的要求,此外网格对系统的自管理能力要求也非常高,因此,需要对现有的信息基础设施进一步改造。
(5)系统改造问题。网络系统平台建好后的应用移植是网格技术走向应用的最大障碍。网格技术要求用户将原有的系统应用标准化,并平移到新的系统之中。实际上很多现有的数字图书馆应用系统如果将其推向网格环境,将面临重新编写应用代码的问题,虽然目前已经有一些相关的工具已经开发出来,但有许多技术问题仍需解决,还需要进一步支持和相互之间合作。
面对网络技术的进一步发展,数字图书馆建设的指导思想应该具有前瞻性,要适应将来网格环境的发展需要。首先,在资源建设方面要特色化。在网格环境下,由于信息的高度综合和集成,任何重复建设都是毫无意义的,只能造成巨大的浪费。故数字图书馆的资源建设要进行合理的配置和相互的协调。其次是要增强数字图书馆系统的相互可操作性,以便更好通过网格系统共享资源。再次是进一步完善数字图书馆协同服务,系统模式要走向集成的、多层次的分布系统,实现各类服务组件集成化。第四是不断丰富服务中的交互模型。通过提供各种交互模型使数字图书馆服务能够不断地适应发展变化的要求,更加具有针对性和个性化。
收稿日期:2003-05-08
【参考文献】
1 陈颖健.下一代网络技术:网格计算.国外科技动态,2002,(7):13-14
2 郝巧红.Internet第三次浪潮——网格.山西统计,2002,(7):36-38
3 李伟.浅谈网格计算基础.计算机世界报,2002,(43):B4
4 李晓林.信息网格——下一代信息服务平台.计算机世界报,2002,(43):B9
5 黄晓斌,邱明辉.数字图书馆的可用性研究.图书馆学研究,2002,(4):11-13
6 王意洁等.数据网格及其关键技术研究.计算机研究与发展,2002,39(8):943-947
7 Global Grid Forum.http://www.gridforum.org
8 Ian Foster etc.the anatomy of grid.http://www.globus.org/re search/papers/
9 Sun Grid Engine.http://www.sun.com/presskits/sgeee
本文链接地址:http://www.oyaya.net/fanwen/view/62818.html
(3)网格有利于实现数字图书馆的资源共享。网格把整个因特网整合为一个巨大的超级计算机,实现网上所有资源的全面连通,能消除信息孤岛,实现计算机资源、存储资源、数据资源、信息资源、知识资源等多种资源的全面共享。网格提供单一的系统映像,具有透明性、可靠性、负载平衡等功能。网格支持对异构数据资源的访问,为用户提供统一的访问接口,选择适当的访问协议来实现用户提出的数据访问请求。网格与目前的计算机网络不同,网格能实现应用层面的连通,它主要关注的是如何消除信息孤岛,实现信息资源的智能共享。网格技术的进一步充分应用,能够极大地提高数字图书馆资源的利用效率。
(4)网格有利于数字图书馆的海量数据处理。数据图书馆所要处理的数据通常比较大,网格则能够很好地解决海量数据的计算处理和分析问题。它能将分布在不同地方的计算机连接在一起,用户只需通过客户端发出要求计算的指令,网格就把这些任务调配给各个计算机执行,然后将各个计算机计算出来的结果汇总反馈给用户,连接的计算机规模越大,计算能力就越高。此外,通过网格用户还可以在较短时间内把需要的数据从不同的数据库中找出来综合在一起,省去了多次访问不同数据库的麻烦,并能直接调用网格中的算法和程序等资源,避免许多重复性的工作。网格计算可以智能地分配计算资源,能够优化现有的计算资源,更快地解决数字图书馆的设计和利用问题;能够将应用程序的每个部分调整到最适合它的系统中去,从而以更短的时间、更低的成本解决有关应用问题。网格与数字图书馆技术有机结合起来,从而为在分布式异构环境中实施信息资源发现和知识发现提供支持。具体而言,数据网格通过提供一组服务来支持资源和信息发现,通过存储资源代理使计算可以在异构的存储资源上进行。
(5)网格有利于数字图书馆进行知识管理。网格的知识生产特性是网格与因特网两者之间质的区别,因特网本身不生产知识,人们都是先把信息知识用其他方式生产出来以后再放到网上,供用户查找利用。而网格则能根据用户的要求自动地生产知识。在知识生产的过程中,高性能计算机将起到关键的作用,它把从数据源得到的各种原始数据,运行特定的程序加工成信息和知识。网格可以自动地找有关的数据源进行综合分析和知识的发现,形成新的认识。可见,网格有利于数字图书馆进行知识管理。随着网格技术的不断发展,数字图书馆的功能和作用都会得到全面提高,在客户提出请求或查询时,网络将会自动处理分析,并把有关的结果传送到客户登录的节点上,从而使得数字图书馆的服务更加完善。
4 网格对数字图书馆的挑战
网格技术的应用对数字图书馆建设提出新的要求,其中比较突出的问题是:
(1)安全性问题。网格环境下数字图书馆的数据安全保障尤为重要。网格应用的最大难题是系统的安全性。由于网格的节点位于不同地域,节点的数字图书馆间如何安全地共享数据资源,如何保证共享数据的完整性是要着重解决的问题。网格安全主要包括网格系统安全、数据传输安全、信息存储安全等。在构建完善的安全机制的同时,还要避免安全验证耗费过多的系统资源。
(2)标准化问题。标准是网格应用的成功关键,构建网格需要对标准协议和服务进行定义。目前全球网格论坛、W3C以及Globus等标准化团体都开始了筹划工作,加快全球大网格(GGG)标准的制定。开放源代码网格标准组织——Globus正致力于开发标准的网格架构。在核心技术上,相关机构已达成共识。由美国有关机构开发的Globus Toolkit已成为网格计算事实上的标准。作为一种开放架构和开放标准基础设施,Globus Toolkit提供了构建网格应用所需的很多基本服务,如安全、资源发现、资源管理、数据访问等,许多计算机和软件厂商已宣布将采用Globus Toolkit,目前许多重大的网格项目都是基于Globus Toolkit提供的协议与服务建设的。如何把数字图书馆的标准和网格标准更好地结合起来,从而使数字图书馆在网格环境下发挥更好的作用是值得我们研究的问题。
(3)数字版权问题。由于在网格环境下信息资源的共享程度极大提高,知识产权问题相当突出。数字版权管理是数字图书馆产生和快速增长的需要,是数字化内容传播发展的一个关键问题。它需要利用法律、经
济、技术等手段对数字化的内容信息给予一定的权益保护,从而维护作者和出版商的权益,鼓励数字化作品创新,促进信息的传播与交流。数字版权管理的技术手段是通过对数字化内容的控制,使数字作品的所有权人能够掌握其作品被使用情况,并且获得相应的报酬。数字版权管理系统通过建立有关的权利转让模型,利用技术手段对不同性质的作品给予不同的权利限制,由于数字化作品的内容信息通过加密控制,用户必须要通过注册、获得许可和使用权才能使用。只有解决数字版权管理才能为网格环境下信息资源的共享打下基础。
(4)基础设施问题。网格的应用对网络带宽的要求是非常高的,而目前我们拥有的网络带宽还不能达到应用网格的要求,此外网格对系统的自管理能力要求也非常高,因此,需要对现有的信息基础设施进一步改造。
(5)系统改造问题。网络系统平台建好后的应用移植是网格技术走向应用的最大障碍。网格技术要求用户将原有的系统应用标准化,并平移到新的系统之中。实际上很多现有的数字图书馆应用系统如果将其推向网格环境,将面临重新编写应用代码的问题,虽然目前已经有一些相关的工具已经开发出来,但有许多技术问题仍需解决,还需要进一步支持和相互之间合作。
面对网络技术的进一步发展,数字图书馆建设的指导思想应该具有前瞻性,要适应将来网格环境的发展需要。首先,在资源建设方面要特色化。在网格环境下,由于信息的高度综合和集成,任何重复建设都是毫无意义的,只能造成巨大的浪费。故数字图书馆的资源建设要进行合理的配置和相互的协调。其次是要增强数字图书馆系统的相互可操作性,以便更好通过网格系统共享资源。再次是进一步完善数字图书馆协同服务,系统模式要走向集成的、多层次的分布系统,实现各类服务组件集成化。第四是不断丰富服务中的交互模型。通过提供各种交互模型使数字图书馆服务能够不断地适应发展变化的要求,更加具有针对性和个性化。
收稿日期:2003-05-08
【参考文献】
1 陈颖健.下一代网络技术:网格计算.国外科技动态,2002,(7):13-14
2 郝巧红.Internet第三次浪潮——网格.山西统计,2002,(7):36-38
3 李伟.浅谈网格计算基础.计算机世界报,2002,(43):B4
4 李晓林.信息网格——下一代信息服务平台.计算机世界报,2002,(43):B9
5 黄晓斌,邱明辉.数字图书馆的可用性研究.图书馆学研究,2002,(4):11-13
6 王意洁等.数据网格及其关键技术研究.计算机研究与发展,2002,39(8):943-947
7 Global Grid Forum.http://www.gridforum.org
8 Ian Foster etc.the anatomy of grid.http://www.globus.org/re search/papers/
9 Sun Grid Engine.http://www.sun.com/presskits/sgeee
《网格技术的发展与数字图书馆建设(第2页)》