浅论数字图书馆的信息管理
江西省新余市第三中学 胡勇
摘要:图书馆的数字化是信息社会发展的必然,如何将本馆已有电子信息资源加以组织整合、提高馆藏利用率是非常现实的问题。本文就数字图书馆的信息共享管理做初步的论述。
主题词:数字图书馆 信息 管理
随着社会的飞速发展,传统意义上的图书馆已经不能满足大家的需要,人们对图书检索与查阅的质量和效率上的要求越来越高,信息技术的发展为这种需求提供了可能。目前,许多图书馆都建立了与国际互联网(Internet)联网的数字化图书馆,如何利用Internet网络资源为用户服务,如何将本馆已有电子信息资源加以组织整合、提高馆藏利用率是非常现实的问题。本文就数字图书馆的信息共享管理做初步的论述。
1、数字图书馆的概念与特征
数字图书馆是一种知识管理实体(entity),它将传统图书馆范畴与远程通信和计算机技术的应用有效地结合起来,通过将图书馆自身拥有的资源、图书馆母体机构专有的信息、外部的世界范围内的信息资源无缝地 整合,促进每个用户快速地存取和有效地使用信息。 从这个定义我们可以得出数字图书馆具有如下特征: (1)资源数字化。 数字图书馆在许多构成要素方面都突破了传统图书馆所规定的物理边界,拥有来自世界各 地的以电子摘要/目录、电子期刊、电子报纸、电子书籍、电子信箱、网络数据库、网络检索工具等不同形式 存在的多种信息资源。这些资源不属我有,却胜似我有,也就是说实现了资源的数字化; (2)馆藏数字化。 所有聚合在数字图书馆的信息资源不管它是图书、文献,还是图片、音像资料,都必须经过数字化存贮在一定 的载体上; (3)传递网络化。数字图书馆的信息资源都要通过国际互联网——局域网——单位或个人计算机 这样一种网络通道的传递,才能随时随地存取、检索与下载;(4)存取自由化。 网络用户都可以自由存取网 上信息资源,而不受时间、条件与数量的限制;(5)操作计算机化。 数字图书馆信息资源的传递、存取、检 索、咨询与复制都是通过计算机实现;(6)资源共享化。凡是网络用户,不分国家、地区、部门和单位, 都 可共同使用网络信息资源,实现资源共享。然而在实践工作中, 要实现数字图书馆信息资源的共享,并不 是件很容易的事,我们必须加强对数字图书馆信息共享管理问题的研究。
2、数字图书馆信息共享管理的必要性
为什么提出数字图书馆的信息共享管理,是我们首先必须考虑的第一个问题。我初步认为是基于如下两个 方面的原因:
2.1 网络信息资源的某些特征是推动数字图书馆信息共享管理的内在因素。
Internet网上极其丰富的信息资源是实现数字图书馆信息共享的物质源泉,它的某些特征是推动数字图书 馆信息共享管理的内在因素。这些特征主要包括:(1)网络信息资源缺乏有效的组织。 为适应网络环境下信 息组织的对象多样化、成分复杂化、传递高速化的要求,传统的以文献为单元的信息组织形式失去了用武之地 ,需要创造全新的知识信息组织方法,实现从信息层次到知识层次的根本转变;(2 )网络信息资源的分散性 、无序性相当严重。这种分散性与无序性明显地表现为用户使用不同的检索工具(如Yahoo、Infoseek、ProFu sion等)执行相同的检索指令时,会得到一大堆各不相同的网页地址,有时即使用同一个搜索引擎,前后两次 也会不同。这一方面说明了检索工具各具特色,另一方面也说明了网络信息资源的分散性与无序性。正是这种 分散性与无序性使检索到的数据的正确性、可靠性缺乏保障;(3 )网络信息资源缺乏深层次的开发。虽然 Internet 能够提供多种网络信息开发工具,如WWW、FTP、Telnet、Archie、Gopher、WAIS、Whois、IRC 、 E-mail、Fax等,但大多数停留在浏览功能来提供信息查询的阶段, 尚未深入到对网络信息资源在信息单元、 知识单元层面的开发利用;(4 )数字化信息自身的局限性。这种局限性体现为:一是已有印刷型信息资料不 可能全部转化为数字化形式;二是只有部分新的信息资料仅仅以数字化形式出版;三是不能保证用户能从Internet网上真正获取个人所需的数字化信息,如任何一篇文献、报告或其它文档。为解决上述几个关键性问题, 我们必须加强数字图书馆的信息共享管理。
2.2 信息共享需求是数字图书馆信息共享管理的内在动力。
数字图书馆的组织与信息资源极具动态性与实时性,在信息共享管理方面有其特殊的需求。这包括:①互 操作性。数字图书馆的信息资源涉及到各国政治、经济、技术、文化与社会等许多方面,各信息源数据库与信 息平台差异可能很大,为集中数字图书馆信息资源的选择范围,实现信息资源的最佳组合,数字图书馆必须具 有异构计算机软硬件平台间良好的互操作性;②动态配置。数字图书馆的信息资源时刻处于动态变化中,数字 图书馆应具有随时调整、支持动态配置的能力;③标准化技术。数字图书馆的运作涉及到大量的标准化技术, 如VPN (数字专用网)技术、VLAN(数字局域网)技术、VDB(数字数据库)技术、 HTML(超文本标记语言) 技术、CORBA(Common Object Request BrokerArchitecture)技术等;④安全性。“计算机病毒、磁场、 电磁脉冲对数字化信息和计算机系统的破坏程度,并不亚于一把火把传统图书馆化为灰烬”。因此,数字图 书馆信息资源的安全性尤其值得重视。 总之,这些特殊需求构成了数字图书馆信息共享管理的内在动力。
3、实现数字图书馆信息共享的主要措施
在数字图书馆信息共享管理的过程中,我们必然会遇到许多棘手问题,如网络环境下信息资源的收集、组 织、利用、安全维护与用户管理等,我们必须利用目前的最新技术和采取必要的措施来促进数字图书馆的信息 共享。这些技术和措施包括:
3.1 开发和利用智能搜索工具来收集、 组织数字图书馆信息资源。
Internet的迅速发展给数字图书馆带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具 。虽然目前开发了不少搜索引擎,如HYTELNET、Archie、Veronica、Jughead、Gopher Jewels、 Yahoo、Alta
Vista、Lycos、Open Text、Infoseek、Excite、Netscape等,但是用户要想方便快捷地找到所需信息,却很 不容易。因为用户在发出一个明确的查询请求后,返回的信息中往往有许多不相干的信息,如果再想从这些杂 乱的信息中去浏览、选择和挖掘那些真正有用的信息,就不知不觉地浪费了许多时间和费用。为解决这个问题 ,我们可以采取两种方案:
3.1.1为数字图书馆提供基于元搜索引擎的检索机制。 所谓元搜索引擎,是对分布于网络的多种检索工具 的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(基至是同时利用若 干个)搜索引擎来实现检索操作。元搜索引擎不象常用的搜索引擎那样拥有自己独立的数据库,却更多地提供 统一联结界面,或进一步地提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎 构成的数字逻辑整体,从而实现对这个数字整体中各独立搜索引擎数据库的查询与数据处理。目前,在Int ernet 网上已经开发了多线索式元搜索引擎,如Metacrawler ( http://www. go2net. com/search.html) 、ProFusion(http://www.profusion. com ),All-in-one元搜索引擎(http://www.albany. net/allin one. html),桌面元搜索引擎Webcompass(http://www. qdeck. com/products/Webcompass)等。用户可以 运用这些元搜索引擎来优化检索结果, 提高检索效率。
3.1.2为数字图书馆建立基于Push技术的信息检索系统。 目前惯用的Internet搜索引擎及其信息浏览方式 通常是用户发出请求到Web, 然后Web将信息送回用户端,也就是用户需要拉取(Pull)信息。 而Push(推送 )技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送(Push) 《浅论数字图书馆的信息管理》
本文链接地址:http://www.oyaya.net/fanwen/view/64903.html
摘要:图书馆的数字化是信息社会发展的必然,如何将本馆已有电子信息资源加以组织整合、提高馆藏利用率是非常现实的问题。本文就数字图书馆的信息共享管理做初步的论述。
主题词:数字图书馆 信息 管理
随着社会的飞速发展,传统意义上的图书馆已经不能满足大家的需要,人们对图书检索与查阅的质量和效率上的要求越来越高,信息技术的发展为这种需求提供了可能。目前,许多图书馆都建立了与国际互联网(Internet)联网的数字化图书馆,如何利用Internet网络资源为用户服务,如何将本馆已有电子信息资源加以组织整合、提高馆藏利用率是非常现实的问题。本文就数字图书馆的信息共享管理做初步的论述。
1、数字图书馆的概念与特征
数字图书馆是一种知识管理实体(entity),它将传统图书馆范畴与远程通信和计算机技术的应用有效地结合起来,通过将图书馆自身拥有的资源、图书馆母体机构专有的信息、外部的世界范围内的信息资源无缝地 整合,促进每个用户快速地存取和有效地使用信息。 从这个定义我们可以得出数字图书馆具有如下特征: (1)资源数字化。 数字图书馆在许多构成要素方面都突破了传统图书馆所规定的物理边界,拥有来自世界各 地的以电子摘要/目录、电子期刊、电子报纸、电子书籍、电子信箱、网络数据库、网络检索工具等不同形式 存在的多种信息资源。这些资源不属我有,却胜似我有,也就是说实现了资源的数字化; (2)馆藏数字化。 所有聚合在数字图书馆的信息资源不管它是图书、文献,还是图片、音像资料,都必须经过数字化存贮在一定 的载体上; (3)传递网络化。数字图书馆的信息资源都要通过国际互联网——局域网——单位或个人计算机 这样一种网络通道的传递,才能随时随地存取、检索与下载;(4)存取自由化。 网络用户都可以自由存取网 上信息资源,而不受时间、条件与数量的限制;(5)操作计算机化。 数字图书馆信息资源的传递、存取、检 索、咨询与复制都是通过计算机实现;(6)资源共享化。凡是网络用户,不分国家、地区、部门和单位, 都 可共同使用网络信息资源,实现资源共享。然而在实践工作中, 要实现数字图书馆信息资源的共享,并不 是件很容易的事,我们必须加强对数字图书馆信息共享管理问题的研究。
2、数字图书馆信息共享管理的必要性
为什么提出数字图书馆的信息共享管理,是我们首先必须考虑的第一个问题。我初步认为是基于如下两个 方面的原因:
2.1 网络信息资源的某些特征是推动数字图书馆信息共享管理的内在因素。
Internet网上极其丰富的信息资源是实现数字图书馆信息共享的物质源泉,它的某些特征是推动数字图书 馆信息共享管理的内在因素。这些特征主要包括:(1)网络信息资源缺乏有效的组织。 为适应网络环境下信 息组织的对象多样化、成分复杂化、传递高速化的要求,传统的以文献为单元的信息组织形式失去了用武之地 ,需要创造全新的知识信息组织方法,实现从信息层次到知识层次的根本转变;(2 )网络信息资源的分散性 、无序性相当严重。这种分散性与无序性明显地表现为用户使用不同的检索工具(如Yahoo、Infoseek、ProFu sion等)执行相同的检索指令时,会得到一大堆各不相同的网页地址,有时即使用同一个搜索引擎,前后两次 也会不同。这一方面说明了检索工具各具特色,另一方面也说明了网络信息资源的分散性与无序性。正是这种 分散性与无序性使检索到的数据的正确性、可靠性缺乏保障;(3 )网络信息资源缺乏深层次的开发。虽然 Internet 能够提供多种网络信息开发工具,如WWW、FTP、Telnet、Archie、Gopher、WAIS、Whois、IRC 、 E-mail、Fax等,但大多数停留在浏览功能来提供信息查询的阶段, 尚未深入到对网络信息资源在信息单元、 知识单元层面的开发利用;(4 )数字化信息自身的局限性。这种局限性体现为:一是已有印刷型信息资料不 可能全部转化为数字化形式;二是只有部分新的信息资料仅仅以数字化形式出版;三是不能保证用户能从Internet网上真正获取个人所需的数字化信息,如任何一篇文献、报告或其它文档。为解决上述几个关键性问题, 我们必须加强数字图书馆的信息共享管理。
2.2 信息共享需求是数字图书馆信息共享管理的内在动力。
数字图书馆的组织与信息资源极具动态性与实时性,在信息共享管理方面有其特殊的需求。这包括:①互 操作性。数字图书馆的信息资源涉及到各国政治、经济、技术、文化与社会等许多方面,各信息源数据库与信 息平台差异可能很大,为集中数字图书馆信息资源的选择范围,实现信息资源的最佳组合,数字图书馆必须具 有异构计算机软硬件平台间良好的互操作性;②动态配置。数字图书馆的信息资源时刻处于动态变化中,数字 图书馆应具有随时调整、支持动态配置的能力;③标准化技术。数字图书馆的运作涉及到大量的标准化技术, 如VPN (数字专用网)技术、VLAN(数字局域网)技术、VDB(数字数据库)技术、 HTML(超文本标记语言) 技术、CORBA(Common Object Request BrokerArchitecture)技术等;④安全性。“计算机病毒、磁场、 电磁脉冲对数字化信息和计算机系统的破坏程度,并不亚于一把火把传统图书馆化为灰烬”。因此,数字图 书馆信息资源的安全性尤其值得重视。 总之,这些特殊需求构成了数字图书馆信息共享管理的内在动力。
3、实现数字图书馆信息共享的主要措施
在数字图书馆信息共享管理的过程中,我们必然会遇到许多棘手问题,如网络环境下信息资源的收集、组 织、利用、安全维护与用户管理等,我们必须利用目前的最新技术和采取必要的措施来促进数字图书馆的信息 共享。这些技术和措施包括:
3.1 开发和利用智能搜索工具来收集、 组织数字图书馆信息资源。
Internet的迅速发展给数字图书馆带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具 。虽然目前开发了不少搜索引擎,如HYTELNET、Archie、Veronica、Jughead、Gopher Jewels、 Yahoo、Alta
Vista、Lycos、Open Text、Infoseek、Excite、Netscape等,但是用户要想方便快捷地找到所需信息,却很 不容易。因为用户在发出一个明确的查询请求后,返回的信息中往往有许多不相干的信息,如果再想从这些杂 乱的信息中去浏览、选择和挖掘那些真正有用的信息,就不知不觉地浪费了许多时间和费用。为解决这个问题 ,我们可以采取两种方案:
3.1.1为数字图书馆提供基于元搜索引擎的检索机制。 所谓元搜索引擎,是对分布于网络的多种检索工具 的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(基至是同时利用若 干个)搜索引擎来实现检索操作。元搜索引擎不象常用的搜索引擎那样拥有自己独立的数据库,却更多地提供 统一联结界面,或进一步地提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎 构成的数字逻辑整体,从而实现对这个数字整体中各独立搜索引擎数据库的查询与数据处理。目前,在Int ernet 网上已经开发了多线索式元搜索引擎,如Metacrawler ( http://www. go2net. com/search.html) 、ProFusion(http://www.profusion. com ),All-in-one元搜索引擎(http://www.albany. net/allin one. html),桌面元搜索引擎Webcompass(http://www. qdeck. com/products/Webcompass)等。用户可以 运用这些元搜索引擎来优化检索结果, 提高检索效率。
3.1.2为数字图书馆建立基于Push技术的信息检索系统。 目前惯用的Internet搜索引擎及其信息浏览方式 通常是用户发出请求到Web, 然后Web将信息送回用户端,也就是用户需要拉取(Pull)信息。 而Push(推送 )技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送(Push) 《浅论数字图书馆的信息管理》