数字图书馆馆藏评价
【摘 要 题】实践研究
【英文摘要】Briefly explains the meaning of digital library collection,a
目前,人们对与数字图书馆资源建设相关的知识产权、检索技术、元数据、馆藏数字化等问题进行了广泛的探讨,却忽视了数字图书馆馆藏评价这个关键问题。本文根据数字图书馆馆藏的特殊性,就数字图书馆馆藏评价问题作初步论述。
1 数字图书馆馆藏内涵
数字图书馆馆藏是存贮在图书馆服务器上的所有资源,或者是所有能通过图书馆界面实现访问的资源,即使这些资源在物理位置上是分布式的[1]。也就是说,数字图书馆馆藏是数字图书馆所拥有和存取的所有电子资源。它常常被划分为实体馆藏与虚拟馆藏两部分,前者包括数字图书馆自建或购买的安装在本地服务器上的各种类型的数据库,后者包括购买或租赁使用的远地数据库和与本地服务器实现了连接的网上资源。美国博物馆与图书馆服务协会(IMLS)认为,数字馆藏是经过选择和组织起来的附有元数据描述和一个以上访问界面的数字对象集[2]。Andy Powell把数字图书馆馆藏分为文本、图像、声音、数据集、软件、交互式资源(interactive resource)、事件(event)、实体对象(physical object)。这里所说的“文本”馆藏主要是指阅读文字,如书籍、信函、学位论文、诗、报纸、文章等,文本的传真或图像仍属于“文本”类;“图像”馆藏主要是指除了文本外的视觉符号表示,如物质对象的图像与照片、油画、印章、图画(素描)、其它图像与图形、运动图像、电影、图表、地图、音乐符号等;“声音”馆藏包括音乐、演说、录音等;“数据集”馆藏主要是指以明细表、表格、数据库等方式编制的适宜于计算机直接处理的结构化信息,如电子数据表、数据库、地理信息系统数据、数码音响数据等;“交互式资源”馆藏是指需要与用户的交互才能理解、执行或实验的数字资源,如网页、Java程序、多媒体学习对象、聊天、虚拟现实等;“事件”馆藏是某个时候发生的事情;“实体对象”馆藏是指不属于“文本”、“图像”及上述其它类型的三维对象或物质,如计算机、雕塑品等[3]。同样,Candy Schwartz认为馆藏数字对象可以是文本、图像、声音、移动图像、多媒体、数据集、软件、三维文件(three-dimensional files)和其它现在还未知类型的数据,而且每种数字对象在描述格式上也可以多种多样,如纯文本、多功能文本、Word、Postscript、PDF、HTML、XML或SGML[4]。
一般说来,每个数字图书馆馆藏都有其特色,如不列颠图书馆(The British Library)的数字馆藏包括电子化的书目、图书、期刊、报纸、手稿、地图、音乐、集邮、音响资料、珍贵馆藏、图片、新闻、年度报告、专利与网址等[5];我国国家图书馆的数字馆藏包括电子化的图书、期刊、报纸、书目、音像资料、图像、新闻、古籍、家谱、学位论文、影视资料、网址、CD-ROM与数据库等;美国农业图书馆的数字馆藏包括电子化的图书、期刊、书目、报纸、图像、缩微胶片、年度报告、新闻、时事通讯、有关农业的娱乐页面资料、日历、网址、CD-ROM与数据库等[6];北京大学图书馆的数字馆藏包括电子化的图书、期刊、报纸、新闻、学位论文、网址、古文献特藏、视频资料、VCD与CD-ROM、网络数据库等。
上述数字图书馆馆藏可以分为5类,即永久保存级、服务级、镜像级、链接级与代理级[7-8]。所谓永久保存级,是指数字资源保存在本地数字图书馆,其他地方不可获得,其内容建立、维护和存取由该数字图书馆负责,如自建的书目数据库、特藏数据库;所谓服务级,是指数字资源保存在本地数字图书馆,是面向用户服务的,但它们并不象永久保存级资源一样就其内容进行维护与存取,如新闻;所谓镜像级,是指数字资源是通过复制其他数字化数据而保存在本地数字图书馆中,但该数字图书馆不对其内容和维护承担主要责任,如某些电子期刊数据库;所谓链接级,是指数字资源是分布在网上通过链路实现信息共享的,对这类信息资源,数字图书馆无权控制,也不对其内容和维护负责,如网络导航数据;所谓代理级,是指数字资源保存在异地且由异地机构负责管理和维护,本地数字图书馆购买或租赁其使用权,如国外网络数据库。
2 数字图书馆馆藏评价标准
尽管目前还没有建立起一套有效的数字图书馆馆藏评价标准,但是国内外已开始了此方面的研究工作。美国乔治亚州大学的图书馆在线学习联盟(GALILEO)于1998年成立了电子馆藏开发委员会,该委员会建立的电子资源评价标准由下列要素组成[9]:
·是否支持GALILEO参与者的研究、课程、一般教育与终身学习需求;
·覆盖面,指提供的信息类型与主题范围;
·是否有利于GALILEO获得核心馆藏的平衡;
·是否存在多学科要求;
·是否满足大部分GALILEO用户的要求;
·是否可利用全文本和/或图像;
·信息是否是最新的(即多久得到更新);
·信息是否应用现有的存档条款来进行归类,以利于将来的访问;
·应用什么样的统计来显示资源的利用率;对新资源期望的使用效果是什么;利用成本如何;
·权威性,包括出版者是否可靠,GALILEO与销售商的先前交往是否令人满意等;
·技术事项,包括销售商提供的支持,销售商是否提供全面的使用统计,是否可利用远程存取等。
O.Gene Norman通过总结与分析多人研究成果,设计出馆藏电子资源评价表(见表1),它分为传统标准(traditional criteria)和新兴标准(emerging criteria)两部分[10]。
表1 馆藏电子资源评价表
附图
上述两种观点虽然对于进行数字图书馆馆藏评价具有一定的指导意义,但是它们并非可以广泛推广的实用标准。因此,笔者认为今后数字图书馆馆藏评价应该基于如下7个原则:
·可靠性,即要求数字图书馆系统是稳定的,馆藏资源本身是客观的,数据原创者的个人信息是真实的。
·合理性,即要求馆藏资源是公正的、适度的和一致的。这里“公正”是指提供不偏不倚、理由充分的观点,并能用合理的方式表达自己的见解;“适度”是指能恰当地反
映客观世界;“一致性”是指提供的证据或信息不自相矛盾。
·可用性,即要求馆藏信息是符合数字图书馆和用户的实际需要的,并可通过网络实现本地和异地的访问与统计。
·全面性,即要求馆藏收录范围是全面的和广泛的,能够尽量收录本国与外国、本民族语言与外来民族语言、过去和现在的文字、图像、视频与音频信息;既提供原始文献,又提供资源链接;既提供一次文献,又提供二次文献。
·权威性,即要求数字图书馆网站和馆藏具有声望或权威,并拥有知识产权。
·时效性,即要求馆藏信息能始终保持最新状态,定期更新。
·经济性,即要求用最少的费用支出满足用户对馆藏信息的需求。
3 数字图书馆馆藏评价指标体系
数字图书馆馆藏评价将突破传统图书馆馆藏评价指标(如藏书保障率、藏书覆盖率、藏书结构、藏书利用率等)的束缚,以信息资源的拥有与存取能力、检索能力、组织能力、加工能力与利用能力作为其评价体系的主要方面。由于数字图书馆馆藏可分为实体馆藏和虚拟馆藏,因此,其评价指标体系也分为实体馆藏评价指标与虚拟馆藏评价指标两部分。
3.1 实体馆藏评价指标
实体馆藏评价指标由信息拥有、信息检索、信息揭示、信息组织、信息加工与信息利用6方面指标构成,如表2所示。
表2 实体馆藏评价指标
附图
3.2 虚拟馆藏评价指标
虚拟馆藏评价指标应该包括如下几方面要素:
·能实现远程访问的(链接级与代理级)网络数据库的数量和种类;
·能实现远程访问的免费数据资源;
·网络信息资源的分类组织;
·利用网络信息资源的设备配备及布局;
·允许上网远程查询专业数据库的人员范围;
·网络开通的时间;
·网络的带宽与速率;
·通讯费与信息流量费。
4 数字图书馆馆藏评价方法
与传统图书馆相比,数字图书馆馆藏评价不仅在标准与指标上发生了显著变化,而且其评价方法也有了发展。Cynthia Dobson认为,在同时存取与拥有信息的图书馆环境中需要应用新的评价方法,特别是在跨学科领域,资料广泛分散在本地、地区和国家图书馆馆藏中时。传统的以使用为中心(use-centered)和以 《数字图书馆馆藏评价》