关于地方文献数据库建设的思考
关于地方文献的界定,地方文献工作的前辈杜定友先生认为“地方文献是指有关本地方的一切资料,表现于各种记载形式的,如:图书、杂志、报纸、图片、照片、影片、画片、拓本、表格、传单、票据、文告、手稿、印模、簿籍等”。随着社会的发展,新型载体形式的不断涌现,诸如光化学、磁记录制品等的面世,增加了地方文献载体形式的新家族。在如此众多的文献类型和文献载体中选取相关的地方文献信息进行数据库建设是社会发展的必然,也是地方文献对社会需求的积极反应。
地方文献数据库建设工作是地方文献全面实现自动化和网络化的基础,是提高地方文献工作管理水平与质量,建立和实现地方文献资源共享的前提。本文是笔者对地方文献数据库建设过程中涉及到问题的一些思考,供同道师友参考。
1 数据库建设论证
数据库建设作为一项系统工程在投资兴建前应对其经济效益和社会效果进行多方面的调研、预测和评介,进行可行性论证,以回答在限定条件下,数据库建设的目标能否达到,是否可行,何者为优诸多问题。论证的主要内容包括需求研究、可行性研究和评价报告等步骤。
需求研究是对项目的背景,研究工作的依据和范围,市场需求和拟建规模的调研。
地方文献是反映一个地方诸多方面信息的文献总集成,研究的主题和范围有着严格的界定,其信息密度和独特性是其他文献无可替代的。在网络环境下,以数据库建设为契机对地方文献中的核心文献进行一次全面深入的发掘和整理,逐步实现地方文献数字化。其意义在于突破了地方文献信息传统传输的限制,实现了跨地域、无时限的信息获取方式。将地方文献推向一个广阔的传播空间,在这个文献基础上建设的数据库存在着广泛的市场需求和信息开发价值。地方文献从整体范围上说分为核心文献和非核心文献,数据库选题应首先选择地方文献的核心文献作为数据库的建设重点。建立独具特色的数据库是地方文献建库的原则,在这个基础上精心策划和设计建设符合实际的地方文献数据库,可以包括不同的文献类型和文献载体,其规模应视实际情况而定,不能贪大求快作表面文章,要特别重视数据库的实用性和社会效益。
可行性研究是对资金、资源和人员等进行分析研究,并提出和考虑几种方案以便比较,从数据库使用的角度回答项目的可行与否。
数据库建设主要是将纸本文献信息通过技术手段加工成为电子文件的过程,在这个过程中涉及到文献资源、资金和专业技术人员等诸多因素,涉及到多部门之间协作。数据库建设工作中的每一个环节,都应经过认真研究和分析才能作出决定,而不能简单化。行政命令不能解决本应通过讨论和协商解决的问题,应该注意解决的问题含糊不得。
数据库建设资金是非常重要的问题。资金筹措和使用管理等应请有关专家领导研究和论证方可决定。与资金相关的问题是数据生产方式,而采用什么样的数据生产方式又涉及到数据库建设人员问题。生产方式不外乎本单位生产和社会化加工两种。如果自己具备数据生产能力,资金投入从理论上应该低于社会化加工,通过实际工作还可以培养和造就一批专业人才。如果本馆数据加工能力有限,需要社会化加工,也应考虑资金投入与获得利益的价值比。
完成上述工作后,提出周密详细可靠的评介报告交付决策部门,整个数据库建设论证工作才算完成。
2 数据库建设工作流程
决策部门下达了数据库建设任务后,数据库建设任务的承担部门应迅速拟定出具体的建设方案及业务工作流程,以指导数据库建设工作有序进行。建设方案主要内容应包括:文献选取、数据库结构、文献加工、文献标引、数据灌装链接等。
①工作流程图
②文献选取
文献选取工作是数据库建设的重要内容之一,关系到数据库的质量高低和成功与否。文献选取应以社会需求、社会效果和地方文献基础业务建设需要为主要参考依据,选取标准应定位在地方文献核心文献。
考虑不同时期文献的字体形式、纸张问题、印刷技术在文献数据加工时的难易和成本费用的高低等。先期选取文献时以简体横排文字图书为主体,古籍线装图书尽可能使用再版排印本,这样可以大大降低文献扫描识别的难度。
③数据库结构
数据库结构设计的合理与否关系到数据库使用,因此在进行数据库结构设计时,数据库设计人员和地方文献业务人员应该从使用者的角度,进行细致的研究分析,力求操作简便快捷。
数据库结构主要包括以下内容:
题名、题名责任者(可重复字段)、母体文献名称、母体文献责任者、出版社、出版日期、页数、分类号(可重复字段)、主题词(可重复字段)、索引号、ISBN、摘要。
对象数据:文本(文献全文)、图像(文献全文、封面和插图)
④文献加工
文献加工是通过数据库扫描、识别、灌装、链接等工序将纸本文献加工成为电子文献,以实现文献性质的转换,完成数据库检索功能。
文献加工是项复杂的事情,纸本文献由于出版年代不同,存在着繁体字竖排版、异体字等问题,这是数据加工的难点之一。全文数据库的文献格式有图形文件(tif)和文本文件(txt),两种格式的文件性质不同加工价格也不同。图形文件在数据库中仅供浏览不能进行检索,当然加工价格也便宜。文本文件在数据库中不仅可以浏览重要的是可供检索,自然加工价格也贵许多。两种文献格式的加工费用比例约为1比5。受价格因素的制约,在文献加工时选择那种文献格式,要对使用目的和文献加工价格综合考虑。
⑤文献标引
文献标引工作是一项复杂的技术性工作,标引质量受各个工作环节的制约,因此必须严格遵守一定的工作程序。地方文献标引工作因其文献的地域性和特殊性,在遵循图书馆文献标引工作的原则和方法前提下,应根据地方文献工作的特点制定出一些符合实际工作需求的标准和方法,以满足地方文献标引工作需要。文献标引涉及到数据库检索质量问题,检全率、检准率是衡量数据库质量的重要标准,因此文献标引工作应由富有经验的地方文献专业人员完成。
⑥数据灌装链接
从事数据灌装链接工作的技术人员需要很强的责任心,良好的专业素质,操作谨慎细致,来不得一点马虎。灌装链接中一个不经意的误差可能导致数据库检索失败,出现误检或漏检,大大降低数据库的检全率和检准率,极大的削弱数据库使用功能。
数据灌装链接专业人员要与地方文献专业人员进行必要的沟通,倾听他们对数据库的使用要求,最大限度的满足地方文献工作的特殊检索要求。
3 数据库建设中的相关因素
数据库建设中涉及的因素有很多,如人员素质、文献资源、资金、计算机软硬件、数据加工、协作关系等。在诸多因素中,人员素质、数据来源应视为主要因素。
①人员素质
人员素质是影响数据库建设最直接的因素之一。人员包括地方文献专业人员和数据库技术人员,地方文献专业人员在地方文献数据库选题、建设方案、文献选取、文献标引等工作中举足轻重。地方文献专业人员作为数据库建设的主体人员应具备较高专业素质和思想素质。数据库技术人员是地方文献数据库得以实现的技术保障。因此应该对参加建库人员进行专业技术培训,进行上岗考核,确保各项工作规范化。
②文献资源
文献资源是数据库建设的首要条件因素之一,缺乏文献资源支持的数据库建设是无源之水,无米之炊。地方文献数据库建设分为书目数据库和全文数据库或称对象数据库,无论是哪种形式的数据库都离不开文献资源的支持。具备地方文献专藏系统的单位可以本馆资源为主体来源,同时加强对社会其他文献资源中地方文献的检索和梳理。未建立地方文献专藏的单位首先根据地方文献工作原则和标准,通过书目控制理顺和检全文献资源,做到心中有数。做好建库的前期准备工作,最大限度的提高数据库的完整性、系统性、权威性。
图书馆数据库建设是一项繁杂的系统工程,地方文献数据库由于受地方文献特殊性的影响就更是复杂。因此在建设地方文献数据库时,应就其建设目标、社会需求及相关的诸多因素进行认真的研究分析以求获得最理想的结果。
网络环境下数据库技术使地方文献的利用和传播突破了空间和时间的限制,社会信息用户对地方文献的需求呈现出较高渴望,人们对地方文献数据库建设表现出极大的热情,而地方文献数据库工作也作为衡量图书馆工作的一项重要指标纳入图书馆工作考核之中。所有这些都给图书馆地方文献工作者们提出了更高的要求。勤于思考、认真对待,深入研究和开发利用地方文献将是地方文献工作者们今后需要认真研究的重要课题。
〔出处〕 图书馆工作与研究2002增刊
《关于地方文献数据库建设的思考》