馆藏文献优先数字化的策略思考
【内容提要】本文讨论了我国馆藏文献优先数字化的原则与宜于优先数字化的文献类型。作者认为馆藏文献优先数字化的原则是:具有较高价值的本国文献,不受版权约束的文献,以及馆藏文献的缩微胶片拷贝。考虑到用户需求,技术支持以及经济成本,作者提出了优先数字化的文献类型:非文字类型的文献,OCR识别率高的文字文献。
【摘 要 题】信息资源建设
【关 键 词】馆藏……
随着信息手段革命与信息内容革命两次巨大的跳跃性发展,全球掀起了数字图书馆建设的浪潮。数字图书馆的出现,引发了一场全球范围内的文化媒介迁移运动,促使许多国家把本国的文化遗产大规模转换成数字形态,以扩充数字图书馆的“内容”资源,以便为未来的“内容市场”竞争奠定基础。数字图书馆的“内容”资源是刺激与满足人们对文化内容需求的关键,人们对内容需求的革命性增长将推动技术革命的进一步发展,从而有力地促进国家信息化进程。
由上可见,数字图书馆建设使我们的信息产业发展战略更加明确:以内容的创造来带动技术的发展,以民族文化产业的发展来拉动信息产业的跃升,从而有力地推动国家信息化进程,在整个战略中,文化资源的数字化成为了核心行动。
图书馆历来承担着保存和传播人类文化遗产与知识的关键职能,它丰厚的馆藏闪烁着中华民族悠久历史与灿烂文化的光辉,是世界各国久久仰慕的。将图书馆馆藏文献数字化,通过英特网让世界共享,不仅为中华文化在数字形态下再现辉煌提供了一次历史机遇,而且这笔巨大资源本身对国际市场就具有无比的吸引力。然而,受财力、物力以及当前技术能力的限制,我们暂不可能将这大量的文化瑰宝全部数字化,只能分期分批、有步骤有选择地进行数字化工作,逐步将中华民族文化推向世界文化市场。优先数字化哪类馆藏文献才有可能在全球用户市场上具有竞争力?在当前技术环境与资源配置情况下,制定什么样的数字化策略才最经济与可行?这两个问题是所有从事馆藏文献数字化的同行所共同关注的,也是本文的研究主题。
1 馆藏文献优先数字化的原则
数字化活动的主要目的是提高对图书馆馆藏的获取,或通过提供数字化拷贝,保护珍贵或易损的馆藏文献。鉴于此,笔者认为以下各类文献应当优先考虑数字化。
1.1 优先数字化有利于国家和民族的知识积累、传播与创新
这一优先数字化原则是以符合本国利益、传播本国文化为目的的。考察许多国家数字图书馆的网页,都可以明显地感觉到这一点。例如,美国国会图书馆就是优先将美国1774年至1955年间各类历史、文化、史料性文献数字化,并通过因特网向全世界讲述美国的历史、战争与文化发展(注:许绥文.漫笔之三:馆藏资源的数字化.北京图书馆馆刊,1998(2))。日本也是优先将本国主要的学术刊物(含人文科学、自然科学、工程科学等)优先数字化,并通过因特网向全世界展现自己的文化、科学与技术水平。
因而,我国应当优先数字化本国的文化遗产,将被各类图书馆收藏的,由我国作者撰写的,其著作的有价值部分,与我国社会、政治、文化、科学及经济有关的内容优先数字化;本国的文化和科学领域具有代表性的出版物可考虑优先数字化。这些由本国人产生的,反映本国各方面活动的文献数字化后,通过因特网可在全世界传播中华民族文化与展现本国的科学技术水平。
1.2 优先数字化具有较高价值的本国文献
只有将具有较高价值的本国文献数字化,才有可能吸引国内与国外用户,只有这类资源才有可能在国际市场上具有竞争力;只有将具有较高价值的文献数字化,这类文献才可能为用户长期存取。具有长期利用价值的数字文献,才有可能使数字化初投资与其产生的效益相符。因而,我们必须将具有较高的文化价值、艺术价值、史料价值与研究价值的文献资源优先数字化,必须将本国的文化和科学领域具有代表性的出版物优先数字化。
1.3 优先数字化使用频率中、高的馆藏文献
数字图书馆发挥的社会效益与经济效益的大小,可以通过被访问的次数多少来衡量。只有将用户需求大的文献优先数字化,才可能提高数字图书馆被访问的频率。使用频率中高的馆藏,一般损坏风险也大。将这类文献优先数字化,可直接降低由于多次使用而给这类文献带来的损坏或丢失的风险,也促成了对这类文献的保护。
1.4 优先数字化进入公有领域的文献或不受版权法保护的文献
图书馆数字化活动应遵守知识产权法。对大多数图书馆而言,版权所有资料占馆藏的主要部分。数字化受知识产权保护的文献,需要与产权所有人协商。大多数情况下,协商版权许可是要付出高额费用的。例如,IBM在准备制作有关“哥伦布”的光盘时,仅为得到版权拥有者的同意,就花掉了100万(注:Michael Lesk.Going Digital.Scientifi American,Mar.1997)。
目前,在我国大多数数字资料上网不收费或收费低微的情况下,如果将大量受版权保护的资料数字化,图书馆是承担不起支付著作权人的费用的。因而,我国馆藏文献数字化初期的活动,应主要集中在版权期满或不受版权制约的文献上。
世界各国对作者版权的保护期是有限制的,我国著作权法第21条规定,公民的作品,其发表权和著作财产权的保护期为作者终身及去世后50年,截止于作者去世后第50年的12月31日;如果是合作作品,截止于最后去世的作者去世后的第50年的12月31日。电影、电视、录像和投影作品的发表权、著作财产权的保护期为50年,截止于作品首次发表第50年的12月31日。照此,170年前发表的论著(即1832年以前的论著)或50年以前公开发表的音像制品,是可以考虑优先数字化,而不涉及版权问题。在此时期之后出版的文献,均应仔细地检查、核实其是否仍受知识产权约束。
我国知识产权法规定,不受著作权保护的对象有:法律、法规,国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文;时事新闻;历法、数表、通用表格和公式等不受版权法保护。对于这类不受版权法保护,具有长期使用价值的文献,可以考虑优先数字化,例如国家制定的有关法律、法规等。
1.5 可考虑优先数字化缩微胶片文献,以充分利用已有的成果
由于多方面原因,缩微胶片文献应当优先数字化。
1.5.1 缩微胶片文献内容具有较高的研究价值。我国缩微胶片文献,大多是80年代初,在文化部主持开展的“抢救祖国文化遗产”的工程中形成的。为了有组织、有计划地将我国濒临损毁的、有长期保存价值的文献缩摄为胶片拷贝,近40个公共图书馆与文献收藏单位对本馆本地区的历史文献进行了全面调研。将具有长期保存价值的重要文献,分期分批地制作成缩微拷贝。现今,有重要史料价值的建国前的旧报纸、旧期刊以及古籍善本已经制作成缩微拷贝。目前,有重要价值的普通古籍、革命文献以及建国以
由此可见,馆藏文献的缩摄拷贝凝聚了我国重要文献的内容。
1.5.2 数字化缩微胶片有利于克服阅读障碍,便于用户存取。以缩微胶片为载体的文献,利用起来十分不方便。例如,在提供利用前,需要查出所需文献的缩微胶卷盒号,而从这一卷含有成百上千页的文献中,用阅读器逐页查出所需文献,操作环节多,周期长,利用起来极不方便。所以尽管缩微胶片文献上藏珍聚宝,利用者却寥寥无几。将缩微胶片的模拟影像转换为以数字信息(数字图像或数字文本)后,可以用多种途径为用户提供服务,实现快速方便地检索与查阅,为世界共享中华文化提供了工具。
1.5.3 缩微胶片文献转换为数字信息,也减少了缩微胶片文献因复制和利用带来的损坏,实际上是对缩微胶片文献的保护。
1.5.4 缩微胶片的原件不宜再作数字化处理,制作缩微拷贝的大多数文献,由于年代久远,绝大多数处于急待抢救状况。即使保存状况较好的文献,其纸张也存在不同程度的劣化。近代出版物,如旧报纸、旧期刊中许多因纸张严重变质已无法继续流通,如果再对这些文献直接进行数字化处理,许多脆化的文献就会由此而损毁。
实验表明,用缩摄影像数字系统将缩微影像转换为数字影像,要比其纸质原件经平板扫描仪扫描后转换为数字信息快6倍(注:邵杰.“缩微胶片影像数字化转换及应用”在京通过鉴定.中国档案,2000(8))。可见,将缩微胶片文献数字化不仅避免了对原件的损坏,还节省了数字化的人力与时间。
将缩微胶片转换为数字图像文献的技术早已成熟,自1991年以来,OCLC的保存资源公司就已经扫描了多种格式的缩微胶片。实践证明,今天的技术已经可将所有标准胶片上的模拟信息转换为高质量的双色或灰色的数字影像(注:刘铁庄.美国图书馆资料从缩微胶片到数字化存取的转变.国家图书馆馆刊,2002(1))。
1.5.5 扫描缩微胶片要比直接数字化其原件,获取的信息更完整。按照缩摄中心的要求,文献缩摄前必须进行一系列的补配、加工与整理工作。例如,建国前的旧报纸,保存至今绝大部分已残缺不全,许多善本也破损严重。缩摄前,许多图书馆到全国各地图书馆或其他文献收藏单位对这类文献已经进行过补缺与修补,以及逐页检查、整理、修补和著录等一系列前期工作。尽管许多报刊能补齐 《馆藏文献优先数字化的策略思考》
本文链接地址:http://www.oyaya.net/fanwen/view/62764.html
【摘 要 题】信息资源建设
【关 键 词】馆藏……
随着信息手段革命与信息内容革命两次巨大的跳跃性发展,全球掀起了数字图书馆建设的浪潮。数字图书馆的出现,引发了一场全球范围内的文化媒介迁移运动,促使许多国家把本国的文化遗产大规模转换成数字形态,以扩充数字图书馆的“内容”资源,以便为未来的“内容市场”竞争奠定基础。数字图书馆的“内容”资源是刺激与满足人们对文化内容需求的关键,人们对内容需求的革命性增长将推动技术革命的进一步发展,从而有力地促进国家信息化进程。
由上可见,数字图书馆建设使我们的信息产业发展战略更加明确:以内容的创造来带动技术的发展,以民族文化产业的发展来拉动信息产业的跃升,从而有力地推动国家信息化进程,在整个战略中,文化资源的数字化成为了核心行动。
图书馆历来承担着保存和传播人类文化遗产与知识的关键职能,它丰厚的馆藏闪烁着中华民族悠久历史与灿烂文化的光辉,是世界各国久久仰慕的。将图书馆馆藏文献数字化,通过英特网让世界共享,不仅为中华文化在数字形态下再现辉煌提供了一次历史机遇,而且这笔巨大资源本身对国际市场就具有无比的吸引力。然而,受财力、物力以及当前技术能力的限制,我们暂不可能将这大量的文化瑰宝全部数字化,只能分期分批、有步骤有选择地进行数字化工作,逐步将中华民族文化推向世界文化市场。优先数字化哪类馆藏文献才有可能在全球用户市场上具有竞争力?在当前技术环境与资源配置情况下,制定什么样的数字化策略才最经济与可行?这两个问题是所有从事馆藏文献数字化的同行所共同关注的,也是本文的研究主题。
1 馆藏文献优先数字化的原则
数字化活动的主要目的是提高对图书馆馆藏的获取,或通过提供数字化拷贝,保护珍贵或易损的馆藏文献。鉴于此,笔者认为以下各类文献应当优先考虑数字化。
1.1 优先数字化有利于国家和民族的知识积累、传播与创新
这一优先数字化原则是以符合本国利益、传播本国文化为目的的。考察许多国家数字图书馆的网页,都可以明显地感觉到这一点。例如,美国国会图书馆就是优先将美国1774年至1955年间各类历史、文化、史料性文献数字化,并通过因特网向全世界讲述美国的历史、战争与文化发展(注:许绥文.漫笔之三:馆藏资源的数字化.北京图书馆馆刊,1998(2))。日本也是优先将本国主要的学术刊物(含人文科学、自然科学、工程科学等)优先数字化,并通过因特网向全世界展现自己的文化、科学与技术水平。
因而,我国应当优先数字化本国的文化遗产,将被各类图书馆收藏的,由我国作者撰写的,其著作的有价值部分,与我国社会、政治、文化、科学及经济有关的内容优先数字化;本国的文化和科学领域具有代表性的出版物可考虑优先数字化。这些由本国人产生的,反映本国各方面活动的文献数字化后,通过因特网可在全世界传播中华民族文化与展现本国的科学技术水平。
1.2 优先数字化具有较高价值的本国文献
只有将具有较高价值的本国文献数字化,才有可能吸引国内与国外用户,只有这类资源才有可能在国际市场上具有竞争力;只有将具有较高价值的文献数字化,这类文献才可能为用户长期存取。具有长期利用价值的数字文献,才有可能使数字化初投资与其产生的效益相符。因而,我们必须将具有较高的文化价值、艺术价值、史料价值与研究价值的文献资源优先数字化,必须将本国的文化和科学领域具有代表性的出版物优先数字化。
1.3 优先数字化使用频率中、高的馆藏文献
数字图书馆发挥的社会效益与经济效益的大小,可以通过被访问的次数多少来衡量。只有将用户需求大的文献优先数字化,才可能提高数字图书馆被访问的频率。使用频率中高的馆藏,一般损坏风险也大。将这类文献优先数字化,可直接降低由于多次使用而给这类文献带来的损坏或丢失的风险,也促成了对这类文献的保护。
1.4 优先数字化进入公有领域的文献或不受版权法保护的文献
图书馆数字化活动应遵守知识产权法。对大多数图书馆而言,版权所有资料占馆藏的主要部分。数字化受知识产权保护的文献,需要与产权所有人协商。大多数情况下,协商版权许可是要付出高额费用的。例如,IBM在准备制作有关“哥伦布”的光盘时,仅为得到版权拥有者的同意,就花掉了100万(注:Michael Lesk.Going Digital.Scientifi American,Mar.1997)。
目前,在我国大多数数字资料上网不收费或收费低微的情况下,如果将大量受版权保护的资料数字化,图书馆是承担不起支付著作权人的费用的。因而,我国馆藏文献数字化初期的活动,应主要集中在版权期满或不受版权制约的文献上。
世界各国对作者版权的保护期是有限制的,我国著作权法第21条规定,公民的作品,其发表权和著作财产权的保护期为作者终身及去世后50年,截止于作者去世后第50年的12月31日;如果是合作作品,截止于最后去世的作者去世后的第50年的12月31日。电影、电视、录像和投影作品的发表权、著作财产权的保护期为50年,截止于作品首次发表第50年的12月31日。照此,170年前发表的论著(即1832年以前的论著)或50年以前公开发表的音像制品,是可以考虑优先数字化,而不涉及版权问题。在此时期之后出版的文献,均应仔细地检查、核实其是否仍受知识产权约束。
我国知识产权法规定,不受著作权保护的对象有:法律、法规,国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文;时事新闻;历法、数表、通用表格和公式等不受版权法保护。对于这类不受版权法保护,具有长期使用价值的文献,可以考虑优先数字化,例如国家制定的有关法律、法规等。
1.5 可考虑优先数字化缩微胶片文献,以充分利用已有的成果
由于多方面原因,缩微胶片文献应当优先数字化。
1.5.1 缩微胶片文献内容具有较高的研究价值。我国缩微胶片文献,大多是80年代初,在文化部主持开展的“抢救祖国文化遗产”的工程中形成的。为了有组织、有计划地将我国濒临损毁的、有长期保存价值的文献缩摄为胶片拷贝,近40个公共图书馆与文献收藏单位对本馆本地区的历史文献进行了全面调研。将具有长期保存价值的重要文献,分期分批地制作成缩微拷贝。现今,有重要史料价值的建国前的旧报纸、旧期刊以及古籍善本已经制作成缩微拷贝。目前,有重要价值的普通古籍、革命文献以及建国以
前出版的平装书、建国初期的报纸、期刊等仍在缩摄中,这些重要文献预期在2010年前缩摄完毕。
由此可见,馆藏文献的缩摄拷贝凝聚了我国重要文献的内容。
1.5.2 数字化缩微胶片有利于克服阅读障碍,便于用户存取。以缩微胶片为载体的文献,利用起来十分不方便。例如,在提供利用前,需要查出所需文献的缩微胶卷盒号,而从这一卷含有成百上千页的文献中,用阅读器逐页查出所需文献,操作环节多,周期长,利用起来极不方便。所以尽管缩微胶片文献上藏珍聚宝,利用者却寥寥无几。将缩微胶片的模拟影像转换为以数字信息(数字图像或数字文本)后,可以用多种途径为用户提供服务,实现快速方便地检索与查阅,为世界共享中华文化提供了工具。
1.5.3 缩微胶片文献转换为数字信息,也减少了缩微胶片文献因复制和利用带来的损坏,实际上是对缩微胶片文献的保护。
1.5.4 缩微胶片的原件不宜再作数字化处理,制作缩微拷贝的大多数文献,由于年代久远,绝大多数处于急待抢救状况。即使保存状况较好的文献,其纸张也存在不同程度的劣化。近代出版物,如旧报纸、旧期刊中许多因纸张严重变质已无法继续流通,如果再对这些文献直接进行数字化处理,许多脆化的文献就会由此而损毁。
实验表明,用缩摄影像数字系统将缩微影像转换为数字影像,要比其纸质原件经平板扫描仪扫描后转换为数字信息快6倍(注:邵杰.“缩微胶片影像数字化转换及应用”在京通过鉴定.中国档案,2000(8))。可见,将缩微胶片文献数字化不仅避免了对原件的损坏,还节省了数字化的人力与时间。
将缩微胶片转换为数字图像文献的技术早已成熟,自1991年以来,OCLC的保存资源公司就已经扫描了多种格式的缩微胶片。实践证明,今天的技术已经可将所有标准胶片上的模拟信息转换为高质量的双色或灰色的数字影像(注:刘铁庄.美国图书馆资料从缩微胶片到数字化存取的转变.国家图书馆馆刊,2002(1))。
1.5.5 扫描缩微胶片要比直接数字化其原件,获取的信息更完整。按照缩摄中心的要求,文献缩摄前必须进行一系列的补配、加工与整理工作。例如,建国前的旧报纸,保存至今绝大部分已残缺不全,许多善本也破损严重。缩摄前,许多图书馆到全国各地图书馆或其他文献收藏单位对这类文献已经进行过补缺与修补,以及逐页检查、整理、修补和著录等一系列前期工作。尽管许多报刊能补齐 《馆藏文献优先数字化的策略思考》