构建具有特色的景德镇数据库
摘 要 从国内外信息化发展的趋势分析数据库的重要性,结合景德镇的市情,阐述了建立特色数据库的目标和内容,探索了建库的科学方法和严谨的步骤。
1 背景分析
1.1 世界信息需求从单纯的定性、定量分析转向针对竞争环境的综合分析、预测和判断,渗透到经济、政治、文化、军事、法律等各个领域,信息资源已成为与能源、材料并重的三大经济支柱,全世界每分钟有500万个电子邮件被发送,每小时有35oo万个音频邮件被送出,每天有37oo万用户在登录互联网,信息时代商机无限!
除了不断扩张的电信网络外,国内外的有线电视充分显示出市场空间和商业机会:一是最主要的视频服务,有线电视网由于有750兆的人户带宽,除新闻、娱乐外,可提供更多的节目;二是数据服务,有线电视频率资源丰富,可发展信息传输业务,有线电视与计算机网都是总线制宽带共缆传输,两网的结合非常自然;三是电路出租业务,中国有线电视网是除中国电信之外的最大信息网络;四是将有大量的综合信息通过有线电视进入家庭。
1.2我国《国家信息化“九五”规划和2010年远景目标纲要》明确提出将信息资源的开发和利用作为国家信息化的核心。我国是一个潜力巨大的信息市场,中小企业约占全国企业总数的99%,近1000万个,小企业在乡以上的工业企业中约占总产值的62%,就业人数约占71%,多属劳动密集型,资金少、利润薄、科技含量低,加快信息发展就显得迫切而重要,作为信息化核心的数据库建设严重滞后。我国数据库建设起步于20世纪70年代,本着自建数据库与引进国外数据库并重,建立国内联机数据库交流与建立国际联机检索终端并举,国内中文网络26.5万个,互联网主页50万页,数据库3千个。但与西方国家相比,数据库资源显得十分薄弱,大型数据库少,小型数据库普遍不规范。美国的数据库超过3万个,且规模大、容量大、更新速度快、商业化程度高,在NII《美国国家信息基础设施:行动计划》中就确定了今后重点建设数据库,促进网络资源开发利用的战略发展重点。国外一些著名的信息公司开始进军中国数据库市场。
1. 3 江西省“十五”信息化发展规划,其中提出建成一批信息资源网和基础性数据库,重点建设环境、宏观经济、企业与产品、农业与农村、工商企业。交通旅游、科技教育、政策法规、人力资源与就业、社会保障等50个基础性数据库,促进信息资源共享,逐步实现信息资源开发利用的产业化,建设铜业、陶瓷、中药材、农产品五大特色信息网。
景德镇市以全面推进经济与社会服务信息化为目标,以市场为导向,巩固和发展电子元器件,全面提升通讯业,大力扶持软件业,积极拓宽网络服务业,全面推广信息技术,以比“九五”期间更快的速度推进信息化,提高产业经济规模位居全市前例,尽快出台《关于加快发展和全面推进全市信息化的决定》。结合国内外及江西省的情况,鉴于景德镇地处赣、浙、皖交界地区,我认为还应强调跟踪国内外先进技术,依托国家和省内重大信息系统应用工程,加强数据库建设,以先进信息技术武装和改造传统企业,实现经济结构的升级和优化,带动国民经济的发展,幅射省际交界地区,同时出台《景德镇市数据库建设管理条例》。
数据接受和发送条件,景德镇市邮电网站遍布城乡,程控电话、可视电话、移动电话、数字微波、光缆传输等具有世界先进水平的通讯设备投入运营,电话号码已升到七位,农市话合一的C3(##下标)电话本地网建成。有图书馆3个,广播电台2座,广播人口覆盖率(中波)为85.9%,电视台3座,电视人口覆盖率为86.6%,《景德镇日报》发行总量为324万份,全市固定电话用户15.7万户,移动电话用户7.45万户,报刊发行量2116万份。新兴的电子商务、网络建设等也取得了新进展。国民经济持续发展,陶瓷、机械、电子、医药化工、食品、建材等各种产业争奇斗艳,全省公布的96个名牌产品中,景德镇有11个。日用瓷、陈设瓷、工业陶瓷,轻型汽车、微型汽车、冰箱、压缩机、印刷机械,微波介质、铝和钽电解电容器、焦碳、氯化亚矾、烧碱、盐酸、醋酸乙烯、聚醋酸乙烯,新诺明、普鲁卡因青霉素、茶叶、香菇等产品为信息高速公路提供了充足的货源,构建具有特色的景德镇数据库条件成熟。
2 目标和内容
2.1建库目标:根据景德镇市经济文化特征及区位优势,重点考虑生产力要素市场和产品市场,全面搜集陶瓷、机械、电子、医药化工、食品、建材、旅游、农业等方面的资料,以建立全国陶瓷数据库为龙头,建立若干个行业产成品、商情等特色的数据库,通过宏观调控和微观管理,形成统一、协调、优化的整体。
2.2指导思想:统筹规划、联合建设、统一标准、共同保护,加强与国内外数据库系统的交流和合作。
2.3建库原则:既要考虑到节省内存空间,又要提高运行速度,采用规范化的方法,使数据库尽可能简单,分析数据来源及数据之间的关系,确定该系统要涉及到的每个实体。针对景德镇市中小企业多,且大多产品被外地大型企业产品覆盖,故数据库应朝小型专业库发展,专业数据应以部门为主,事实库、经济库可部门地方并重。数据库要充分体现特、专、全、精。
特:突出陶瓷、突出部省及市属企业的优势产品。专:信息与专题一致,收录上述产品涉及的最新信息,包括专利、市场、趋势等。全:针对特定主题收集完整的信息,尽可能检索各种载体文献,重点是国内外相关数据库。精:剔除冗余的数据,数据加工要有针对性,揭示信息本质特征,做到精而准,不断更新信息。
2.4数据库建设是一项投入大、技术性强,周期长和见效呈的基础工作,数据库分类众多,鉴于景镇市大型企业少,中小企业多,产品市场占有率不高的客观现实,特别是我市经济还不够发达,财力有限,所以可以充分利用网络环境的优势,形成自己的鲜明特色,着力建设:2.4.1文献数据库:重点是体现景德镇陶瓷文献,充分利用馆藏书目、专题及专利文献数。2.4. 2数值型数据库:重点突出我市压缩机、印刷机械、电子产品等科技数据,提供工业原料及成品的科技含量,经济增长数据信息。2.4.3事实数据库:重点突出商情数据,如提供昌河汽车各项性能指标的同时,辅之以汽车外观造型和内部结构,甚至汽车运行的模拟显示,同时做好管理数据库、公用服务数据库。2.4.4全文数据库:不仅记录二次文献,还记录大量一次文献。2.4.5各媒体数据库:将图形、图像、文字、动画、声音等各种媒体数据结合为一体,并统一地进行存取、管理和应用,挖掘瓷都的旅游资源。
3 方法和步骤
在完善和建立数据库的过程中一方面对已建的数据库进行深层次的开发,另一方面要注重以源数据建设为主,增强数据库的完整性、可靠性。
3.1对已有数据库的开发特别要强调网络数据挖掘。定期在网上进行搜索,对无法获得的数据,建立数据采集模型,形成虚拟文本、图像和模型的综合数据资源库。对收集的综合数据进行自动分类与编码,严格分出数据指标与分类维,对数据和图像实现智能索引,形成以数据指标为中心,多维指标挟制体系的综合数据索引库。在索引库的基础上建立综合数据的挖掘模型,实现文本、图像、模型数据的综合利用,形成综合数据,提供对内决策和对外信息咨询服务。在综合数据的基础上,实现科学决策和区域规划。
与此同时必须对从网上获取的信息重新加工,使之规范化、标准化,对一次文献需要编制与之配套的题录与文摘,对二次文献则要求重新进行规范著录,缺少分类和主题标引应按《中国图书分类法》和《汉语主题词表》对其进行标引,然后按CNMARC标准格式编目。
3.2源数据库建设,首先要强调数据采集广度与深度,如中国加入WTO,有利于劳动密集型的陶瓷工业发展,世界日用陶瓷按年增长3%计算,2000年为79亿美元,我国平均单件换汇0.3美元,远低于世界平均0.87美元。新闻出版市场发展趋势,我市印刷机构的性能、功能、价格将受其左右。随着环保意识加强,对压缩机及汽车尾气的排放,环保措施的强制执行,必将影响到昌河汽车、华意冰箱的生产销售,故必须追踪国内外市场的变化。其次要注重数据的分类整理,如竞争对手的优势和劣势,产品的科技含量,原材料的价格走势,潜在市场等。上述信息错综复杂,需要认真研究,区分界定。再就是要注意数据的检索标引,必须标引详细地名和人物名,主题词要鲜明、准确。另外,要进行数据筛选,剔除冗余信息,完善数据内容,按统一格式进行规范,字段内容不全的予以完善,将所有记载的数据进行格式规范,导入数据库。
最后要注重数据库的日常维护如更新、替换、删除、数据的修改和整理,使其不断扩充和完善,真正发挥特色数据库和作用。
参考文献
1 张学福,邓 平. 我国数据库管理信息资源建设研究。中国图书馆学报,1997(2)
2 姚国吕. 谈我国的数据库建设。图书情报工作,1997(10)
3 李延杰,陶宗宝。中国科学院文献数据库建设现状与发展。图书情报工作,1997(12)
4 景德镇市统计局关于2000年国民经济和社会发展统计公报
〔出处〕 《江西图书馆学刊》2001(3)