【 标 题】信息整流与知识增值服务
提供在广域网上高速横向跨库的便捷的数字知识存取服务。
由此,我们可以说,数字图书馆的兴起是Internet网络技术的巨大冲击;数字图书馆的发展的强大推动力是人类知识需求速度的猛增。人类不仅需求更多的信息,而且需要更高质量的知识。数字图书馆将面向知识增值服务系统的转型发展。
2.3 数字图书馆的知识创新
国家创新体系的主要功能,是知识创新、知识传播、知识交换和知识利用。大力促进和提高知识的生产、传播、交换和利用的水平、规模和效率,是国家创新体系的基本任务。
(1)知识创新过程
知识创新是数字图书馆发展的最主要的动力源泉。信息经过加工和改造形成知识。知识是人脑创新的成果,是人类智慧的结晶。智慧是人类文明的源泉,是推动历史发展的永恒动力,是生产力诸要素中的核心。
知识一般可分为陈述性知识、过程性知识和控制性知识。陈述性知识提供概念和事实,描述系统状态、环境和条件,使人们知道是什么。过程性知识提供有关状态的变化、问题求解过程的操作、演算和动作的知识。
个性知识单元由最小的知识元素“知识元”组成,知识元的不同排列构成了不同知识单元之间的差异,知识元也是知识结构的最小元素,在知识结构中可以由知识元直接组成新的知识单元,这就是知识学习与知识创新的过程。
(2)知识创新的度量方法
在考虑知识创新度量问题时,我们应尽可能从知识单元与知识结构之间所表现的特征寻找描述度量的方法。就某一篇文献而言,它的知识包含有两个层次。一个是局部的,即是围绕该文本主题有关方面的判断、推理、结论等。另一个是全局的、总体的,即是相对该学科主题现状的知识增量。比如,一篇综述性文献,由于采用知识的提炼与合成技术,它本身的(局部的)知识容量增加了,建立了新的知识链关系,就有知识创新产生。
从知识度量角度讲,我们所研究的知识是事实性的、静态的知识,是关于事物的分类、属性、事物间关系等的科学事实或客观事实。具体到某一篇文献而言,知识是指关于其所研究对象(主题)的结构、关系、属性和取值等方面所做的概念、判断、推理,即有关该主题对象新有的结论。相对学科主题而言,它的知识则指的是新增加的那一部分,即知识创新的增量。知识是可学习的、可复制的,而智慧是不可复制的。目前对知识创新度量最简单的方法是对产生新的知识增量及其效应的判别和估价。这种估价的结果表现为一种数量现象,实质上估价知识的增量隐含着对智慧的测度,因为实现知识创新的根源是智慧,但对智慧的度量目前则是太困难了。
(3)信息与知识的变换
科技发展史上的一条规律说明:当把两门表面看来毫不相干的学科结合起来的时候,就可能形成一门新的学科;当把两种似乎没有任何联系的现象联系起来,就可能在科学技术上取得某些进展或突破。不同学科的文献常有内在的联系,包含隐含的知识或信息,可以从中重组出全新的知识或信息,得出全新的推理或结论。
·隐含信息的关联
隐含信息的重组是知识的外化和外延。一些信息本身没有什么价值,但在它身后却隐藏着另外一种很有价值的信息,这种延伸或潜在的信息单元、知识单元,有一定的隐蔽性,往往不易被人发现,一旦被开发出来,并运用到实践当中去,却可产生不可估量的效益。
美国芝加哥大学图书馆研究生院、信息中心的Swansan D.R.等一直在从事认知科学和文献内容相互关系的研究,对信息重组和知识创新过程进行了不少研究。由于他们一直对文献的隐含信息进行研究,并在研究过程中,利用现代的计算机技术,设计了一种新颖的计算机辅助信息检索软件(ARROWSMITH算法),能辨别出生物医学文献中两个词语间的联系,从而进一步发现隐含信息的关联,促进新知识的产生。
·知识的消息通信
知识元、知识单元、知识结构都以信息的方式在文献中表现,把隐含在文献中的大量复杂知识元以消息通信的方式连接起来,提高隐含知识的明晰化程度,将是未来数字图书馆向知识创新努力的关键[4]。
知识检索是在知识结构中获取知识的过程,用户可以通过知识单元间接地获取知识,更可以通过知识元直接获取知识;信息检索只能通过间接的知识单元信息获取文献。
知识链接是数字图书馆的核心,是实现数字图书馆从信息服务向知识服务转型的关键技术。因此,采用知识链研究知识标引与检索是合理的,研究知识元、知识单元、知识结构之间的信息与知识的变换是可实现的。
从人工智能观点看,知识是对事实的合理推理的结果。知识的表达与处理可以有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元与知识单元和知识结构之间的继承性,以及如何有效地实现它们之间的消息通信。
·信息转换成知识
从标引“知识元”层面研究,揭示单篇文献的个体“知识元”信息与某领域共性“知识结构”的链接关系,从而找出信息与知识的转换的普遍规律[5],是提高用户通过检索系统直接获取有效知
传统的信息服务只提供文献的信息或提供作为知识素材的文献,并没有揭示文献中的知识链。人们获取的只是文献数据信息本身,并不是知识。比如人们看到了题录摘要,从中未必可以看到知识。即使读完了一次文献,也许仍不能准确了解其中的知识所在。
数字图书馆中存在大量的文献信息库,文献信息库中的知识是非结构化的,知识元之间的关系是隐含的,需要一种能把文献中的知识元及其信息背景一起封装的技术,实现知识与访问该知识的信息成为独立的知识元,又要使得在检索需要的时候,独立知识元之间的关系能通过它们所带的信息实现连接,这就是我们要实现的知识链概念。具体方法我们将另文介绍。其基本框架有:
(1)将标引的每一个工序合理安排;
(2)借助历史数据尽快完成知识增值标引;
(3)在系统中捆绑专家工具,以便快速抽取知识元,建立知识链关系;
(4)自动整理现有工序操作流程,并在知识库中总结工作吸取教训;
(5)自动形成标引的标准;
(6)校验后决定是否修改;
(7)将结论整理存入知识网格库;
(8)用户查询的经验及要求的加入等。
人们期望数字图书馆能提供知识服务,数字图书馆正在由文献信息服务向知识增值服务转型。数字图书馆将造就一门新的学科——知识管理工程。它将是以计算机技术、通信技术、管理科学、人工智能技术为骨干的新型学科。信息过滤,信息与知识转换,将对知识管理工程产生深远的影响。新一代数字图书馆的工作者将是信息整流和知识创新的人才。
【参考文献】
1 徐如镜.开发知识资源发展知识产业服务知识经济.在“2001数字化信息资源与知识仓库标准国际研讨会”上的讲话。
2 温有奎.计算机检索中的情报取样与滤波分析.情报学报,1993,12(1):61~68
3 林鸿飞,战学刚,姚天顺.基于概念的文本结构分析方法.计算机研究与发展,2000(3)
4 赖伯年等.西北地区数字图书馆建设与社会经济可持续发展研究,社科基金2002
5 温有奎,徐国华.信息与知识变换.情报学报,2002,21(5):613~617
本文链接地址:http://www.oyaya.net/fanwen/view/60397.html
由此,我们可以说,数字图书馆的兴起是Internet网络技术的巨大冲击;数字图书馆的发展的强大推动力是人类知识需求速度的猛增。人类不仅需求更多的信息,而且需要更高质量的知识。数字图书馆将面向知识增值服务系统的转型发展。
2.3 数字图书馆的知识创新
国家创新体系的主要功能,是知识创新、知识传播、知识交换和知识利用。大力促进和提高知识的生产、传播、交换和利用的水平、规模和效率,是国家创新体系的基本任务。
(1)知识创新过程
知识创新是数字图书馆发展的最主要的动力源泉。信息经过加工和改造形成知识。知识是人脑创新的成果,是人类智慧的结晶。智慧是人类文明的源泉,是推动历史发展的永恒动力,是生产力诸要素中的核心。
知识一般可分为陈述性知识、过程性知识和控制性知识。陈述性知识提供概念和事实,描述系统状态、环境和条件,使人们知道是什么。过程性知识提供有关状态的变化、问题求解过程的操作、演算和动作的知识。
个性知识单元由最小的知识元素“知识元”组成,知识元的不同排列构成了不同知识单元之间的差异,知识元也是知识结构的最小元素,在知识结构中可以由知识元直接组成新的知识单元,这就是知识学习与知识创新的过程。
(2)知识创新的度量方法
在考虑知识创新度量问题时,我们应尽可能从知识单元与知识结构之间所表现的特征寻找描述度量的方法。就某一篇文献而言,它的知识包含有两个层次。一个是局部的,即是围绕该文本主题有关方面的判断、推理、结论等。另一个是全局的、总体的,即是相对该学科主题现状的知识增量。比如,一篇综述性文献,由于采用知识的提炼与合成技术,它本身的(局部的)知识容量增加了,建立了新的知识链关系,就有知识创新产生。
从知识度量角度讲,我们所研究的知识是事实性的、静态的知识,是关于事物的分类、属性、事物间关系等的科学事实或客观事实。具体到某一篇文献而言,知识是指关于其所研究对象(主题)的结构、关系、属性和取值等方面所做的概念、判断、推理,即有关该主题对象新有的结论。相对学科主题而言,它的知识则指的是新增加的那一部分,即知识创新的增量。知识是可学习的、可复制的,而智慧是不可复制的。目前对知识创新度量最简单的方法是对产生新的知识增量及其效应的判别和估价。这种估价的结果表现为一种数量现象,实质上估价知识的增量隐含着对智慧的测度,因为实现知识创新的根源是智慧,但对智慧的度量目前则是太困难了。
(3)信息与知识的变换
科技发展史上的一条规律说明:当把两门表面看来毫不相干的学科结合起来的时候,就可能形成一门新的学科;当把两种似乎没有任何联系的现象联系起来,就可能在科学技术上取得某些进展或突破。不同学科的文献常有内在的联系,包含隐含的知识或信息,可以从中重组出全新的知识或信息,得出全新的推理或结论。
·隐含信息的关联
隐含信息的重组是知识的外化和外延。一些信息本身没有什么价值,但在它身后却隐藏着另外一种很有价值的信息,这种延伸或潜在的信息单元、知识单元,有一定的隐蔽性,往往不易被人发现,一旦被开发出来,并运用到实践当中去,却可产生不可估量的效益。
美国芝加哥大学图书馆研究生院、信息中心的Swansan D.R.等一直在从事认知科学和文献内容相互关系的研究,对信息重组和知识创新过程进行了不少研究。由于他们一直对文献的隐含信息进行研究,并在研究过程中,利用现代的计算机技术,设计了一种新颖的计算机辅助信息检索软件(ARROWSMITH算法),能辨别出生物医学文献中两个词语间的联系,从而进一步发现隐含信息的关联,促进新知识的产生。
·知识的消息通信
知识元、知识单元、知识结构都以信息的方式在文献中表现,把隐含在文献中的大量复杂知识元以消息通信的方式连接起来,提高隐含知识的明晰化程度,将是未来数字图书馆向知识创新努力的关键[4]。
知识检索是在知识结构中获取知识的过程,用户可以通过知识单元间接地获取知识,更可以通过知识元直接获取知识;信息检索只能通过间接的知识单元信息获取文献。
知识链接是数字图书馆的核心,是实现数字图书馆从信息服务向知识服务转型的关键技术。因此,采用知识链研究知识标引与检索是合理的,研究知识元、知识单元、知识结构之间的信息与知识的变换是可实现的。
从人工智能观点看,知识是对事实的合理推理的结果。知识的表达与处理可以有多种方法,且已有许多优秀成果,但最关键的是如何实现知识元与知识单元和知识结构之间的继承性,以及如何有效地实现它们之间的消息通信。
·信息转换成知识
从标引“知识元”层面研究,揭示单篇文献的个体“知识元”信息与某领域共性“知识结构”的链接关系,从而找出信息与知识的转换的普遍规律[5],是提高用户通过检索系统直接获取有效知
识而不是一大堆文献的有效方法。
传统的信息服务只提供文献的信息或提供作为知识素材的文献,并没有揭示文献中的知识链。人们获取的只是文献数据信息本身,并不是知识。比如人们看到了题录摘要,从中未必可以看到知识。即使读完了一次文献,也许仍不能准确了解其中的知识所在。
数字图书馆中存在大量的文献信息库,文献信息库中的知识是非结构化的,知识元之间的关系是隐含的,需要一种能把文献中的知识元及其信息背景一起封装的技术,实现知识与访问该知识的信息成为独立的知识元,又要使得在检索需要的时候,独立知识元之间的关系能通过它们所带的信息实现连接,这就是我们要实现的知识链概念。具体方法我们将另文介绍。其基本框架有:
(1)将标引的每一个工序合理安排;
(2)借助历史数据尽快完成知识增值标引;
(3)在系统中捆绑专家工具,以便快速抽取知识元,建立知识链关系;
(4)自动整理现有工序操作流程,并在知识库中总结工作吸取教训;
(5)自动形成标引的标准;
(6)校验后决定是否修改;
(7)将结论整理存入知识网格库;
(8)用户查询的经验及要求的加入等。
人们期望数字图书馆能提供知识服务,数字图书馆正在由文献信息服务向知识增值服务转型。数字图书馆将造就一门新的学科——知识管理工程。它将是以计算机技术、通信技术、管理科学、人工智能技术为骨干的新型学科。信息过滤,信息与知识转换,将对知识管理工程产生深远的影响。新一代数字图书馆的工作者将是信息整流和知识创新的人才。
【参考文献】
1 徐如镜.开发知识资源发展知识产业服务知识经济.在“2001数字化信息资源与知识仓库标准国际研讨会”上的讲话。
2 温有奎.计算机检索中的情报取样与滤波分析.情报学报,1993,12(1):61~68
3 林鸿飞,战学刚,姚天顺.基于概念的文本结构分析方法.计算机研究与发展,2000(3)
4 赖伯年等.西北地区数字图书馆建设与社会经济可持续发展研究,社科基金2002
5 温有奎,徐国华.信息与知识变换.情报学报,2002,21(5):613~617
《【 标 题】信息整流与知识增值服务(第2页)》