网络信息组织对传统信息组织的借鉴
【内容提要】本文以网络信息组织继承和发展传统信息组织的方法为切入点,从四个方面论述了网络信息组织对传统信息组织的借鉴,这四个方面包括用体系分类法完善信息资源分类体系;用分面分类法改进网络信息组织;用分类主题一体化改造网络信息组织;建立一套科学的网络信息分类体系。最后提出了网络信息组织研究和工作的发展趋势。
【摘 要 题】信息资源建设
1 引言
信息组织是采用各种方法和手段使信息有序化的过程。它通过揭示信息间内在的逻辑关系,对信息进行加工、整理、提炼,使之系统化、浓缩化,从而达到便于信息传递和交流的目的。传统信息组织,主要是指对文献信息的组织,即使在采用计算机技术后,所处理的信息对象仍主要是文献信息,并进行人工著录、分类、标引,组织形式大多通过手工编制的目录、索引、文摘等。在网络环境下,信息资源多以数据库、信息库的形式存在,电子信息占主导地位,信息组织的对象逐渐多样化,范围也随之扩大,它不再停留在对文献特征的描述,而是深入到知识单元、信息单元。
从本质上讲,网络信息组织是对网络中的节点(服务器)中的各种格式的文件和数据库(或信息库)中的各个信息单元(如数据项)的组织。具体地讲,网络信息组织有两层含义,一是某一特定网络服务器(网站)的信息组织;二是对整个网络信息(网站集合)的组织。前者是网络局部(节点)的信息组织,后者是网络全局的信息组织。前者的工作主要由各节点的网站开发和维护人员来完成,后者由专门的信息服务公司,通过搜索引擎来完成。两者对图书情报部门的信息组织均有借鉴意义。本文主要以后者为研究对象,即整个网络的信息组织。
传统信息组织主要包括分类法、主题法、索引法、文摘法等。与传统分类法相比,网络信息组织在立类与列类、分类标识与分类对象的对应关系、分类标引过程、分类标引等方面存在明显的区别;与传统主题法相比,网络信息组织在搜索引擎对主题检索的支持以及元数据的产生和运用等方面存在很大区别;与传统索引法相比,在索引对象、索引类型、索引生成以及使用目的等方面存在许多不同;与传统文摘法比较,在编制方式、编制速度、编制质量以及与主题法的结合程度等方面也存在着差别。
比较和分析网络信息组织与传统信息组织有利于展现两者的优缺点,从而为网络信息组织继承和发展传统信息组织提供了借鉴,促进网络信息组织的进一步改进和完善。
本文以此为出发点,深刻认识这两种各有千秋的信息组织方法,提供理论和方法上的依据,并以此为切入点,从四个方面来论述网络信息组织方法与传统信息组织方法之间的相互借鉴关系,以使两者相得益彰、共同发展,从而在实际工作中利用相关成果改进现有工作,以满足现代信息用户的需求。
2 借鉴体系分类法完善信息资源分类体系
从体系分类法的角度看,网络信息资源分类体系确实存在着一些低级错误,改正这些错误将有利于网络信息资源分类的科学化和规范化,有利于提高查全率和查准率,尤其是提高查准率。
2.1 类目设置缺乏规律性和层次的不平衡性
在网络信息分类中,其类目设置往往同时采用多个标准,运用每个标准设类时缺少完整性,有时甚至在同一层次上列出不同等级的类目,致使同位类设置显得混乱,缺乏规律性,增加了用户通过浏览查找信息的难度。因而,需借鉴体系分类法的立类原则,一般采用同一标准,类目级别往往不能混淆。此外,有些网络信息的类目划分只有两三层,有些则多达十多层,类目层次显得不均衡,应当在现有基础上作适当调整,尽量使同位类下的层次保持均衡。
2.2 类目划分缺少一致性
不同搜索引擎的类目划分都有自己的体系,相互之间缺乏一致性。比如,Sohu将“留学与移民”放在“工商经济”类,“网易”在文学类下列出“人文历史和宗教”类,Yahoo将“音乐”放在“综合参考”下予以重复反映,这些做法明显欠妥。理想地,各个搜索引擎的类目划分应当大体相仿,使用户有章可循。
2.3 依据缺少提示
目前,用户在使用浏览性检索工具时,不能直接找到所需类名,必须逐级翻阅查找。有时为了找到一个类目,需要读取十多个页面,颇为费时费力。为了用户查找方便,应当提供一个分类法使用说明,以便用户参考、熟悉、研究之用,并能使其快速找到所需信息。此外,可以考虑使用一些技术手段,比如,当用户把鼠标放到某一类目上时。可自动显示其下级类目。
3 借鉴分面分类法改进网络信息组织
分面分类法在对传统信息组织的优化上曾起到了很大的作用,在网络环境下,借鉴分面分类法,可对网络信息组织进行优化。实际上,现行的搜索引擎中也包含分面分类法的思想,但粗糙和不规范。比如,在“sina”搜索引擎的关键词的查询反馈结果中,在同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,这种“分面”非但不够完整和准确,而且更多的是具有后台意义,用户根本无法在检索时组配使用,分面分类法没有得到充分体现。具体地讲,借鉴分面分类法改善网络信息组织可从以下几个方面入手:
3.1 复分表和仿分在网络分类体系中的运用
搜索引擎在编制自己的分类表时,可以借鉴传统文献分类法中的复分表、仿分技术。但是,网络环境下的复分和仿分与传统文献分类法不同,尤其是资源类型复分表中所列出的文献形式几乎完全不同于传统文献分类法中总论复分表中的文献形式。
3.1.1 通用复分表的运用
通用复分表可以作为整个分类表各级类目组配复分的依据,也可以用于规范分类体系展开的方式,使整个分类体系更具科学性和逻辑性。网络信息分类体系的通用复分表可以包括主题通用复分表、世界地区复分表、中国地区复分表、时代表(包括国际的和中国的)、资源类型表、人物复分表等。
网络信息的主题通用复分表规定了整个类目体系展开的次序,内容可以包括综合网站、热点问题、政策法规、机构(包括管理机构、事业机构与协会、事业单位、公司企业单位)、人物、理论、事业与管理、改革研究、教育培训等。
世界地区分类表对于网络信息是必要的,因为网络都是全球性的,其中充满了大量分散的有关各个地区的信息。世界地区复分表的详尽程度要视信息资源的空间分布的密度确定。时代复分表主要根据网站的服务功能和所收集的资源特点确定。收集历史文献的网络站点或历史类专业搜索引擎最好设一个时代复分表,而对综合性的网站和搜索引擎来说,也可不用时代复分表。
网络环境下所使用的资源类型复分表中的资源类型,除了包括传统文献分类法中的期刊、报纸、杂志等文献形式外,还包括BBS与论坛、会议与活动、个人主页、新闻组、Mailing List/LISTSERV等。
通用复分表及其主要内容如表1所示。
表1 通用复分表及其主要内容
附图
3.1.2 专类复分表的
在编制网络信息分类体系时,可在有关类目中编制专类复分表,作为某些类目组配细分的依据。例如,在“工业类”下的各工业部门,可以按照厂家、公司、研究机构、部属院校、杂志、名牌产品的统一顺序展开,编制成一个专类复分表,因为这几项是各工业部门都共有的(特别是在中国),可以采用统一的顺序。这就是专类复分表在网络信息分类中的运用,但是,它不需要像传统分类法中的专类复分表那样赋予统一的类号,而只需在各类中采用统一的形式。在信息加工的后台中,使信息处理人员更好地理解各类目的展开方式,更好地使用分类体系来加工整合信息资源。
3.1.3 仿分的运用
在传统分类法中,按照分类标准的规定,部分类目可以仿照已列出的类目进行细分,即类目仿分。由于网络信息分类体系以事物和主题为中心进行划分,从某种程度上说,它要求仿分更加迫切。比如,在“sohu”中,一级类目中有“国家与地区”条目,在其下的二级条目(各个国家与地区的名称)就按照一级类目的各类目进行仿分。又如,在“北京”这个二级条目下,就出现了跟一级类目一致的三级类目。在网络信息分类体系中,这种情况很多,比如,在“sohu”的“社会科学”的各社会科学类下基本上均按“学会”、“爱好者天地”、“大学系/学院”、“活动与会议”、“期刊杂志”、“研究所/中心”、“同人主页”列类。
3.2 分面叙词表的运用
一般地讲,编制分面叙词表都是针对某一学科专业领域的,这是因为不同学科专业领域的基本分面的划分是不同的,所以对于整个知识领域来说,建立一个统一的分面叙词表是非常困难的。因此,分面叙词表主要用于网上学术信息资源的组织,或者用于建立专业性搜索引擎。
网络信息分面叙词表有以下两个方面的作用:一是在信息标引的后台工作中,标引员利用分面叙词表对网页进行主题标引。一方面,有利于分面组配提高描述特定信息资源的能力,另一方面,用分面组配公式来标引网页可以实现标引的一致性,进而提高标引质量。二是在信息检索的前台工作中,可向用户提供其输入的检索词的同义词和相关词,可同时提供多个主题领域的检索词,以供用户进行自由组配 《网络信息组织对传统信息组织的借鉴》
本文链接地址:http://www.oyaya.net/fanwen/view/61878.html
【摘 要 题】信息资源建设
1 引言
信息组织是采用各种方法和手段使信息有序化的过程。它通过揭示信息间内在的逻辑关系,对信息进行加工、整理、提炼,使之系统化、浓缩化,从而达到便于信息传递和交流的目的。传统信息组织,主要是指对文献信息的组织,即使在采用计算机技术后,所处理的信息对象仍主要是文献信息,并进行人工著录、分类、标引,组织形式大多通过手工编制的目录、索引、文摘等。在网络环境下,信息资源多以数据库、信息库的形式存在,电子信息占主导地位,信息组织的对象逐渐多样化,范围也随之扩大,它不再停留在对文献特征的描述,而是深入到知识单元、信息单元。
从本质上讲,网络信息组织是对网络中的节点(服务器)中的各种格式的文件和数据库(或信息库)中的各个信息单元(如数据项)的组织。具体地讲,网络信息组织有两层含义,一是某一特定网络服务器(网站)的信息组织;二是对整个网络信息(网站集合)的组织。前者是网络局部(节点)的信息组织,后者是网络全局的信息组织。前者的工作主要由各节点的网站开发和维护人员来完成,后者由专门的信息服务公司,通过搜索引擎来完成。两者对图书情报部门的信息组织均有借鉴意义。本文主要以后者为研究对象,即整个网络的信息组织。
传统信息组织主要包括分类法、主题法、索引法、文摘法等。与传统分类法相比,网络信息组织在立类与列类、分类标识与分类对象的对应关系、分类标引过程、分类标引等方面存在明显的区别;与传统主题法相比,网络信息组织在搜索引擎对主题检索的支持以及元数据的产生和运用等方面存在很大区别;与传统索引法相比,在索引对象、索引类型、索引生成以及使用目的等方面存在许多不同;与传统文摘法比较,在编制方式、编制速度、编制质量以及与主题法的结合程度等方面也存在着差别。
比较和分析网络信息组织与传统信息组织有利于展现两者的优缺点,从而为网络信息组织继承和发展传统信息组织提供了借鉴,促进网络信息组织的进一步改进和完善。
本文以此为出发点,深刻认识这两种各有千秋的信息组织方法,提供理论和方法上的依据,并以此为切入点,从四个方面来论述网络信息组织方法与传统信息组织方法之间的相互借鉴关系,以使两者相得益彰、共同发展,从而在实际工作中利用相关成果改进现有工作,以满足现代信息用户的需求。
2 借鉴体系分类法完善信息资源分类体系
从体系分类法的角度看,网络信息资源分类体系确实存在着一些低级错误,改正这些错误将有利于网络信息资源分类的科学化和规范化,有利于提高查全率和查准率,尤其是提高查准率。
2.1 类目设置缺乏规律性和层次的不平衡性
在网络信息分类中,其类目设置往往同时采用多个标准,运用每个标准设类时缺少完整性,有时甚至在同一层次上列出不同等级的类目,致使同位类设置显得混乱,缺乏规律性,增加了用户通过浏览查找信息的难度。因而,需借鉴体系分类法的立类原则,一般采用同一标准,类目级别往往不能混淆。此外,有些网络信息的类目划分只有两三层,有些则多达十多层,类目层次显得不均衡,应当在现有基础上作适当调整,尽量使同位类下的层次保持均衡。
2.2 类目划分缺少一致性
不同搜索引擎的类目划分都有自己的体系,相互之间缺乏一致性。比如,Sohu将“留学与移民”放在“工商经济”类,“网易”在文学类下列出“人文历史和宗教”类,Yahoo将“音乐”放在“综合参考”下予以重复反映,这些做法明显欠妥。理想地,各个搜索引擎的类目划分应当大体相仿,使用户有章可循。
2.3 依据缺少提示
目前,用户在使用浏览性检索工具时,不能直接找到所需类名,必须逐级翻阅查找。有时为了找到一个类目,需要读取十多个页面,颇为费时费力。为了用户查找方便,应当提供一个分类法使用说明,以便用户参考、熟悉、研究之用,并能使其快速找到所需信息。此外,可以考虑使用一些技术手段,比如,当用户把鼠标放到某一类目上时。可自动显示其下级类目。
3 借鉴分面分类法改进网络信息组织
分面分类法在对传统信息组织的优化上曾起到了很大的作用,在网络环境下,借鉴分面分类法,可对网络信息组织进行优化。实际上,现行的搜索引擎中也包含分面分类法的思想,但粗糙和不规范。比如,在“sina”搜索引擎的关键词的查询反馈结果中,在同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,这种“分面”非但不够完整和准确,而且更多的是具有后台意义,用户根本无法在检索时组配使用,分面分类法没有得到充分体现。具体地讲,借鉴分面分类法改善网络信息组织可从以下几个方面入手:
3.1 复分表和仿分在网络分类体系中的运用
搜索引擎在编制自己的分类表时,可以借鉴传统文献分类法中的复分表、仿分技术。但是,网络环境下的复分和仿分与传统文献分类法不同,尤其是资源类型复分表中所列出的文献形式几乎完全不同于传统文献分类法中总论复分表中的文献形式。
3.1.1 通用复分表的运用
通用复分表可以作为整个分类表各级类目组配复分的依据,也可以用于规范分类体系展开的方式,使整个分类体系更具科学性和逻辑性。网络信息分类体系的通用复分表可以包括主题通用复分表、世界地区复分表、中国地区复分表、时代表(包括国际的和中国的)、资源类型表、人物复分表等。
网络信息的主题通用复分表规定了整个类目体系展开的次序,内容可以包括综合网站、热点问题、政策法规、机构(包括管理机构、事业机构与协会、事业单位、公司企业单位)、人物、理论、事业与管理、改革研究、教育培训等。
世界地区分类表对于网络信息是必要的,因为网络都是全球性的,其中充满了大量分散的有关各个地区的信息。世界地区复分表的详尽程度要视信息资源的空间分布的密度确定。时代复分表主要根据网站的服务功能和所收集的资源特点确定。收集历史文献的网络站点或历史类专业搜索引擎最好设一个时代复分表,而对综合性的网站和搜索引擎来说,也可不用时代复分表。
网络环境下所使用的资源类型复分表中的资源类型,除了包括传统文献分类法中的期刊、报纸、杂志等文献形式外,还包括BBS与论坛、会议与活动、个人主页、新闻组、Mailing List/LISTSERV等。
通用复分表及其主要内容如表1所示。
表1 通用复分表及其主要内容
附图
3.1.2 专类复分表的
运用
在编制网络信息分类体系时,可在有关类目中编制专类复分表,作为某些类目组配细分的依据。例如,在“工业类”下的各工业部门,可以按照厂家、公司、研究机构、部属院校、杂志、名牌产品的统一顺序展开,编制成一个专类复分表,因为这几项是各工业部门都共有的(特别是在中国),可以采用统一的顺序。这就是专类复分表在网络信息分类中的运用,但是,它不需要像传统分类法中的专类复分表那样赋予统一的类号,而只需在各类中采用统一的形式。在信息加工的后台中,使信息处理人员更好地理解各类目的展开方式,更好地使用分类体系来加工整合信息资源。
3.1.3 仿分的运用
在传统分类法中,按照分类标准的规定,部分类目可以仿照已列出的类目进行细分,即类目仿分。由于网络信息分类体系以事物和主题为中心进行划分,从某种程度上说,它要求仿分更加迫切。比如,在“sohu”中,一级类目中有“国家与地区”条目,在其下的二级条目(各个国家与地区的名称)就按照一级类目的各类目进行仿分。又如,在“北京”这个二级条目下,就出现了跟一级类目一致的三级类目。在网络信息分类体系中,这种情况很多,比如,在“sohu”的“社会科学”的各社会科学类下基本上均按“学会”、“爱好者天地”、“大学系/学院”、“活动与会议”、“期刊杂志”、“研究所/中心”、“同人主页”列类。
3.2 分面叙词表的运用
一般地讲,编制分面叙词表都是针对某一学科专业领域的,这是因为不同学科专业领域的基本分面的划分是不同的,所以对于整个知识领域来说,建立一个统一的分面叙词表是非常困难的。因此,分面叙词表主要用于网上学术信息资源的组织,或者用于建立专业性搜索引擎。
网络信息分面叙词表有以下两个方面的作用:一是在信息标引的后台工作中,标引员利用分面叙词表对网页进行主题标引。一方面,有利于分面组配提高描述特定信息资源的能力,另一方面,用分面组配公式来标引网页可以实现标引的一致性,进而提高标引质量。二是在信息检索的前台工作中,可向用户提供其输入的检索词的同义词和相关词,可同时提供多个主题领域的检索词,以供用户进行自由组配 《网络信息组织对传统信息组织的借鉴》