链接分析法——情报学研究新方法
内容提要】本文认为链接分析法是网络信息计量学的重要研究方法,是情报学研究的新领域。它完善了情报学方法论体系,丰富了情报学理论,是情报学逐渐成熟的一个重要标志。文章简单介绍了网络信息计量学,并对链接分析法进行了分析。
【摘 要 题】理论纵横
【关 键 词】链接分析法/网络信息计量学/情报学/方法论……
【 正 文】
20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics or Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。
1 网络信息计量学
网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。
2 链接分析法研究现状
2.1 链接分析法的内容
链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。
2.1.1 链接分析法在网络信息组织方面的作用
网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。
2.1.2 链接分析法在网络信息检索方面的作用
链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。
2.1.3 链接分析法在网络信息资源评价方面的作用
传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大
2.2 链接分析法对情报学研究方法的意义
苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。
链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。
2.3 链接分析法目前存在的问题
在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(Information Overload)和信息污染(Information Pollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Interne 《链接分析法——情报学研究新方法》
本文链接地址:http://www.oyaya.net/fanwen/view/61219.html
【摘 要 题】理论纵横
【关 键 词】链接分析法/网络信息计量学/情报学/方法论……
【 正 文】
20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics or Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。
1 网络信息计量学
网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。
2 链接分析法研究现状
2.1 链接分析法的内容
链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。
2.1.1 链接分析法在网络信息组织方面的作用
网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。
2.1.2 链接分析法在网络信息检索方面的作用
链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。
2.1.3 链接分析法在网络信息资源评价方面的作用
传统的引文分析法在学术方面衡量学术期刊重要性的指标之一是“影响因子”(IF),哪家期刊和论文被引用次数多,影响因子就高,谁就被认为是权威,论文也就是优秀论文。在互联网上IF对应于统计指向某一网页的链接数目后对该网页作出的排序,网站引用分析对应的是某个站点网页被其它站点引用的情况的统计分析,也就是网页可能被其它网站搜索提问命中的结果数的多少,采用计分法和线性代数方法对中心网页和权威网页分数进行迭代求和,以确定权威网页和中心网页。这与百度搜索引擎的创始人李彦宏1996年提出的搜索引擎的第二定律:“人气质量定律”相一致。根据这一定律,用链接分析法进行统计网站被链接和访问次数,可以作为评价网站和网络信息资源质量的一个指标。再加上相应的链接文字分析,就可以用在搜索结果的排序上了,对搜索结果进行的按相关性排序,不完全依赖于词频统计,而是更多地依赖于超链分析。在Internet上链接关系反映的是网页在全世界范围内、同一学科类属的影响力,评价范围是很广的、甚至全球性的。目前主要利用搜索引擎工具在网络上检索网站和网页的链接情况,并按相关性对检索结果进行排序,大
大方便了用户在浩翰的信息海洋中迅速准确地获得有用的信息,易于操作、实用且可以节省用户的时间,在一定程度上可以弥补同行评议等定性方法的缺陷。
2.2 链接分析法对情报学研究方法的意义
苏联科学家巴甫洛夫说过:“科学是随着研究方法所取得的成就向前的。研究方法每前进一步,随之我们面前也就开拓了一个充满种种新鲜事物的更辽阔的远景。”情报学是一门新兴的综合性边缘学科,是一个开放的综合性知识体系,它善于吸收其它相关学科的知识和研究方法。上世纪60年代后,随着科学的日益发展,科学研究中应用研究、实用研究和开发研究比重逐渐增大,情报学研究方法体系取得了长足进步,表现在:一是情报研究的领域、对象、内容等的扩大和深化;二是现代科学学科与方法的创立和发展。情报学研究方法体系是动态的、发展的。情报学科要想在原有的基础上实现学科研究模式的更新、学科结构的变革和学科体系的拓展,就必须研究和采用新的思维方式和新的研究方法,及时反映最新的学科学术动态和最新的理论学说,移植、借鉴其它学科的研究方法,如哲学方法、数学方法、社会学方法、经济学方法、信息技术方法等来丰富自己的研究方法,并加以创造和大胆创新,不仅引起自身学科结构的变革和深化学科前沿的研究,而且不断发展新的分支学科,促使学科研究充满时代气息。
链接分析法大大拓展了信息计量学在网络环境下的应用,充实了网络信息计量学的内容,是情报学研究的新领域,完善了情报学方法论体系。它是情报学逐渐成熟的一个重要历程碑,标志着情报学理论方法的一个新的飞跃。
2.3 链接分析法目前存在的问题
在文献计量学中,传统的引文分析法只要统计参考文献数据就可完成引文分析的任务,但是在互联网上,链接分析法的研究对象是网络信息资源,网络信息资源覆盖范围广、动态性强,具的信息量巨大、不确定性、缺乏合理组织、难以预测等特点,且信息过载(Information Overload)和信息污染(Information Pollution)现象严重;引用与被引用关系也变得十分复杂;链接分析法的适用范围也是有限的;Interne 《链接分析法——情报学研究新方法》