保存桌面快捷方式 - - 设为首页 - 手机版
凹丫丫旗下网站:四字成语大全 - 故事大全 - 范文大全
您现在的位置: 范文大全 >> 教学论文 >> 综合教育论文 >> 正文

基于因特网的个性化信息服务研究


的分析、获取和管理是保证个性化信息服务实施的基础。对用户需求的获取。目前主要有两大类方法:一类是通过人,机交互模式获取用户的信息需求。这类方法的优点是可以准确地获得用户的需求信息,也是目前绝大多数检索系统所采用的方法。缺点是主动性差。对于以信息拉取技术为核心的信息服务系统,系统一般提供一个与用户进行实时交互的检索界面,让用户表达需求。对于以信息推送技术为核心的信息服务系统,系统会提供给用户一个表达信息需求的定制表单。用户可以十分详细地填写自己的个性化需求信息。另一类是通过对用户访问记录的挖掘,获取用户的需求、兴趣和爱好等。这种方法的主动性强,一般用于个性化主动信息服分系统中,对用户需求行为的挖掘,目前有三种方法:一是通过Cookie  logs挖掘;二是通过Bookmark进行网络信息过滤;三是利用智能Agent跟踪用户信息行为。
    3.1 用户访问记录的挖掘
  网络用户访问记录的挖掘主要是从Web的访问记录中抽取具有意义的模式。Web中的每个服务器都保留了用户的访问日志(Web  access  log)等记录,保存了有关用户访问和交互的信息。分析这些数据可以用来了解用户的需求行为,为用户提供个性化的服务。目前Web使用记录挖掘技术和工具可以分为两大类:访问模式的追踪和个性化的使用记录的追踪。一般的访问模式追踪通过分析使用记录来了解用户的访问模式和倾向,以改进站点的组织结构;而个性化的使用记录追踪则倾向于分析个别用户的偏好,其目的是根据不同用户的访问模式,为用户提供个性化的定制服务[10]。
  用户访问挖掘针对用户对Web的访问记录,利用路径分析、分类聚类、关联规则和序列模式的发现等方法进行分析,寻找其中蕴涵的用户知识和模式。Web访问信息挖掘的数据对象主要是日志数据。当用户访问Web服务器时,服务器方将会产生三种类型的日志文件:Server  logs,Error  logs和Cookie  logs,记录用户的访问情况[11]。
  Cookie是由互联网服务器产生的记号并由客户端持有,用于识别用户和用户的会话。通过Cookie分析,获取用户个性化需求、兴趣和爱好,目前还是一种较为有效的方法。但由于Cookie存储在客户计算机上,使用中会由于各种原因导致Cookie内容失真,因而通过对Cookie的挖掘获取用户的个性化需求,也有一定的局限性。
    3.2 利用Bookmark(书签)获取用户的个性化需求
  当用户在因特网上用浏览器浏览主页时,经常会遇到自己需要的和喜欢的站点和主页,只要点一下浏览器的Bookmark菜单,就能将当前的站点存入Bookmark中。下次访问时,只要从Bookmark中取出即可使用。用户可以对Bookmark进行多级管理,不同的目录反映用户不同的兴趣,这给对用户需求的分析提供了依据。
  利用用户在浏览器上存储的Bookmark获得用户信息需求是一种有效的方法。在Bookmark中存储的信息往往是用户最关心的,需要记录下来以便以后再读。Bookmark结构化的信息存储更能够确切地表达用户需求。我们可以利用用户对文章的评价来表达用户的信息需求。对存入Bookmark的某一推荐目录的文章,可以认为是用户喜欢的文章,作为学习中的正例;在其他目录的文章,或是经过推荐没有被选中的文章将作为学习的反例。根据向量空间法将正反例表示成向量,就可以利用机器学习的方法对新文章进行推荐[12]。
  利用Bookmark进行信息过滤有很多优势。用户可以导入自己已有的Bookmark文件或直接在浏览网络时通过客户端软件加入的新书签,并且可以对其进行各种编辑操作。用户可以明确地对文章的内容与自己的需求是否一致作出评价,通过反馈信息将使信息推荐更为准确。用户可以灵活地设置推荐的范围,系统对用户信息的推荐信息直接并入Bookmark结构中,完全符合用户的习惯。另外,系统使浏览器的Bookmark功能实现网络化,即利用网络服务器存储用户的Bookmark信息,这样,可以使用户在任何地方、各种平台上拥有一致的Bookmark信息。
    3.3 利用智能Agent获取用户个性化需求
  监视用户的信息查询过程的方法能自动获得用户的信息需求。其方法是在用户的终端上运行一个监视的信息代理(agent)。信息代理将用户在web浏览时的相关信息不断传送给远端的服务器.服务器将信息进行整理、组织,并从中分析出用户的信息偏好。
      4 个性化信息服务模型的构建
  要实现个性化信息服务,系统必须具备两方面的能力:一是构建个

性化信息Agent模型,即将个性化信息从全局信息空间中分离出来;二是构建用户Agent模型,即跟踪用户行为,学习、记忆用户兴趣,通过描述用户的兴趣特征来建立个性化用户模型。此外,还需要有功能强大的网络信息搜索能力和友好的用户界面,这既是构建信息Agent和用户Agent的基础,也是实现个性化信息服务的保障。
    4.1 个性化信息模型的构建方法
  信息Agent具有多种特性,从不同的特性角度出发,可以用不同的方法来构建个性化信息模型。这里主要介绍三种常用的方法[13]。
  (1)信息Agent的自主学习方法。个性化服务的对象是一个个具体的用户,因而建立个性化信息模型时,信息Agent必须对用户感兴趣的信息类型有所了解,并以此作为信息模型构建的基准,通过不断的学习积累形成一个有规模的模型。信息Agem可以直接探求用户的信息兴趣和爱好,也可以从用户信息检索和利用行为中提取这个基准,然后由Agent执行一定的算法,将这些信息转化为知识存入用户信息模型中。信息Agent有两种不同的学习方法:一是关键词学习。这种学习方法是首先对搜索来的信息进行处理,将信息中的关键词按出现频率、出现位置提取出来,根据关键词的频率来确定唯一表征信息体的关键词,将具有相同表征关键词的信息聚类,并存入相应的个性化信息模型中。采用关键词学习方法提高了建立多个个性化信息模型的效率。二是字典学习。这是一种对相似概念的学习。在这种学习方法中,信息Agent为个性化信息模型提供的每个基准关键词创建一个字典,字典根据关键词的权值来确定其权限:搜索权和学习权。一个信息单元是否被学习首先得看其关键词的权值是否达到搜索权所规定的权值,否则首轮即被模型所淘汰。即使是过了搜索关,也只有当关键字的权值达到学习权时,该关键字才能被纳入字典用来表征个性化信息模型。信息Agent通过不断的学习,并在学习中修改字典,最终可得到一个关键字的相对稳定的字典。
  (2)信息过滤的方法,信息过滤系统是根据用户的信息需求对动态信息流进行过滤,把满足用户需求的信息传送给用户,可以提高获取信息的效率。信息过滤也是构建个性化信息模型的有效方法,它根据一定的标准将那些不相关的信息滤掉,仅保存与用户需求相关的信息。信息Agent根据自己的关键词域,提取几个权重比较大的关键词作为过滤的标准(E-profile),每个E-profile描述着一个方面的信息需求。E-profile是否标准.可在实践中被检验:那些对信息需求描述不准确的E-profile个体在竞争中将被淘汰。反之则形成越来越大的规模,构成一个内容充实的个性化信息模型。常用的信息过滤方法有两种:基于关键词向量的过滤方法和基于文献集的信息过滤方法。基于关键词向量的信息过滤方法是一种相似过滤方法。其思想是比较表征信息单元的关键词与信息Agent给出标准关键词之间的相似性,只有当相似性达到一定的度,该信息单元才被保留下来。确立关键词的相似度是这种过滤方法的核心。在此我们将信息单元的关键词与标准关键词都看作向量,其相似度就是这两个向量夹角的余弦值。
  (3)基于多Multi-Agent  System的合作方法。网络个性化服务不是面向单一用户的个性化服务,服务于每个用户的信息Agent之间并不是孤立的关系,它们通过相互合作构成一个MAS。MAS的合作求解能力远远超过单个Agent,这是MAS产生的最直接的原因。通过MAS的合作,使每个用户拥有一个或多个Agent,这些Agent推荐的信息在内容上都有相关性,克服了单个信息Agent功能不强的缺陷。多Agent之间的合作是通过多Agent协商协议来完成的。协商协议是MAS实现协同、协作、冲突消解和矛盾处理的关键环节。在MAS中,协商协议被描述成四元组:{目标Agent,源Agent,消息名,消息内容},这种四元组形式通过嵌套使用来扩大合作的范围。信息Agent之间一旦达成合作协议,多个信息Agent的个性化信息模型就构成一个逻辑体,每个信息Agent就将自己和伙伴Agent的信息文档推荐给相关用户,以充实用户信息需求的内容。
    4.2 用户模型的构建方法
  建立用户模型是实现个性化服务的另一个重要方面。用户模型是实现个性化服务的起点,用户模型不仅是个性化信息模型的构建依据,又是实现个性化服务的目标,个性化信息最终将被推向具有相应兴趣的用户。用户模型实际上就是对某一用户行为、兴趣倾向的描述,以确立他所需信息服务的类型。
  在对用户的信息服务中,用户所处的领域不同,使用的信息服务系统不同,获取用户信息的方法不同,建模的方法也不同。通常情况下,通过与用户交

基于因特网的个性化信息服务研究(第2页)
本文链接地址:http://www.oyaya.net/fanwen/view/61801.html

★温馨提示:你可以返回到 综合教育论文 也可以利用本站页顶的站内搜索功能查找你想要的文章。