保存桌面快捷方式 - - 设为首页 - 手机版
凹丫丫旗下网站:四字成语大全 - 故事大全 - 范文大全
您现在的位置: 范文大全 >> 理工论文 >> 计算机信息技术 >> 正文

数据 信息与知识


information)方法的研究,促使DM(KDD)技术向更深层次发展。

另外需要说明的,上面所说的DM中的数据是指数据库中表格形式中的记录和条目,这种数据称作结构型数据(Structured data)。在一个企业中,还有一类像文本和网页形式的数据,称作非结构型数据(unstructured data)。它来自不同的信息源,如文本 图像 影视和音响等,当然文本是最主要的一种非结构数据.对一个企事业单位来说,非结构型数据往往占数据总量的80%,而结构型数据只占20%。1995年分析家已预言,像文本这样非结构型数据将是在线存贮方面占支配地位的数据形式。到1998年初,在Internet上的信息网页数,已超过5亿,到2000年,预计网页数将达到15亿。随着Internet的扩展和大量在线文本的出现,将标志这巨大的非结构型数据海洋中,蕴藏着极其丰富的有用信息即知识。人们从书本中获取知识方法是阅读和理解。开发一种工具能不需要阅读而能协助用户从非结构数据中抽取关键概念以及快速而有效地检索到关心的信息,这将是一个非常引人入胜的研究领域。目前,基于图书 索引 检索以及超文本技术的各类搜索引擎,能协助用户寻找所需信息,但要深入发掘这类数据中的有用用信息,尚需要更高层次的技术支持,人工智能领域有关知识表示及获取的方法(如语义网络 概念映射等),和自然语言理解的研究成果,可望被采用。还可能要涉及到语言学 心理学等领域。最近已出现针对文本的DM工具的报导。如IBM公司的TexMiner,NetQuestion,WedCawler和megaputer公司的TextAnalyst等。

DM(KDD)工具和软件已在各个部门得到很好的应用,并收到明显的效益。[1]在对客户进行分析方面:银行信用卡和保险行业,用DM将市场分成有意义的群组和部门,从而协助市场经理和业务执行人员更好地集中于有促进作用的活动和设计新的市场运动。[2]在客户关系管理方面:DM能找出产

品使用模式或协助了解客户行为,从而可以改进通道管理(如银行分支和ATM等)。又如正确时间销

售(Right Time MarKeting)就是基于顾客生活周期模型来实施的。[3]在零售业方面:DM用于顾客购货篮的分析可以协助货架布置,促销活动时间,促销商品组合以及了解滞销和畅销商品状况等商业活动。[4]通过对一种厂家商品在各连锁店的市场共享分析,客户统计以及历史状况的分析,可以确定销售和广告业务的有效性。[5]在产品质量保证方面:DM协助管理大数量变量之间的相互作用,DM能自动发现出某些不正常的数据分布,暴露制造和装配操作过程中变化情况和各种因素,从而协助质量工程师很快地注意到问题发生范围和采取改正措施。[6]在远程通讯部门:基于DM的分析协助组织策略变更以适应外部世界的变化,确定市场变化模式以指导销售计划.在网络容量利用方面,DM能提供对客户组类服务使用的结构和模式的了解,从而指导容量计划人员对网络设施作出最佳投资决策。[7]在各个企事业部门,DM在假伪检测 及险评估 失误回避 资源分配 市场销售预测广告投资等很多方面,起着很重要作用。例如在化学及制药行业,将DM用于巨量生物信息可以发现新的有用化学成分.在遥感领域针对每天从卫星上及其它方面来的巨额数据,对气象预报,臭氧层监测等能起很大作用。总之,在国外,DM已广泛应用于银行金融,零售与批发 制造 保险 公共设施 政府 教育 远程通讯 软件开发 运输等各个企事业单位。据报导,DM的投资回报率有达400%甚至10倍的事例。

 

四 DM(KDD)产品状况

九十年代开始出现DM商用产品以来,据不完全统计,到1998年底1999年初,已达50多个厂商从事DM的开发工作,在美国DM产品市场在1994年约为5千万美元,1997年达到3亿美元。预计2000年将达到8亿美元。从产品的类型来分有下列产品:[1]提供广泛的DM能力,典型产品有IBM的Intelligent Miner,SAS的Enterprise Miner.[2]为某个部门旨在求解问题,典型的有Unica公司的Response Modeler Segnentor,IBM公司的Busiess Application等。[3]与提供服务一起,典型的有NeoVista,Hyperparallel,HNC Marksman.[4]黑匣工具,典型的有GroupModell,ModelMax,NewralWare的Predict.[5]解决客户问题有Marketier Paregram,Exchemge Application等。

据不完全统计,目前出现的DM工具和软件,可以按采用技术分类如下表:

采用技术 分 类 《数据 信息与知识(第4页)》
本文链接地址:http://www.oyaya.net/fanwen/view/140154.html

★温馨提示:你可以返回到 计算机信息技术 也可以利用本站页顶的站内搜索功能查找你想要的文章。