保存桌面快捷方式 - - 设为首页 - 手机版
凹丫丫旗下网站:四字成语大全 - 故事大全 - 范文大全
您现在的位置: 范文大全 >> 文史论文 >> 文字学论文 >> 正文

潜伏语义分析的理论及其应用


io  2000)。
  第三、文本相似性研究。在语篇理解方面,Foltz,Kintsch和Landauer(1993)等人用LSA来自动化处理语篇连贯(以心脏科学文献为试验样本),把一个句子或片段和接着的句子或片段的连贯性来分析比较,其相关系数高达.90。在他们所建立的网站http://LSA.colorado.edu上面提供了一些已经根据心理学、百科全书、文学成语、心脏科学的语料库给读者进行网上比较文本相似性研究。例如我们随机从一本认知心理学教科书里找了两段在词语上没有多大联系的话:
  "These  findings  indicate  a  considerable  degree  of  functional  equivalence  of 
 perception  
and  imagery.However,it  is  possible  that  subjects  in  the  imagery  condition  merely  
made
  plausible  guesses  about  the  fields  of  resolution,and  did  not  actually  rely  on  
imagery  
at  a11."
  "While  it  is  very  straightforward  to  see  that  previous  learning  can  facilitate  
problem
  solving  by  supplying  well-practiced  skills  and  strategies,it  is  perhaps  less  obvious  that  knowledge  acquired  
in  the  past  can  sometimes  disrupt,and  interfere  with,subsequent  attempts  to  solve 
 problems."
  这两段话在用词方面没有太多相同之处,但是和心理学语料库的维数比较以后,它们的相关是.82。
  第四、使用LSA来进

行写作质量评估。Landauer,Laham和Foltz(1998)试验使用5种不同的方法来应用LSA对作文题目的答案进行评分,如让评分员对一些作文样本进行评分,然后计算出评了分的作文和未评分的作文的余弦,再根据相似性权重把最相似的作文分数的平均分赋予未评分的作文,等等。这5种方法所评出的分数的相关程度接近于它们和专家评分的相关程度。在另一项研究中,他们还用这方法来评估8个考试,题目从心脏解剖和生理学到心理学概念,美国历史,当前社会问题和市场问题。通过元分析发现LSA和专业评分员(来自教育考试服务公司或其他专业机构或课程导师)的相关高于专业评分员之间的相关。LSA评分的可靠性说明一个篇章的全面的语义表征主要决定于词的选择,而对句法使用则要求不高。
  第五、使用LSA来模拟心理语言学试验。语义启动是一种常用的试验,Landauer用LSA方法来模拟Till等人(1988)的判断多义词的试验,结果完全一致。这些结果显示在语篇理解中,忽略了词序、句子结构、非线性的词与词的相互作用的词义关系也能够预测人类的行为。Kintsch等人(1999)还通过LSA所获得的信息提出长时工作记忆(Long-term  Working  Memory,LTWM)的理论。他认为人类的记忆系统包括了感知特征、语言特征、命题结构、宏结构、语境模型、控制结构、目标、词汇知识、框架、一般知识、情节记忆等等成分。它们对理解语篇至为重要,远远超过短时记忆。LTWM认为在某些条件下工作记忆可以大大延伸,LSA在某种程度模拟了这种机制,实际上也模拟了人类的知识系统。大部分人类知识都体现为语言,而LSA通过减少维数来筛选它所处理的信息,从而保留了它所处理的文本的主要语义关系。例如在LSA处理的文件中,mountain和mountains的相关系数可能很低,但是通过减少维数后,它们的相关却是.81。它的推断是这两个词在语义上有密切联系。同样地,围绕mountain还可以找到peaks,rugged,ridges和climber,而围绕mountains又可以找到peaks,rugged,plateaus和foothills。我们所需要的正是这些信息,以认识人们在理解过程中是怎样通过LTWM来激活知识的。又如"The  band  played  a  waltz."(乐队奏了一曲华尔兹)和"Mary  loved  to  dance."  (玛丽喜欢跳舞)这两句话虽然无甚直接联系,但它们都分别激活了一些第三方的互有联系的语词,故其余弦为.45。
  第六、在LSA的基础上,Kintsch等(2000)及Steinhart(2001)又开发了训练学生写作的软件。这个软件是一个在线的辅导学生写摘要的软件,叫做Summary  Street。Steinhart认为,写摘要是一种比较难的技能,低年级学生(如初中生)往往依靠“抄和减”的策略来写摘要,而高年级的学生(如高中生)则使用较复杂的压缩规则,如重建和归纳。写摘要训练不仅仅是一种写作技巧的训练,它可以提高学生的阅读理解、获取知识和思维能力。这个软件首先让学生看一些文章如能源科学、古代文明、血液循环系统等,然后提出写摘要的一些要求,如找出主题句、找出支持主题句的两三个重要思想和细节,把它们组成一句话,用一个概括性的词语来代替具体的项目和事件,避免烦琐的信息和细节,避免重复信息等等。学生根据这些要求把阅读的文章写成摘要,在网上输入到Summary  Street系统里,系统就能分析摘要,告诉学生摘要在多大程度上反映原文,长度是否合乎要求,等等。学生可以通过系统提供的反馈信息(包括指出拼写错误和用词不当,信息覆盖面是否足够等),不断改写摘要。他在Boulder县中学试验的结果说明,运用Summ

《潜伏语义分析的理论及其应用(第4页)》
本文链接地址:http://www.oyaya.net/fanwen/view/206405.html

★温馨提示:你可以返回到 文字学论文 也可以利用本站页顶的站内搜索功能查找你想要的文章。