潜伏语义分析的理论及其应用
ary Street训练学生所写出的摘要比使用传统的文字处理器写出的摘要要好,特别是处理难度比较大的文章更是如此。
5.启发和问题
LSA直逼哲学上的认识论问题,却又开拓了广阔的应用前景,惹人深思。一是人们认识世界从意义开始,语篇里隐含着许多错综复杂的语义关系,是了解语义的钥匙。二是现代科学技术为建立、储存和提取包括了大量语篇的语料库创造了条件,也为人们认识这些错综复杂的语义关系创造了条件,使我们有可能解决许多与文本有关的问题。三是认识问题的一个有效途径是减少维数,提高概括力。和维数匹配的归纳可以大大改善知识的提取和表征。四是LSA要解决的语篇中的语义关系,它既依赖于计算机技术,又利用了奇异值分解的线性代数模型,充分体现了文理互相渗透的特点。
但是LSA也留下了一些有待我们继续探索的问题。最主要的是它只考虑语词,而不考虑句法信息,甚至不考虑词序的信息。而且它完全依赖于数学模型,所得到的结果有时不好解释。
【参考文献】
1 Berry,M.,S.Dumais,& G.O'Brien[M].1994.Using linear algebra for Intelligent Information Retrieval [M].Boston:
Houghton
Mifflin Company.
2 Carroll,J.,et al.1971.Word Frequency Book.Houghton Mifflin Company & American
Heritage
Publishing Co.,Inc.
3 Chomsky,N.1965.Aspects of the Theory of Syntax [M].Cambridge,MA:
MIT Press.
4 Chomsky,N.1986.Knowledge of language:Its nature,origin,and use [M].
Westport:
Greenwood
Publishing  
5 Chomsky,N.2000.New horizons in the study of language and mind[M].Cambridge:Cambridge University Press.
6 Deerwester,S,S.Dumais,G.Fumas,T.Landuauer,& R.Harshman.1990.Indexing by latent
semantic analysis [J]
.Journal of the American Society for Information Science 41:391-407.
7 Dumais,S.et al.1982.Using semantic analysis to improve access to textual
information [J].Machine Studies 17:87-107.
8 Foltz,P.W.,W.Kintsch & T.K.Landauer.1993 (Jan). An analysis of textual coherence
using Latent Semantic Indexing [A].Paper presented at the meeting of the Society
for Text and Discourse,Jackson,WY.
9 Geoffrey sampson.2001.Empirical Linguistics [M].London:Continuum.
10 Graesser,A.1981.Prose Comprehension beyond the word [M].New York:Springer.
11 Kintsch,W.,D.Steinhart,G.Stahl & LSA Research Group.2000. Developing summarization
skills through the use of LSA-Based Feedback [J].Interactive learning environments 8 (2):87-109.
12 Kintsch,W.1988.The role of knowledge in discourse comprehension:A construction-integration model &n 《潜伏语义分析的理论及其应用(第5页)》
本文链接地址:http://www.oyaya.net/fanwen/view/206405.html
5.启发和问题
LSA直逼哲学上的认识论问题,却又开拓了广阔的应用前景,惹人深思。一是人们认识世界从意义开始,语篇里隐含着许多错综复杂的语义关系,是了解语义的钥匙。二是现代科学技术为建立、储存和提取包括了大量语篇的语料库创造了条件,也为人们认识这些错综复杂的语义关系创造了条件,使我们有可能解决许多与文本有关的问题。三是认识问题的一个有效途径是减少维数,提高概括力。和维数匹配的归纳可以大大改善知识的提取和表征。四是LSA要解决的语篇中的语义关系,它既依赖于计算机技术,又利用了奇异值分解的线性代数模型,充分体现了文理互相渗透的特点。
但是LSA也留下了一些有待我们继续探索的问题。最主要的是它只考虑语词,而不考虑句法信息,甚至不考虑词序的信息。而且它完全依赖于数学模型,所得到的结果有时不好解释。
【参考文献】
1 Berry,M.,S.Dumais,& G.O'Brien[M].1994.Using linear algebra for Intelligent Information Retrieval [M].Boston:
Houghton
Mifflin Company.
2 Carroll,J.,et al.1971.Word Frequency Book.Houghton Mifflin Company & American
Heritage
Publishing Co.,Inc.
3 Chomsky,N.1965.Aspects of the Theory of Syntax [M].Cambridge,MA:
MIT Press.
4 Chomsky,N.1986.Knowledge of language:Its nature,origin,and use [M].
Westport:
Greenwood
Publishing  
;Group.
5 Chomsky,N.2000.New horizons in the study of language and mind[M].Cambridge:Cambridge University Press.
6 Deerwester,S,S.Dumais,G.Fumas,T.Landuauer,& R.Harshman.1990.Indexing by latent
semantic analysis [J]
.Journal of the American Society for Information Science 41:391-407.
7 Dumais,S.et al.1982.Using semantic analysis to improve access to textual
information [J].Machine Studies 17:87-107.
8 Foltz,P.W.,W.Kintsch & T.K.Landauer.1993 (Jan). An analysis of textual coherence
using Latent Semantic Indexing [A].Paper presented at the meeting of the Society
for Text and Discourse,Jackson,WY.
9 Geoffrey sampson.2001.Empirical Linguistics [M].London:Continuum.
10 Graesser,A.1981.Prose Comprehension beyond the word [M].New York:Springer.
11 Kintsch,W.,D.Steinhart,G.Stahl & LSA Research Group.2000. Developing summarization
skills through the use of LSA-Based Feedback [J].Interactive learning environments 8 (2):87-109.
12 Kintsch,W.1988.The role of knowledge in discourse comprehension:A construction-integration model &n 《潜伏语义分析的理论及其应用(第5页)》