保存桌面快捷方式 - - 设为首页 - 手机版
凹丫丫旗下网站:四字成语大全 - 故事大全 - 范文大全
您现在的位置: 范文大全 >> 理工论文 >> 自动化论文 >> 正文

机器翻译中汉语动结式生成的过程和困难


构类型,李临定(1986,181-204页)曾归纳了五类句型:
  (1)N[,1]+V+C 妈妈急哭了
  (2)N[,1]+V+N[,2]+V+C 他走路走累了
  (3)N[,1]+V+C+N[,2] 我点亮了油灯
  (4)N[,1]+V+N[,2]+V+C+N[,3] 他拍桌子拍疼了手
  (5)N[,1]+把+N[,2]+V+C+N[,3] 火把他的衣服烧穿了几个洞
  前四类还各有四种可能的表层变换形式(“把”、“被”、“得”字句及其他)。到底应该选取哪一种生成我们的句子呢?这是如何在语义结构和句法结构之间寻找对应关系的问题,我们打算在第五部分就这个问题作进一步的讨论。
    3.6 处理表层词语
  选定了句子的表层结构和语序以后,剩下的事是用词汇手段表达某些句法或语义范畴。比如:时、体、否定、指代、有定、数量,等等。然后输出最后生成的结果。对于我们的例子就是:“他看懂了这篇文章”。句子里的“了”、“这”和“篇”是在这一步生成的。
  机器翻译生成汉语动结式时,在句子表层要处理的问题很多,每一个问题也都很复杂,比如时体成分、否定成分的语序等,需要作专门的研究。
    3.7 操作过程的控制
  需要说明的是,上面各个步骤的操作并不是无条件依次进行的。当在某一步无法得到确定的结论时,应该中止动结式的生成过程。
    4.动词和结果补语的组合关系
  动词和结果补语的组合应该是基于语义的。要想离开词表的限制,判断哪些动词和哪些形容词(或动词)可以组合成符合汉语习惯的动结式,就需要从语义上研究动补之间的组合类型和规则。显然,这件事情不是机器翻译力所能及的。在这里我们只能先从个例入手,看看单音节动词和单音节形容词作动词“学”的结果补语的情况,或许能够从中看到这个问题的困难所在。
  动词“学”的意思是“学习”或“模仿”。在《现代汉语语法信息词典》(注:由北京大学研制的用于信息处理的电子词典,其中有按义项收录的14479个动词,2856个形容词。通过检索每个词的属性,我们可以知道哪些动词可以带结果补语,哪些形容词、动词可以作结果补语。)(俞士汶,1998,以下称《语法信息词典》)中,列出了可以作结果补语的单音节形容词204个,(注:马真等(1997)列出了可以作结果补语的单音节形容词153个。)单音节动词112个。经过一一搭配测试,其中有54个形容词和30个动词能作“学”的结果补语。这样我们就从《语法信息词典》中一共得到了84个可能的动结式实例。然后按照《知网》(注:用于自然语言处理的知识系统,由董振东等研制。以从大量词语中提取出来的“义原”为基本描述单位,采用一种结构化的描述语言来描述概念与概念之间,以及概念的属性与属性之间的关系,包括上下位关系、同义关系、反义关系、对义关系、部件与整体关系、材料和成品关系、属性和宿主关系,以及属性值和属性的指向关系、时间和角色关系。互联网网址:http://www.keenage.com)(董振东等,2001)的定义为每一个实例的补语作语义类别标注,再作聚类分析,整理出“学”的结果补语的六个语义类别。其中A、E、F三类作补语的是形容词,B、C、D三类作补语的是动词,分别列在下面(括号里面是《知网》定义的义原)。
  A.人的客观属性(智能、举止、年龄、外貌、品性、经济状况)
  A1.[智能]学笨了 学昏了 学蒙了 学痴了 学蠢了 学土了 学呆了 学木了 学乖了 学傻了
  A2.[举止]学刁了 学歪了 学贼了 学油了 学浮了 学狠了 学犟了 学俗了 学倔了 学皮了 学酸了 学混了 学抠了
  A3.[年龄]学老了
  A4.[经济状况]学富了 学穷了
  A5.

[品性]学差了 学废了 学好了 学黑了 学坏了 学糟了
  A6.[外貌]学俏了
  B.人的主观感受(态度、感知)
  B1.[态度]学烦了 学够了 学惯了 学迷了 学恼了 学腻了 学怕了
  B2.[感知]学懂了 学乏了 学会了 学累了 学通了 学忘了
  C.人的状态和行为(状态、行动)
  C1.[状态]学病了 学成了 学疯了 学垮了 学亏了 学蔫了 学瘸了 学死了 学瘫了 学哑了 学晕了
  C2.[行动]学哭了 学跑了 学散了 学走了
  D.事物的状态(状态)
  学丢了 学没了
  E.事物的特性(特性)
  学反了 学活了 学偏了 学浅了 学深了 学杂了 学窄了 学足了
  F.事件的特性(特性)
  学遍了 学迟了 学重了 学错了 学对了 学多了 学久了 学滥了 学全了 学少了 学透了 学晚了 学早了
  可以看出,“学”和它的结果补语之间在概念意义的组合上遵循一定的规律。能否根据这些规律,用计算机可操作的方法,在一定范围内判断词表以外的动结式实例是否合法?比如,《语法信息词典》没有把“精”列入可作结果补语的形容词当中,但是“学精了”是个合法的动结式实例。计算机可以这样来确认它的合法性:根据《知网》,“精”的定义是[智能>灵](“>”的右部是左部的下位概念。下同),在A1类[智能>愚/讷/智/灵](“/”表示“或”的意思。下同。)的范围内。同样,与“精”定义相同的“鬼”、“灵”、“巧”,虽然也没有被《语法信息词典》指明可作结果补语,但计算机仍然能够判定“学鬼了”、“学灵了”和“学巧了”是合法的动结式实例。
  对于动补之间的语义组合,结果补语的概念意义是在动词概念意义的制约下起作用的。我们再来看与“学”有对义关系(Converse)的动词“教”。“学”和“教”都表示认知行为,前者是使自我认知,后者是使他人认知。因此有可能要求相似的结果补语。实际上,“学”的结果补语基本上都可以作“教”的结果补语

《机器翻译中汉语动结式生成的过程和困难(第4页)》
本文链接地址:http://www.oyaya.net/fanwen/view/140858.html

★温馨提示:你可以返回到 自动化论文 也可以利用本站页顶的站内搜索功能查找你想要的文章。