机器翻译中汉语动结式生成的过程和困难
。(注:尽管各自的语义指向可能不同,比如:“学笨了”和“教笨了”。这与动词的配价结构有关。在机器翻译生成动结式的过程中,由“整合语义结构”这一步处理。)它们或者表示认知行为对其主体(“学”的施事、“教”的与事)产生的效果:改变主体的客观属性(智能、举止、年龄、外貌、品性、经济状况)、主观感受(态度、感知)、状态和行为;或者表示认知行为对其涉及的事物产生的效果:改变涉及对象的状态、性质(长短、宽窄、深浅、多少、正反、美丑);或者表示认知行为本身的特性(度量、频率、程度)。不同的“动作—结果”关系产生了不同的动补组合关系,要把它们研究清楚,整理成规则,是一件非常复杂的事情。
即使有了基于词语概念意义的规则,也还不能完全解决问题。在《知网》中,与“懂”有相同定义的单音节动词还有“认”、“审”、“识”、“通”、“悉”、“晓”、“知”。除了“通”以外,其余的都不能作“学”的结果补语。与“精”定义相同的双音节形容词“聪明”、“机灵”、“伶俐”、“乖巧”可以作“学”的结果补语,而同样定义的“聪颖”、“聪慧”却不行。这说明影响动词和结果补语组合关系的因素不仅仅是词语的概念意义。那么,到底还有哪些因素可以作为判断动结式合法与否的条件?如何把这些条件变成计算机可以操作的规则?我们现在还不得而知。
5.从语义结构到句法表现形式
在动结式的整个生成过程中,选择什么样的句法手段来表现其语义结构是比较复杂的一步。人们常说,汉语句法结构和语义结构之间的联系比较松散,或者说句法成分和语义成分的配位很灵活,一种结构形式经常表示多种意义,一种语义内容也可以用多种结构形式来表示。这就给机器翻译的汉语生成带来很大的困难。对于动结式表层句法结构的选择,我们目前能用到的条件非常有限,所以能生成的句型也很有限。
5.1 使生成目标受限
通过整合语义结构我们得到了动结式的配价结构,价语的数量可以帮助我们选择句型。如果动结式是一价的,选择有一个体词性成分出现的句型;是二价的,选择包含两个体词性成分的句型。至于在同属一类句型的多个表层结构形式中间应该选择哪一个,还需要更细致的条件和规则。下面讨论如何把动结式组成成分之间的语义关系作为选择的条件。
为了简化讨论的过程,我们在这里只考虑二价动结式的情况(略去“妈妈急哭了”、“他看书看花了眼”、“他扔进屋一块石头”等)。这样,讨论的范围就限制在只含有两个体词性成分的表层结构形式里面。吕叔湘(1986)曾经按照补语跟主语或宾语的语义关系,把动结式述补结构分成15类(略去“得”字句等),其中有两个体词性论元成分出现的共9类(包括用“把”和“被的句子),分属以下三种语义关系格式,其中S是V的主体格。(注:在本节讨论的范围内,主体格包括施事、当事;客体格包括受事、内容。)
附图
综合上述各种情况可以看出,二价动结式的六种语义结构可以用以下五种表层结构形式来表达。下面的讨论将在这个范围以内进行:
表层结构1:S+V+C+O
表层结构2:S+“把”+O+V+C
表层结构3:O+“把”+S+V+C
表层结构4:O+“被”+S+V+C
表层结构5:S+“被”+O+V+C
我们注意到,同时与二价动结式的六种语义结构有对应关系的只有表层结构1(S+V+C+O),所以可以把它当作生成动结式表层的首选。可是进一步观察就会发现,在用表层结构1表达某些语义结构时会受到限制。譬如语义结构Ⅱ,我们可以说“大家吃腻了剩菜”,却不能说“我丢怕了钱包”,也不能说“他看傻了那幅画”。能说与不能说应该有条件来控制,O和C之间的语义关系可能是一个控制条件,但是目前还没有确切的规则可用。
在这种情况下,只好先避开表层结构1,选择2和3。经过初步实验我们看到,就表达命题意义来说,用表层结构3表达语义结构Ⅱ,用表层结构2表达语义结构Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。这样,讨论的范围又缩小到了两种表层结构形式。问题就变成了:如何找到用这两种句法形式表达六种语义关系格式的控制条件。我们把这种逐步缩小问题范围的做法叫作使生成目标受限,实际上这是对复杂问题的一种妥协。也就是对二价动结式,放弃生成所有的表层句式,寻找尽可能简单和有效的控制条件,先用部分表层结构形式表达其多种语义格式。
5.2 生成表层结构的控制条件
从语义结构生成表层结构的主要控制条件是动结式组成成分之间的语义关系。
对于二价动结式的组成成分S、O、V、C,如果S是V的主体格,而且:
(一)如果S、O、V、C相互之间满足下列五个条件之一,则可以用表层结构2表达:
1.(O是V的客体格)且(O是C的主体格)且(C是一价的)
2.(S是C的主体格)且(O是V的客体格)且(O是C的客体格)
3.(O是C的主体格)且(V和C都是一价的)
4.(S是C的主体格)且(O是C的客体格)且(V是一价的)
5.(O是V的客体格)且(C是V的修饰成分)
6.(O是V的客体格)且(S是C的主体格)且(C是一价的)
表层结构2和3都是“把”字句。关于“把”字句,很多学者从各种角度作过研究。张伯江(2000)曾根据句式语法的观点指出,除了组成成分的作用以外,“把”字句的整体意义当中还有句式意义的作用。因此,生成的时候还应当考虑上述控制条件能否符合“把”字句句式意义的要求。我们注意到,动结式与“把”字句似乎有一种自然的联系。“把”字句中V的“处置”意义、C是“把”后面宾语产生的变化等句式意义与动结式的句式意义基本相似。(注:在动结式的表层结构2中,宾语是O;在表层结构3中,宾语是S。)另外,为了体现“把”字 《机器翻译中汉语动结式生成的过程和困难(第5页)》
本文链接地址:http://www.oyaya.net/fanwen/view/140858.html
即使有了基于词语概念意义的规则,也还不能完全解决问题。在《知网》中,与“懂”有相同定义的单音节动词还有“认”、“审”、“识”、“通”、“悉”、“晓”、“知”。除了“通”以外,其余的都不能作“学”的结果补语。与“精”定义相同的双音节形容词“聪明”、“机灵”、“伶俐”、“乖巧”可以作“学”的结果补语,而同样定义的“聪颖”、“聪慧”却不行。这说明影响动词和结果补语组合关系的因素不仅仅是词语的概念意义。那么,到底还有哪些因素可以作为判断动结式合法与否的条件?如何把这些条件变成计算机可以操作的规则?我们现在还不得而知。
5.从语义结构到句法表现形式
在动结式的整个生成过程中,选择什么样的句法手段来表现其语义结构是比较复杂的一步。人们常说,汉语句法结构和语义结构之间的联系比较松散,或者说句法成分和语义成分的配位很灵活,一种结构形式经常表示多种意义,一种语义内容也可以用多种结构形式来表示。这就给机器翻译的汉语生成带来很大的困难。对于动结式表层句法结构的选择,我们目前能用到的条件非常有限,所以能生成的句型也很有限。
5.1 使生成目标受限
通过整合语义结构我们得到了动结式的配价结构,价语的数量可以帮助我们选择句型。如果动结式是一价的,选择有一个体词性成分出现的句型;是二价的,选择包含两个体词性成分的句型。至于在同属一类句型的多个表层结构形式中间应该选择哪一个,还需要更细致的条件和规则。下面讨论如何把动结式组成成分之间的语义关系作为选择的条件。
为了简化讨论的过程,我们在这里只考虑二价动结式的情况(略去“妈妈急哭了”、“他看书看花了眼”、“他扔进屋一块石头”等)。这样,讨论的范围就限制在只含有两个体词性成分的表层结构形式里面。吕叔湘(1986)曾经按照补语跟主语或宾语的语义关系,把动结式述补结构分成15类(略去“得”字句等),其中有两个体词性论元成分出现的共9类(包括用“把”和“被的句子),分属以下三种语义关系格式,其中S是V的主体格。(注:在本节讨论的范围内,主体格包括施事、当事;客体格包括受事、内容。)
附图
综合上述各种情况可以看出,二价动结式的六种语义结构可以用以下五种表层结构形式来表达。下面的讨论将在这个范围以内进行:
表层结构1:S+V+C+O
表层结构2:S+“把”+O+V+C
表层结构3:O+“把”+S+V+C
表层结构4:O+“被”+S+V+C
表层结构5:S+“被”+O+V+C
我们注意到,同时与二价动结式的六种语义结构有对应关系的只有表层结构1(S+V+C+O),所以可以把它当作生成动结式表层的首选。可是进一步观察就会发现,在用表层结构1表达某些语义结构时会受到限制。譬如语义结构Ⅱ,我们可以说“大家吃腻了剩菜”,却不能说“我丢怕了钱包”,也不能说“他看傻了那幅画”。能说与不能说应该有条件来控制,O和C之间的语义关系可能是一个控制条件,但是目前还没有确切的规则可用。
在这种情况下,只好先避开表层结构1,选择2和3。经过初步实验我们看到,就表达命题意义来说,用表层结构3表达语义结构Ⅱ,用表层结构2表达语义结构Ⅰ、Ⅲ、Ⅳ、Ⅴ、Ⅵ,受到的限制最少。这样,讨论的范围又缩小到了两种表层结构形式。问题就变成了:如何找到用这两种句法形式表达六种语义关系格式的控制条件。我们把这种逐步缩小问题范围的做法叫作使生成目标受限,实际上这是对复杂问题的一种妥协。也就是对二价动结式,放弃生成所有的表层句式,寻找尽可能简单和有效的控制条件,先用部分表层结构形式表达其多种语义格式。
5.2 生成表层结构的控制条件
从语义结构生成表层结构的主要控制条件是动结式组成成分之间的语义关系。
对于二价动结式的组成成分S、O、V、C,如果S是V的主体格,而且:
(一)如果S、O、V、C相互之间满足下列五个条件之一,则可以用表层结构2表达:
1.(O是V的客体格)且(O是C的主体格)且(C是一价的)
2.(S是C的主体格)且(O是V的客体格)且(O是C的客体格)
3.(O是C的主体格)且(V和C都是一价的)
4.(S是C的主体格)且(O是C的客体格)且(V是一价的)
5.(O是V的客体格)且(C是V的修饰成分)
(二)如果S、O、V、C相互之间满足条件6,则可以用表层结构3表达:
6.(O是V的客体格)且(S是C的主体格)且(C是一价的)
表层结构2和3都是“把”字句。关于“把”字句,很多学者从各种角度作过研究。张伯江(2000)曾根据句式语法的观点指出,除了组成成分的作用以外,“把”字句的整体意义当中还有句式意义的作用。因此,生成的时候还应当考虑上述控制条件能否符合“把”字句句式意义的要求。我们注意到,动结式与“把”字句似乎有一种自然的联系。“把”字句中V的“处置”意义、C是“把”后面宾语产生的变化等句式意义与动结式的句式意义基本相似。(注:在动结式的表层结构2中,宾语是O;在表层结构3中,宾语是S。)另外,为了体现“把”字 《机器翻译中汉语动结式生成的过程和困难(第5页)》