吴语五地词汇相关度的计量研究
舌位图;利用共振峰频率可以绘制声学元音图。这两种图会有所差别,但基本相似。声学元音图有精确的数据,所以,我们选用声学元音图作为确定元音相关系数的基础。我们选用Ladefoged型声学元音图。
Ladefoged(1976)主张以F1作纵坐标,线性标度;F2-F1横坐标,对数标度,如图。Ladefoged的整个元音图接近于平行四边形,像Carmody的舌位图一样。但是展唇后元音的排列与传统的元音图有不一致的地方。但这不会影响我们的计算,因为除了,基本没有后圆唇和展唇元音相似。根据此图,我们可以算出几个基本单元音的相关系数。具体计算方法如下:首先,将这幅图中的横坐标和纵坐标分别平均为10个等份,单位刻度为1;然后计算图中任何两个元音的距离。我们将距离的倒数定为这两个元音的相关系数。如I和i两个元音,其距离为1.2083,所以它们的相关系数即为82.8%。在计算相关系数中,有一点要注意,这就是当两个元音的距离在单位刻度以内,也就是说小于1时,我们认为它们的相关系数为1。以下是用此方法算出的几个基本单元音的相关系数:
附图
以这几个单元音作为基本的相关系数,每增加一项要素,就在这些基本相关系数的基础上做一次根式计算。这些要素包括:鼻化、复韵母、鼻音、喉塞。如:ie-iE,增加了一个复韵母的要素,也就是增加了一个"i"的介音,由于介音相同,所以这两个韵母的相关系数就会更大一点。将31.6%开根号,得到的56.2%就是ie和iE的相关系数。
又如:增加了介音和喉塞两个相同的因素,他们的相关系数就是14.1%开三次方根,得到52%。
2.2 声母相关系数的确定
两个声母进行比较,完全相同的,相关系数为1;不同的则通过计算求出它们的相关系数;听感上没有相似点的,其相关系数为0。
附图
辅音腭位与舌位的调音部位对应示意
我们以辅音腭位与舌位的调音部位对应示意图为基础,制作声母的相关系数。图(A)是口腔中正面仰视的腭位,按上齿的分布来分区的图解。图(B)是口腔中正面平视的腭位,这是根据牙科材料脱模而描出的上腭拱形图。图(C)是侧面的X光照相所得的腭位。这种和工程画差不多的三面图,用虚线将各对应的区域连接,可以对舌位作比较准确的测量。并可根据上齿部位来给上颚发音部位分区。如:两对门齿部分为齿音,侧门齿与第一前臼齿之间为齿龈区,第一前臼齿与第二臼齿之间为硬腭区,支持部分为软腭音区等。在分区上,各家略有出入,但基本上是按上颚的部位来分的。此外,我们知道,舌位和上颚也有一定的对应关系,传统方言学中的舌尖音和舌叶音对应齿龈音,硬腭音对应舌面音,舌根对应软腭音。所以,根据此图,我们将齿龈前定位在3的位置;硬腭和齿龈交界的地方(基本上是舌叶的位置)定位在3.75的位置;硬腭的前部(舌面前)定为4.5;硬腭的后部(舌面中)定为5.25;软腭(舌根)定位在6的位置。
计算两个声母的相关系数时,首先要有相似的听感,然后在图中找到这两个声母中辅音所在的位置,位置靠前,数值小的做分子,数值大的做分母,分子、分母相除的结果即为这两个声母的相关系数。
由于没有复辅音,这里不需要进一步的计算。此外,需要补充一点,有两个韵母的鼻韵尾需要在这里定义相关系数,因为它们是用辅音符号表示的,而且其差别在于舌尖前和舌根,以及舌根与舌面中,它们是:。
三 方法与步骤
3.1 语料的采用和收集
本文计算了吴语五个代表点:上海、温州、衢州、金华、临海的784条词汇的相关度。现代吴语区分为六片:太湖片、宣州片、瓯江片、婺州片、丽衢片和台州片(《中国语言地图集》)。宣州片由于缺少语料,暂不涉及。784条词目在吴语五地的语音表现形式是通过查寻方言词典和田野调查得到的。上海话的资料选自《上海方言词典》(1997)。词典上没有的词汇,采用作者(上海人)的发音。温州话的资料选自《温州方言词典》(1998)。词典上没有的词汇,由游汝杰(温州人)做了增补。金华话的资料选自《金华方言词典》(1996)。临海和衢州两地的词汇资料是通过笔者实地调查获得的。临海的发音人:张一伦,63岁,退休教师;蒋林寿,60岁左右,退休教师。衢州的发音人:邵永平,24岁,研究生;金锭铃,57岁,家庭主妇;孔祥枝,60岁左右,退休鞋匠。
3.2 五地词汇相关度的计算
首先,用加权法算出每条词目任意两地间的相关度,方法如下:
(1) 先将每词在每地的读法分解为词段,两地分解的结果有可能不同。
附图
(2) 将该条词在一地分解的词段和另一地分解的词段进行所有可能的排列组合。
如:仍以上海话和衢州话“打雷”这个词目为例。先给词段编号:
附图
(4) 在每组组合中,相对应的词段包括对应的声母对和韵母对,将该词段中声母的相关系数和韵母的相关系数进行算术平均计算,所得结果即为该词段的相关度。承接上述的例子:sh1-qz1的相关度为(1+0.523)\2=0.762;sh2-qz2的相关度为(1+0.607)\2=0.804。
(5) 计算两地词段的平均个数。以上海话和衢州话“打雷”这个词目为例:上海话为ta和le两个词段;衢州话为三个词段,平均词段数为2.5。
(6) 在(4)的基础上,将对应词段的相关度相加,再除以平均词段数,可得每组组合的相关度。承接(4)的例子:
(7) 算出每词所有组合关系的相关度,选出数值最大的那个作为该词的相关度。仍以上海话和衢州话“打雷”这个词目为例:
附图
每种的相似度为:1:62.4%;2:30.5%;3:0;4:0;5:0;6:32.2%。所以,“打雷”这个词目在上海话和衢州话中的相关度为62.4%。按上述方法计算出每词两地之间的相关度后,再用算术平均法求出五地的两两相关度。
四 词汇变化的趋势
4.1 相关度与词频的分布关系
根据每条词目任意两地的相关度,我们可以做出每条词目的相关度与词频的分布关系图
附图
从图中可以看出,高频词都集中在相关度为0.35-0.4这个范围附近。以这个范围为基点,词频随着相关度的减少和增大而急速减少。
为了进一步看清问题,我们作出以相关度0.05为单位的相关度和词频分布的方框图(见图二)。从这两幅图中可以看出,在共时平面中,常用词相关的程度并不大。
4.2 相关度与词数的分布关系
根据每条词目任意两地的相关度,我们还可以作出相关度与基本词汇词数分布的方框图。x轴仍以相关度为变量,y轴以词数为变量。我们以相关度0.05为单位作图(见图三)。
相关度与词数分布图非常有规律。我们可以看出,在相关度为0.3-0.4这个范围附近,词汇分布的密集度最高;在0.3-0.4以外的区间,词汇分布数逐渐减小,在相关度[0,1]闭区间的两端,词汇分布数最小;大部分词分布在相关度为0.25-0.55这个区间。
附图
4.3 基本词汇的变化趋向
词汇的变化受各种因素的影响,其中有语言交流产生的借贷;历史文化甚至是政治的影响;移民、交通的影响等等。一条词只要是用于交际,就会受到各种因素影响而发生变化。同一方言区不同地点的词汇不尽相同就是词汇受到各种因素的影响发生变化的结果。
从上面两类图中,我们可以得到这样的结论:
(1)高频相关、低频无关性。基本词汇是根据日常生活中的常见概念定义的,而常见的事物并不一定是常常挂在嘴边说的。比如“月亮”,我们常常会看见,但这并不表示我们常常会说。所以,我们可以把基本词汇分为两部分,常用的和非常用的。常用词的词频高,集中在相关度为[0.35,0.45]这个区域。非常用词的词频低,相关度比较分散,没有很大的规律。
(2)抗衡的过程。在实际生活中使用的每条词都会产生变化。但每一条词不会全部变化或者完全不变。一般情况下,只有一部分发生变化,有的是声母发生变化、有的 《吴语五地词汇相关度的计量研究(第2页)》
本文链接地址:http://www.oyaya.net/fanwen/view/206410.html
Ladefoged(1976)主张以F1作纵坐标,线性标度;F2-F1横坐标,对数标度,如图。Ladefoged的整个元音图接近于平行四边形,像Carmody的舌位图一样。但是展唇后元音的排列与传统的元音图有不一致的地方。但这不会影响我们的计算,因为除了,基本没有后圆唇和展唇元音相似。根据此图,我们可以算出几个基本单元音的相关系数。具体计算方法如下:首先,将这幅图中的横坐标和纵坐标分别平均为10个等份,单位刻度为1;然后计算图中任何两个元音的距离。我们将距离的倒数定为这两个元音的相关系数。如I和i两个元音,其距离为1.2083,所以它们的相关系数即为82.8%。在计算相关系数中,有一点要注意,这就是当两个元音的距离在单位刻度以内,也就是说小于1时,我们认为它们的相关系数为1。以下是用此方法算出的几个基本单元音的相关系数:
附图
以这几个单元音作为基本的相关系数,每增加一项要素,就在这些基本相关系数的基础上做一次根式计算。这些要素包括:鼻化、复韵母、鼻音、喉塞。如:ie-iE,增加了一个复韵母的要素,也就是增加了一个"i"的介音,由于介音相同,所以这两个韵母的相关系数就会更大一点。将31.6%开根号,得到的56.2%就是ie和iE的相关系数。
又如:增加了介音和喉塞两个相同的因素,他们的相关系数就是14.1%开三次方根,得到52%。
2.2 声母相关系数的确定
两个声母进行比较,完全相同的,相关系数为1;不同的则通过计算求出它们的相关系数;听感上没有相似点的,其相关系数为0。
附图
辅音腭位与舌位的调音部位对应示意
我们以辅音腭位与舌位的调音部位对应示意图为基础,制作声母的相关系数。图(A)是口腔中正面仰视的腭位,按上齿的分布来分区的图解。图(B)是口腔中正面平视的腭位,这是根据牙科材料脱模而描出的上腭拱形图。图(C)是侧面的X光照相所得的腭位。这种和工程画差不多的三面图,用虚线将各对应的区域连接,可以对舌位作比较准确的测量。并可根据上齿部位来给上颚发音部位分区。如:两对门齿部分为齿音,侧门齿与第一前臼齿之间为齿龈区,第一前臼齿与第二臼齿之间为硬腭区,支持部分为软腭音区等。在分区上,各家略有出入,但基本上是按上颚的部位来分的。此外,我们知道,舌位和上颚也有一定的对应关系,传统方言学中的舌尖音和舌叶音对应齿龈音,硬腭音对应舌面音,舌根对应软腭音。所以,根据此图,我们将齿龈前定位在3的位置;硬腭和齿龈交界的地方(基本上是舌叶的位置)定位在3.75的位置;硬腭的前部(舌面前)定为4.5;硬腭的后部(舌面中)定为5.25;软腭(舌根)定位在6的位置。
计算两个声母的相关系数时,首先要有相似的听感,然后在图中找到这两个声母中辅音所在的位置,位置靠前,数值小的做分子,数值大的做分母,分子、分母相除的结果即为这两个声母的相关系数。
由于没有复辅音,这里不需要进一步的计算。此外,需要补充一点,有两个韵母的鼻韵尾需要在这里定义相关系数,因为它们是用辅音符号表示的,而且其差别在于舌尖前和舌根,以及舌根与舌面中,它们是:。
三 方法与步骤
3.1 语料的采用和收集
本文计算了吴语五个代表点:上海、温州、衢州、金华、临海的784条词汇的相关度。现代吴语区分为六片:太湖片、宣州片、瓯江片、婺州片、丽衢片和台州片(《中国语言地图集》)。宣州片由于缺少语料,暂不涉及。784条词目在吴语五地的语音表现形式是通过查寻方言词典和田野调查得到的。上海话的资料选自《上海方言词典》(1997)。词典上没有的词汇,采用作者(上海人)的发音。温州话的资料选自《温州方言词典》(1998)。词典上没有的词汇,由游汝杰(温州人)做了增补。金华话的资料选自《金华方言词典》(1996)。临海和衢州两地的词汇资料是通过笔者实地调查获得的。临海的发音人:张一伦,63岁,退休教师;蒋林寿,60岁左右,退休教师。衢州的发音人:邵永平,24岁,研究生;金锭铃,57岁,家庭主妇;孔祥枝,60岁左右,退休鞋匠。
3.2 五地词汇相关度的计算
首先,用加权法算出每条词目任意两地间的相关度,方法如下:
(1) 先将每词在每地的读法分解为词段,两地分解的结果有可能不同。
附图
(2) 将该条词在一地分解的词段和另一地分解的词段进行所有可能的排列组合。
如:仍以上海话和衢州话“打雷”这个词目为例。先给词段编号:
附图
(4) 在每组组合中,相对应的词段包括对应的声母对和韵母对,将该词段中声母的相关系数和韵母的相关系数进行算术平均计算,所得结果即为该词段的相关度。承接上述的例子:sh1-qz1的相关度为(1+0.523)\2=0.762;sh2-qz2的相关度为(1+0.607)\2=0.804。
(5) 计算两地词段的平均个数。以上海话和衢州话“打雷”这个词目为例:上海话为ta和le两个词段;衢州话为三个词段,平均词段数为2.5。
(6) 在(4)的基础上,将对应词段的相关度相加,再除以平均词段数,可得每组组合的相关度。承接(4)的例子:
(7) 算出每词所有组合关系的相关度,选出数值最大的那个作为该词的相关度。仍以上海话和衢州话“打雷”这个词目为例:
附图
每种的相似度为:1:62.4%;2:30.5%;3:0;4:0;5:0;6:32.2%。所以,“打雷”这个词目在上海话和衢州话中的相关度为62.4%。按上述方法计算出每词两地之间的相关度后,再用算术平均法求出五地的两两相关度。
四 词汇变化的趋势
4.1 相关度与词频的分布关系
根据每条词目任意两地的相关度,我们可以做出每条词目的相关度与词频的分布关系图
,其中所用词频数据见北京语言学院语言教学研究所编《现代汉语词频词典》(1986)。x轴为相关度,y轴为频次。图上每一点表示一个词,可用(x,y)标出(见图一)。
附图
从图中可以看出,高频词都集中在相关度为0.35-0.4这个范围附近。以这个范围为基点,词频随着相关度的减少和增大而急速减少。
为了进一步看清问题,我们作出以相关度0.05为单位的相关度和词频分布的方框图(见图二)。从这两幅图中可以看出,在共时平面中,常用词相关的程度并不大。
4.2 相关度与词数的分布关系
根据每条词目任意两地的相关度,我们还可以作出相关度与基本词汇词数分布的方框图。x轴仍以相关度为变量,y轴以词数为变量。我们以相关度0.05为单位作图(见图三)。
相关度与词数分布图非常有规律。我们可以看出,在相关度为0.3-0.4这个范围附近,词汇分布的密集度最高;在0.3-0.4以外的区间,词汇分布数逐渐减小,在相关度[0,1]闭区间的两端,词汇分布数最小;大部分词分布在相关度为0.25-0.55这个区间。
附图
4.3 基本词汇的变化趋向
词汇的变化受各种因素的影响,其中有语言交流产生的借贷;历史文化甚至是政治的影响;移民、交通的影响等等。一条词只要是用于交际,就会受到各种因素影响而发生变化。同一方言区不同地点的词汇不尽相同就是词汇受到各种因素的影响发生变化的结果。
从上面两类图中,我们可以得到这样的结论:
(1)高频相关、低频无关性。基本词汇是根据日常生活中的常见概念定义的,而常见的事物并不一定是常常挂在嘴边说的。比如“月亮”,我们常常会看见,但这并不表示我们常常会说。所以,我们可以把基本词汇分为两部分,常用的和非常用的。常用词的词频高,集中在相关度为[0.35,0.45]这个区域。非常用词的词频低,相关度比较分散,没有很大的规律。
(2)抗衡的过程。在实际生活中使用的每条词都会产生变化。但每一条词不会全部变化或者完全不变。一般情况下,只有一部分发生变化,有的是声母发生变化、有的 《吴语五地词汇相关度的计量研究(第2页)》