论云南地方少数民族文字文献数据库构建
摘 要:云南少数民族文字文献数据库的构建,是随着计算机、通讯、多媒体、高密度存储等信息技术的发展和应用,尤其是网络技术的迅速普及,文献资源的数字化水平成为各国、各地区信息水平的标志为发展机遇的。云南少数民族文字文献是云南各少数民族智慧的结晶,是中华民族文化宝库中的一块瑰宝。因此,将其数字化必将促进云南地方民族文化大省建设的步伐,在促进民族地区的经济、文件建设与发展中起到不可低估的作用。
关键词:云南;少数民族;文字文献;数据库;建设
中图分类号 G250 74
文献标识码 A
文章编号 1672-867X(2005)01-0148-04
一、引 言
云南是我国少数民族种类最多的省份,人口超过5000人的民族有26个,其中15个是云南独有的民族。除回族、水族、满族3个民族通用汉语外,其余的民族都有自己古老的文字或语言:23个民族使用着27种语言;15个民族使用着24种文字(或拼音方案)。
本文旨在通过论述云南地方少数民族文字文献的宏富,全面探讨云南少数民族文字文献的构成、价值以及对其开发利用的重要性,寻求采用先进科技手段将其数字化的方法,以便更好地传承这一颇具特色的文化奇葩,以造福于子孙后代。
二、丰富的地方民族文字文献是数据库的资源保障
云南地方少数民族文字文献以彝文、东巴象形文、傣文和藏文的文献最为丰富,也是少数民族文字文献中最为悠久、珍贵的文献。
(一)彝文文献。彝族在历史上产生了本民族古文字,明清文献将其称作“爨文”、“韪书”,近人称它为“倮文”、“毕摩文”、“贝玛文”或“罗罗文”等。自彝文产生的时候起,便有了彝文古籍。彝文古籍种类繁多,从学科和内容上分为宗教类、历史类、训劝类、政治军事类、科学技术类、天文地理类、彝文字词典类等。彝文古籍博大精深,任何一部都有丰富的内涵,都有不可替代的作用和地位,它数量庞大,计有数万册、数千种。其中影响较大、被翻译介绍得颇有特色、具有代表性的重要典籍有:《查姆》、《梅葛》、《玄理大书》、《指路经》、《尼租谱系》、《礼法经》、《十月兽历》等。《昆明西乡彝文单字注释》是迄今为止收集到的年代最久远的一部字书,书中收录了206部彝文古籍近7000个彝文字,是研究彝文难得的资料,对编写彝文古籍词典,对彝汉双语教育历史的研究,都有着极高的借鉴和参考价值;彝文医书《彝族医药志》记述了彝医的起源、彝族先民的针灸疗法、常见病防治法,被医药界誉为“哀牢明珠”,据说还早于《本草纲目》12年。国外对彝文的研究始于1852年:法国人把《宇宙源流》译成法文,并在1898年用法文、彝文对照出版;1905年出版了法文与彝文对照的《法罗字典》;英国鲁豪尔的《坚固的堡垒》(1947年)、美国弗兰克的《华南漫游记》(1964年)、法国享利·科尔迪埃的《罗罗的现实形态问题》(1907年)、日本西田龙雄的《中国西南部的罗罗文字》(1980年)等论著也在20世纪上半叶相继出版。
(二)纳西族东巴象形文。纳西族古老的原始象形文计有1400余字。纳西族信奉的东巴教是一种原始的多神教,东巴教的经师称为“东巴”,他们掌握象形文,在进行祭祀、除病禳灭等法事活动中形成了众多的东巴经,用于记载古代纳西社会的历史、宗教、文学、艺术、地理、医学等方方面面。流传至今的东巴文古籍约有2 3万册,不同内容的约有1500册(种),分为祭天仪式经书、占卜经书、舞谱及杂类书等共28类,是研究纳西社会的百科全书。东巴文经典《创世纪》是纳西创世史诗,它所反映的社会内容是十分丰富的,如抹去神话色彩,完全可以看作是纳西族先民从群婚向一夫一妻制婚姻形式过渡的真实写照;《哥巴文字典》是用东巴象形文字为哥巴文注音的字典,从纳西象形文到哥巴文的发展,体现了文字进化的过程,对文字学的研究有着重要的价值;《崇仁潘迪找药》是研究纳西族医药学的珍贵材料;东巴舞谱是迄今世界上唯一的最古老的象形文字舞谱;东巴文是研究人类文字起源的第一手活资料。国外研究纳西文文献的有:法国巴克(J.Bocot)的《么些研究》(1913年);美国洛克(J.E.Rock)的《纳西百科辞典》两卷(1962年);西德雅纳特(Janert)教授来我国研究纳西族语言文字,已出版东巴经目录5册,东巴经“祭风经”5卷;日本白鸟芳郎教授主持的“中国大陆古文化研究会”于1978年出版纳西族的特集(共8集)。
(三)傣文文献。张公瑾先生在其著作《民族古文献概览》中说“文字跟着宗教走”。傣文文献的产生发展情况同这一说法很相符。傣文产生的年代在13世纪左右,傣文的文献古籍也在同期产生。从那时起,就有数量众多的佛经和各种典籍源源不断地被记录下来。其中佛经号称“别闷西版康”(八万四千部),叙事长诗有550部,另外还有各种各样的民间传说、故事,由此构成了内容博大精深、时间跨度数百年的傣族文字古籍文献宝库。傣文古籍内容涉及历史、宗教、经济、语言、文化、民俗、医学、天文历法等,因主要载体是贝叶,故又称之为“贝叶经”,其中佼佼者有:《银云瑞雾的勐果占壁简史》;为历史研究提供了重要的年代依据的《囊丝车勐》(《车里宣尉世系简史》)是一部统治阶级的兴衰史,是不可多得的史料;《苏定》是一部有关傣族天文历法的重要文献;《档哈雅》是西双版纳的傣族药书,是傣族医药宝库中的瑰宝,有些内容已被记入《中国药典》和《云南省药品标准》等医药书内。
(四)藏文文献。藏文古籍内容广泛、卷帙浩繁,其数量仅次于汉文古籍。藏文古籍以《大藏经》分法为准,分为《甘珠尔》(佛说部1108种)和《丹珠尔》(论疏部3461种)。藏文古籍的载体历经了羊皮———木简———白桦树皮———纸几个阶段。重要的藏文典籍有:《历代噶玛举黑帽系活佛教·如意藤》是研究云南藏传佛教和民族关系不可缺少的重要资料;《加岭传奇》是一部研究云南藏族历史、民俗等方面的要籍,也是一部优美的文学作品;《四部医典》则为一部藏医临床百科全书;《恰最松饶历史》是西藏各大寺院、历算机构和个人编制日历的主要工具书之一。
其他少数民族的文字文献,如回族的《赛典赤家谱》等,壮族的《摩则社》等,瑶族的《盘王券牒》等,白族的《?古通》、《山花碑》等,都是这些民族灿烂的文化瑰宝,是研究这些民族历史弥足珍贵的第一手资料。
三、信息处理技术日臻成熟为数据库构建提供了技术支持
我国民族文字信息处理的研究始于20世纪70年代后期,到90年代初,已同步实现了汉字的电脑化处理。1991年,由中央民族大学语言研究和计算机系联合研究编著的《中国各民族文字与电脑信息处理》一书,从理论上对我国少数民族文字微机处理的种种问题作了研究,并将所取得的成果作了详尽介绍。在国家的扶持下,许多科研机构开发了多种民族文字的字处理技术及应用系统,完成了包括蒙古文、维吾尔文、哈萨克文、柯尔克孜文、彝文、藏文等在内的编码字符集标准、键盘标准、字模标准,标志着少数民族编码字符向国际标准化的迈进。[5]现已开发的少数民族文字操作系统和出版系统有:蒙文《蒙古文、汉文、西文操作系统》、《华光V型蒙古文书刊、图表、报纸激光照排系统》、《蒙文书目机读数据库》等;藏文《兰海藏文系统》、《北大方正藏文书版系统》、《WIN95藏文文字平台》、《藏文字处理软件》等;朝鲜文《方正朝鲜文书版系统》;彝文《彝文字符国际标准》、UCDOS汉彝双语平台》、《SPDOS汉彝文版汉字操作系统》、《WIN彝文文字平台》等;傣文《傣文电子出版系统》以及《计算机锡伯文、满文文字处理系统》和《壮语词库》等。1991年4月,内蒙古电子计算中心课题组完成了蒙古、藏、维吾尔、哈萨克、朝鲜、满、汉文操作系统4 0版的设计,是国家重点科技攻关项目“少数民族文字处理技术开发”的子课题,这个操作系统可同在一个微机上处理民族文字和汉、英等文。
我们看到,与云南少数民族彝、傣、藏为主体的文字文献已有密切相关的处理系统作为良好基础,将云南的彝、傣、藏文数字化已是指日可待了。民族文字信息技术的成功开发研制,为民族文字文献数据库的建设创造了必要的条件,为民族文字文献的深层次开发利用提供了技术标准和强有力的信息处理保障。但就云南省拥有自己语言或文字的23个少数民族来说,要将其所有民族文字文献数字化,任务还十分艰巨。如东巴象形文至今还未见到一个成熟的软件,但可喜的是有更多的学者都在积极努力寻求将其数字化的途径。华东师范大学中文系郑飞洲就撰文《关于纳西东巴文字信息处理的设想》,专门讨论将现有东巴文字及其研究资料科学合理地整合成数据库,并将文字的检索分为形、音、义检索,从东巴文字字形的描写项、语音的描写项和字形表义情况的描写项三个方面进行检索研究,又根据东巴文的特质提出用字素检索来解决东巴象形文的数字化问题
《论云南地方少数民族文字文献数据库构建》