近日,“藏、维、彝民语语音参数数据库” 在中国社会科学院民族学与人类学研究所举行成果鉴定会并通过鉴定。这一研究成果为促进藏、维吾尔、彝3种民族语言标准音的推广使用,为语音系统研究、语音教学、言语工程研究和病理语音矫治等提供了有效的数据支撑,是国家信息化建设的重要基础信息资源,促进了少数民族语言资源的保护和开发。

由中国社会科学院民族学与人类学研究所、西藏语委、新疆大学和西南民族大学共同完成的这一项目,是教育部、国家语委民族语言文字规范标准建设及信息化项目。项目建立了藏语、维吾尔语和彝语3个语言标准音(广播语)的语音特征声学参数数据库,建立了用于单一语言语音研究和多语言比较研究的索引库和应用软件平台。语音库录制的语料有单音节词、多音节词、句子和故事,语料涵盖该语言的全部语音系统及特色语音。索引库主要由功能字段和标音字段两部分10个字段组成。功能字段可以表明该词在数据库中的语种、序号、该民族文字、汉译和对应的声样名;标音字段有:SAMPA(Speech Assessment Method Phonetic Alphabet )、国际音标(IPA)和该语言的拉丁撰写,其中SAMPA是各语言共同的标音系统。语音声学参数库建立了大容量语音声学参数库,共有49个参数,其中包括35个声学参数和14个功能参数。语音声学参数库应用软件平台可以对多语言语音参数库进行各类检索、排序;生成各类专题研究的参数库;可以对单一语言和多语言进行统计分析,用于语言音系系统的语音研究和比较研究。

鉴定专家认为,这是国内首个建立的藏、维吾尔、彝民族语言语音声学参数数据库,具有数据容量大,标准化程度高的特点。可直接用于单一语言语音研究和多语种比较研究,表明我国在少数民族语言语音研究上达到国际先进水平。