三、實驗語音學
實驗語音學的成果為自然語言的處理提供了強有力的支持。相關的成果有:夏吾措的《基于PAS6600的藏語送氣/不送氣輔音氣流信號研究》(《西北民族大學學報》自然科學版第3期)一文,以藏文字母中七組送氣與不送氣輔音為研究對象,利用語音空氣動力學PAS6600提取各個輔音的氣流信號參數,從呼氣時長、平均呼氣速度、呼出氣流量等三項參數,分析相同輔音的各項參數在不同性別間存在的差異,即男性的呼出氣流量比女性的呼出氣流量要大,這主要跟其生理特征有直接的關系。王慶楠、郭武、解傳棟的《基于端到端技術的藏語語音識別》(《模式識別與人工智能》第4期)一文,提出將已有的語言學知識結合至端到端的聲學建模中,采用綁定的三音子作為建模單元,解決建模單元的稀疏性問題,大幅提高聲學建模的區分度和魯棒性。在藏語測試集上,通過實驗證明文中方法提高基于鏈接時序分類技術的聲學模型的識別率,并驗證語言學知識和基于端到端聲學建模技術結合的有效性。代龍翔、李冠宇、馬寧的《基于譜減法語音增強效果研究》(《西北民族大學學報》自然科學版第2期)一文,介紹了語音增強的發展歷程以及面向藏語語音的研究現狀。文章選擇經典的譜減法作為語音增強方法,并介紹了譜減法原理,同時設計實驗方案,實驗語料使用純凈語音和噪音混合成的帶噪語音,按照不同信噪比進行語音測試,得出結論:使用譜減法能夠明顯提升語音質量,提升效果隨著噪音語音相關度的多少而變化。曲珍、扎西加、春燕的《最大熵軟決策樹HMM最大似然藏語音合成》(《計算機工程與設計》第4期)一文,針對傳統的硬決策樹藏語音合成系統存在泛化性能不強的問題,設計改進一種二進制軟決策樹算法,實現基于語境因子的藏語音合成模型參數估計。內部節點根據子代節點隸屬度進行選取,每個節點可視為基于語境依賴隸屬度的模糊集合,將每個語境分配給幾個重疊的葉節點,提高模型概括和函數逼近性能;采用最大熵平滑分布進行局部一階矩和全局二階矩特征捕捉,實現隱式馬爾可夫(HMM)輸出概率分布的軟決策參數最大似然估計。仿真驗證結果表明,所提算法在滿足應用實時性要求的前提下,可有效提高藏語音合成效果。才讓卓瑪、才智杰的《基于語料庫的藏語語音合成單元選擇算法》(《中文信息學報》第5期)一文,針對藏語言文字的特點,提出以基本構件、組合構件、字、詞及句單元相融合的混合單元語音合成策略,并提出了藏語語音合成混合單元選擇算法。主觀評價與客觀評測數據表明該策略與算法有效和合理,各類合成單元在開放語料上的覆蓋率與語音合成效果均達到預期的目標。
版權所有 中國藏學研究中心。 保留所有權利。 京ICP備06045333號-1
京公網安備 11010502035580號