English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 78852/78852 (100%)
造訪人次 : 38074185      線上人數 : 1084
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/9396


    題名: 語者調適之應用研究;The Research of Speaker Adaptation
    作者: 廖家慶;Chia-Ching Liau
    貢獻者: 電機工程研究所
    關鍵詞: 語者調適;speaker adaptation
    日期: 2002-06-04
    上傳時間: 2009-09-22 11:46:53 (UTC+8)
    出版者: 國立中央大學圖書館
    摘要: 摘 要 在語音辨識系統中,特定語者(Speaker-dependent)型語音辨識系統雖有高辨識率的優點,但當應用到新語者時須花釵h語音訓練資料和時間;而不限語者(Speaker-independent)或多語者(multi-speaker)型的語音辨識系統,除最初建立系統時所需語音資料外,應用於新語者時不再需新語音訓練資料,但其辨識率普遍不高。語者調適(Speaker-adaptive)辨識系統則利用一充分訓練過的參考系統已知資訊,藉新語者少量語音資料訓練 ,可達到接近特定語者系統的辨識率,因此論文中將針對語者調適系統進行研究。 本論文內容包含兩個主要研究主軸,其一為如何在少量調適語料之狀況下,增進改善調適演算法,藉此提升系統辨識率與調適結果;另一主軸則為利用增進後之調適演算法實際應用於線上辨識與調適。 於第一研究主軸中,其重點在於考慮初始模型與最大可能性線性迴歸(Maximum Likelihood Linear Regression,MLLR)兩者間貢獻的比重分配,藉由找出最佳平衡點來提升調適性能。接著並考慮向量場平滑化(Vector-Field-Smoothing,VFS)轉移向量場的調適方式,針對沒有觀測到之調適語料模型,加以參考有調適語料之模型來進行調整,藉此特性再搭配權重化之MLLR調適方法研究其調適效果。接者利用特定語者模型與不特定語者模型來架構出特徵向量空間,由此特徵向量空間來找出語者的代表點所在,藉此調整系統模型參數。而在第二研究主軸內,藉由所發展出少量調適語料即能達到調適系統之演算法,將此調適演算法應用於線上系統,使語者能夠感受到辨識與調適之即時變化。 Speaker adaptation has been applied to speech recognition to get a speaker dependent system with a good performance. Most adaptation techniques use the initial model as a starting point and then introduce speaker’s specific information. By using the adapted parameters, the recognition performance can be significantly improved. In this thesis, we present a variation on improving the performance of maximum likelihood linear regression (MLLR) in cases of little adaptation data. The transformed Gaussian means are interpolated with the means in the initial mean models. The VFS algorithm proposed by the following steps. First, the transfer vectors are estimated. Then, interpolation and smoothing are performed using the transfer vectors. We applied the idea of using eigenvoices, a set of orthogonal basis vectors derived from the parameters of speaker dapendent models trained on reference speakers.
    顯示於類別:[電機工程研究所] 博碩士論文

    文件中的檔案:

    檔案 大小格式瀏覽次數


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明