姓名 蔡炎興(Yan-Hsing Tsai)  查詢紙本館藏   畢業系所 電機工程學系
論文名稱 關鍵詞萃取及語者辨識系統之研製
(A System for Keyword Spotting and Speaker Recognition)
摘要(中) 本論文的研究主題是針對前人的關建詞萃取、確認技術加以改進,並結合語者辨識技術建構一套系統。本論文主體可分為三個部分。在關鍵詞萃取方面,關鍵詞與無關詞模組是用次音節模型來建立的,目的是使最後建立的系統更具有可攜性。另外,除了找出關鍵詞模組與無關詞模組的混合數有最好的搭配方式外,還應用了GCS辨識演算法在關鍵詞的萃取上,使得辨識時就具有部分的拒絕能力,最後再應用類似Beam Search的概念來對系統加速。而關鍵詞的確認上,同樣的我們使用了次音節模型來作假設測試,並且提出了一個不用訓練每個次音節臨界值的方法,使得以後建立確認系統可以更快速。最後,簡略地介紹我們使用語者辨識技術的方法。結合前人的語者識別技術【27】,建構一套系統,並且利用Visual C++的MFC、SDK將我們的語音辨識核心技術包起來,實現視窗化的使用者介面,使得我們的理論能做到即時的線上測試。
關鍵字(中) ★ 語者識別
★ 關鍵詞萃取
★ 語音辨識
關鍵字(英) ★ Speaker Recognition
★ Keyword Spotting
論文目次 摘要 ............................................................I
目錄 ............................................................II
附圖目錄 ........................................................V
表格目錄 ........................................................VII
第一章 緒論 .....................................................1
1.1 研究動機 ....................................................1
1.2 研究目標 ....................................................2
1.3 論文大綱 ....................................................3
第二章 語音辨識基本技術 .........................................4
2.1 特徵參數擷取 ................................................4
2.2 隱藏式馬可夫模型 ............................................8
2.3 聲學模型 ....................................................11
2.4 模型訓練與參數預估 ..........................................16
2.4.1 訓練演算法 ................................................16
2.4.2 訓練流程圖 ................................................19
第三章 關鍵詞萃取與確認 .........................................21
3.1 概論 ........................................................21
3.2 關鍵詞萃取架構 ..............................................22
3.2.1 關鍵詞模組 ................................................22
3.2.2 無關詞模型 ................................................23
3.2.3 辨識模組的排列 ............................................24
3.3 辨識演算法 ..................................................25
3.4 辨識流程 ....................................................28
3.5 廣義信任分數 ................................................29
3.6 關鍵詞確認 ..................................................33
3.6.1 確認流程 ..................................................33
3.6.2 次音節的假設測試 ..........................................35
3.6.3 錯誤率的計算 ..............................................38
3.7 系統加速 ....................................................40
第四章 語者辨識與確認 ...........................................42
4.1 語者辨識 ....................................................42
4.2 語者確認 ....................................................45
4.2.1 語者模型 ..................................................45
4.2.2 全域語者模型(Global Speaker Model) ........................46
第五章 實驗與結果 ...............................................48
5.1 實驗環境 ....................................................48
5.2 關鍵詞萃取實驗 ..............................................50
5.2.1 混合數對辨識率的影響 .....................................50
5.2.2 廣義信任分數(GCS) .......................................52
5.3 關鍵詞確認實驗 值 ...........................................55
5.3.2 關鍵詞確認 ................................................58
5.4 系統加速 ....................................................61
5.5 系統實現 ....................................................62
第六章 結論與展望 ...............................................68
6.1 結論 ........................................................68
6.2 未來展望 ....................................................69
參考文獻 ........................................................71
指導教授 莊堯棠(Yau-Tarng Juang) 審核日期 2003-6-10
