博碩士論文 91521070 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:91 、訪客IP:3.145.96.221
姓名 楊景嵐(Ching-Lan Yang)  查詢紙本館藏   畢業系所 電機工程學系
論文名稱 電話語音應用整合語者辨識與關鍵詞萃取
(A Study on Speaker Recognition and Keyword Spotting in Telephony Integration)
相關論文
★ 小型化 GSM/GPRS 行動通訊模組之研究★ 語者辨識之研究
★ 應用投影法作受擾動奇異系統之強健性分析★ 利用支撐向量機模型改善對立假設特徵函數之語者確認研究
★ 結合高斯混合超級向量與微分核函數之 語者確認研究★ 敏捷移動粒子群最佳化方法
★ 改良式粒子群方法之無失真影像預測編碼應用★ 粒子群演算法應用於語者模型訓練與調適之研究
★ 粒子群演算法之語者確認系統★ 改良式梅爾倒頻譜係數混合多種語音特徵之研究
★ 利用語者特定背景模型之語者確認系統★ 智慧型遠端監控系統
★ 正向系統輸出回授之穩定度分析與控制器設計★ 混合式區間搜索粒子群演算法
★ 基於深度神經網路的手勢辨識研究★ 人體姿勢矯正項鍊配載影像辨識自動校準及手機接收警告系統
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 本論文主要的研究目標是將關鍵詞萃取與語者辨識結合在一起,由於本實驗室在語者辨識方面的研究已經累積了不少成果,所以主要著重在如何提升關鍵詞萃取的辨識能力以及對於辨識速度如何加速為其研究重點。
由於在關鍵詞模組與無關鍵詞模組的組合中,無關詞模組對辨識率有很大的影響,所以我們嘗試改變無關詞模組的形式,去找出一組較佳的無關詞模組來進行辨識,經由實驗驗證所選取的無關詞模組,由於較省記憶空間所以辨識速度也跟著提升,再者進行關鍵詞萃取時我們利用雙重辨識架構進行關鍵詞的萃取,第一層利用一階動態演算找出Top N最接近的候選者,第二層則將Top N的候選者跟經由訓練得到的Top N的信任分數臨界值作判斷,假如該名次被拒絕掉則名次由下一名遞補,以此類推,之後我們找最佳名次當作萃取出的關鍵詞。我們經由實驗驗證這個方法確實可提高整體的辨識率。在確認上,我們使用了一個不用訓練每個次音節臨界值的方法,使得以後建立確認系統可以更快速。
關鍵字(中) ★ 信任分數
★ 無關詞模組
★ 關鍵詞
關鍵字(英) ★ Filler Model
★ Keyword
論文目次 摘要 I
目錄 II
附圖目錄 V
表格目錄 VII
第一章 緒論 1
1.1 研究動機 1
1.2 關鍵詞萃取概述 2
1.3 研究目標 3
1.4 章節概要 4
第二章 語音基本技術 5
2.1 特徵參數擷取 5
2.2 隱藏式馬可夫模型 9
2.3 次音節模型的建立與訓練 12
2.3.1 聲學模型 12
2.3.2 狀態排列 17
2.3.3 Viterbi Search演算法 18
2.3.4 訓練流程圖 20
第三章 關鍵詞辨識技術 22
3.1 關鍵詞萃取架構 22
3.1.1 關鍵詞模組 23
3.1.2 無關詞模組 23
3.1.3 連續語音辨認方法 25
3.2 第一階段辨識流程 27
3.3 第二階段辨識 28
3.4 關鍵詞確認 32
3.4.1 確認架構 32
第四章 語者基本介紹 35
4.1 語者辨識 35
4.2 語者確認 38
4.2.1 背景語者模型 38
4.2.2 全域語者模型 40
第五章 實驗與結果 41
5.1 實驗環境 41
5.2 第一階段萃取實驗 43
5.2.1 不同無關詞模型下辨識率的比較 43
5.2.2 不同無關詞模型下系統辨識速度 45
5.2.3 對無關詞模型加入文法限制 47
5.3 第二階段萃取實驗 49
5.3.1 訓練信任分數 49
5.3.2 以信任分數判斷 52
5.3.3 正規化信任分數對辨識率比較 53
5.4 少量特殊方言辨識 54
5.5 系統架構 56
第六章 結論與未來展望 57
6.1 結論 57
6.2 未來展望 58
參考文獻 60
參考文獻 [1] D. Burshtein, “Robust parametric modeling of duration in hidden Markov models,” IEEE Trans. Speech Audio Processing, vol. 4, no. 8, pp. 240-242, May 1996.
[2] J. R. Deller, Jr., John G. Proakis, John H. L. Hansen, “Discrete-time processing of speech signals”, 1987.
[3] X. Huang, A. Acero, H. Hon, “Spoken Language Processing,” Prentice Hall, 2001.
[4] B. H. Juang, “The past, present, and future of speech processing,” IEEE Trans. Signal Processing, vol. 15, no. 3, pp. 24-28, May 1998.
[5] T. Kawahara, C. H. Lee, and B. H. Juang, “Flexible speech understanding based on combined key-phrase Detection and Verification,” IEEE Trans. Speech and Audio Processing, vol. 6, no. 6, pp.558-568 Nov. 1998.
[6] M. W. Koo and Sun-Jeong Lee, “An utterance verification system based on subword modeling for a vocabulary independent speech,” Eurospeech 1999.
[7] M. W. Koo, C. H. Lee, and B. H. Juang, “Speech recognition and utterance verification based on a generalized confidence score,” IEEE Trans .on Speech and Audio Processing, vol. 9, no. 8, pp.821-832, Nov. 2001.
[8] Chi-Min Liu, Chin-Chih Chiu, and Hung-Yuan Chang “Design of vocabulary -independent mandarin keyword spotters,” IEEE Trans. Speech and Audio Processing, vol. 8, no. 4, pp.483-487, July 2000.
[9] Qi Li, B.-H, Juang, Qiru Zhou, and C.-H. Lee, “Automatic verbal information verification for user authentication,” IEEE Trans. Speech and Audio Processing, vol. 8, no. 5, pp.585-596, Sep. 2000.
[10] S. E. Levinson, L. R. Rabiner, and M. M. Sondhi, “An introduction to the application of the theory of probabilistic function of a markov process to automatic speech recognition,” The Bell System Technical Journal, vol. 62, no. 4, April 1983.
[11] Chi-Shi Liu, Hsiao-Chuan Wang and Chin-Hui Lee, “Speaker verification using normalized log-likelihood score,” IEEE Trans. Speech and Audio Processing, vol. 4, no. 1, pp.57-60, Jan. 1996
[12] N. Moreau and D, Jouvet “Use of a confidence measure based in frame level likelihood ratios for the rejection of incorrect data,” Eurospeech, 1999.
[13] H. Ney, “The use of a one stage dynamic programming algorithm for connected word recognition,” IEEE Trans. Acoustic, Speech, Signal Processing, vol.32, no.2, pp. 263-271, April 1984.
[14] J. Neyman and E. S. Pearson, “On the problem of the most efficient tests of statistical hypotheses,” phil. Trans. R. Soc. A, vol. 231, pp. 289-337, 1933.
[15] J. Neyman and E. S. Pearson, “On the use and interpretation of certain test criteria for purpose of statistical inference,” Biometrika, pt I, vol. 20A, pp.175-240, 1928.
[16] M. G. Rahim, C. H. Lee, and B. H. Juang, “Discriminative utterance verification for connected digits recognition,” IEEE Trans. Speech and Audio Processing, vol. 5, no. 3, pp.266-277, May 1997.
[17] L. R. Rabiner, “A tutorial on hidden markov models and selected application in speech recognition,” Proceedings of the IEEE, vol. 77, no. 2, pp. 257-286, Feb. 1989.
[18] L. R. Rabiner and B. H. Juang, “Fundamentals of speech recognition,” Prentice Hall, New Jersey, 1993.
[19] L. R. Rabiner and R. W. Schafer, “Digital processing of speech recognition signals,” Prentice-Hall Co. Ltd, 1978.
[20] E. Roseberg, J. Delong, C. H. Lee, B. H. Juang and F. K. Soong, “The use of cohort normalized scores for speaker recognition,” Pro. ICSL 92. Banff, pp.599-602, Oct. 1992.
[21] J. T. Tou, “Pattern recognition principles,” Addison-Wesley, 1974.
[22] L. Xin and B. X. Wang “Utterance verification for spontaneous mandarin speech keyword spotting,” IEEE Proceedings Info-tech and Info-net, 2001 Proceedings, ICII 2001 Beijing, vol.3. pp. 397-401, 2001
[23] Y. Zhzng, D. Zhand and Z. Shu, “A novel text-independent speaker verification method based on the global speaker model,” IEEE Trans. Systems, Man, and Cybernetics, vol. 30, no. 5, pp. 598-602, 2000.
[24] 蔡永琪,“基於次音節單元之關鍵詞辨識”,國立中央大學碩士論文,中華民國八十四年六月。
[25] 黃國彰,“ 關鍵詞萃取與確認之研究 ”,國立中央大學碩士論文,中華民國八十五年六月。
[26] 王維邦,“ 連續國語語音關鍵詞萃取系統之研究與發展 ”,國立中央大學碩士論文,中華民國八十六年六月。
[27] 吳金池,“ 語者辨識系統之研究 ”,國立中央大學碩士論文,中華民國九十年五月。
[28] 蔡炎興,“ 關鍵詞萃取及語者辨識系統之研製 ”,國立中央大學碩士論文,中華民國九十二年六月。
指導教授 莊堯棠(Yau-Tarng Juang) 審核日期 2004-7-9
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明