English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 81570/81570 (100%)
造訪人次 : 47020572      線上人數 : 82
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/9133


    題名: 快速演算法在大字彙關鍵詞萃取上的應用
    作者: 楊鎮光;Zhen-Guang Yang
    貢獻者: 電機工程研究所
    關鍵詞: CMS;樹枝狀;關鍵字萃取;快速演算法;Cepstrum Weighting
    日期: 2001-06-06
    上傳時間: 2009-09-22 11:41:43 (UTC+8)
    出版者: 國立中央大學圖書館
    摘要: 在傳統whole word based的關鍵詞萃取辨識系統中,辨識效能常因關鍵詞彙的增加而導致辨識率下降及辨識時間增加,所謂的快速演算法,就是藉由關鍵詞字彙結構的相關性,將關鍵詞予以分類並加以結構化,因而能藉由樹枝狀的搜尋架構,大幅的減少辨識時間,而隨著關鍵詞彙的增加,辨識率仍能維持ㄧ定水準而不墬,這就是將快速演算法應用在大字彙關鍵詞萃取的目的. 在作法上,我們先將關鍵詞分成幾個次部分(subsets),而不同關鍵詞的次部分會包含相同的共同次字彙(common subword),如同樹枝一般,在辨識出前N個最佳的共同的次字彙之後,就能夠減小搜尋範圍,捨去不可能入選的關鍵詞,針對相似度比較高的關鍵詞進行最後的確認.進而達到快速的目的. 除了演算法本身之外,論文中還針對多項能夠提昇辨識率的方案進行實驗,這些方案包含了將無關詞對語音特徵的機率加上一縮小權值,以使關鍵詞的切音區更加準確.使用動態的權值,讓不同的測試語句都有相對應最佳的縮小權值.另外鑒於測試和訓練語料取得環境的不同(分別為電話及麥克風錄音),我們以CMS加上Cepstrum weighting分別對訓練語料及測試語料進行處理,並重新訓練次音節模型,最後,將處理前後(指有無加上CMS及Cepstrum weighting)的機率值混合考慮,並由實驗找出最佳的混合比例.由實驗結果可以發現,動態權值及機率混合考慮這兩種方法如配合使用,可達最佳辨識率Top1為91.32%.而僅使用單一權值的辨識效果最差,Top1達83.67%. 為了使關鍵詞萃取系統更加完整,關鍵詞拒絕的能力是有必要被加入的,在實驗結果方面,加入關鍵詞拒絕後的正確率為81.51%.
    顯示於類別:[電機工程研究所] 博碩士論文

    文件中的檔案:

    檔案 大小格式瀏覽次數


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明