中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/68744
English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 41675066      線上人數 : 1535
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/68744


    題名: 改良式梅爾倒頻譜係數混合多種語音特徵之研究;Improved Mel Frequency Cepstral Coefficients Combined with Multiple Speech Features
    作者: 唐曲亮;Tang,Chu-Liang
    貢獻者: 電機工程學系
    關鍵詞: 語音辨識;特徵合併;梅爾倒頻譜係數;關鍵詞萃取;speech recognition;feature combination;MFCC;keyword spotting
    日期: 2015-07-13
    上傳時間: 2015-09-23 14:22:58 (UTC+8)
    出版者: 國立中央大學
    摘要: 本篇論文主要研究的主題是語音辨識系統中的特徵值擷取以及特徵參數補償的部分,前者目的是將不同的特徵值做合併,其中將線性預估倒頻譜係數與梅爾倒頻譜係數結合的效果是最佳的,本論文使用高斯型的梅爾濾波器組來取代原本梅爾倒頻譜係數中的三角濾波器組,而經過實驗證實,將線性預估倒頻譜係數與梅爾倒頻譜係數以1:1的方式做合併效果是最好的,除了將特徵參數做合併之外,本論文還利用倒頻譜平均值與變異數正規化法來補償倒頻譜係數並提升整體系統的辨識效果。;This thesis studies the speech feature extracting and feature compensation in speech recognition. Several speech features are selected for combinations. The best one is cascading Linear Prediction Cepstral Coefficients (LPCC) and Mel-Frequency Cepstral Coefficient (MFCC). The MFCCs used here are obtained by utilizing a Gaussian Mel-Frequency band instead of using a triangular filter bank. And by experiments, it is found that the best combination ratio of LPCC and MFCC is 1:1. The thesis also showed that further improved performance is possible if Cepstral Mean and Variance Normalization (CMVN) is added.
    顯示於類別:[電機工程研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML321檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明