中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/68744
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 41659451      在线人数 : 1870
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/68744


    题名: 改良式梅爾倒頻譜係數混合多種語音特徵之研究;Improved Mel Frequency Cepstral Coefficients Combined with Multiple Speech Features
    作者: 唐曲亮;Tang,Chu-Liang
    贡献者: 電機工程學系
    关键词: 語音辨識;特徵合併;梅爾倒頻譜係數;關鍵詞萃取;speech recognition;feature combination;MFCC;keyword spotting
    日期: 2015-07-13
    上传时间: 2015-09-23 14:22:58 (UTC+8)
    出版者: 國立中央大學
    摘要: 本篇論文主要研究的主題是語音辨識系統中的特徵值擷取以及特徵參數補償的部分,前者目的是將不同的特徵值做合併,其中將線性預估倒頻譜係數與梅爾倒頻譜係數結合的效果是最佳的,本論文使用高斯型的梅爾濾波器組來取代原本梅爾倒頻譜係數中的三角濾波器組,而經過實驗證實,將線性預估倒頻譜係數與梅爾倒頻譜係數以1:1的方式做合併效果是最好的,除了將特徵參數做合併之外,本論文還利用倒頻譜平均值與變異數正規化法來補償倒頻譜係數並提升整體系統的辨識效果。;This thesis studies the speech feature extracting and feature compensation in speech recognition. Several speech features are selected for combinations. The best one is cascading Linear Prediction Cepstral Coefficients (LPCC) and Mel-Frequency Cepstral Coefficient (MFCC). The MFCCs used here are obtained by utilizing a Gaussian Mel-Frequency band instead of using a triangular filter bank. And by experiments, it is found that the best combination ratio of LPCC and MFCC is 1:1. The thesis also showed that further improved performance is possible if Cepstral Mean and Variance Normalization (CMVN) is added.
    显示于类别:[電機工程研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML320检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明