English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 41625530      線上人數 : 1962
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/76222


    題名: 基於深度智能之口語處理技術( I );Deep Intelligence Based Spoken Language Processing( I )
    作者: 王家慶;張寶基;陳柏琳;曹昱;李宏毅;蔡宗翰;王新民
    貢獻者: 國立中央大學資訊工程系
    關鍵詞: 資訊科學--軟體;口語處理;語音分離;混語辨識;口語翻譯;語音情緒辨識;對話系統;深度學習;Spoken language processing;speech separation;code-switching speech recognition;spoken language translation;speech emotion recognition;dialogue system;deep learning
    日期: 2018-01-01
    上傳時間: 2018-05-02 17:17:44 (UTC+8)
    出版者: 科技部
    摘要: 語音是人類交流最主要也是最自然的方式,而且是人機互動裡最有效的手段。要讓電腦口語處理系統能類似人類一樣無障礙且高度智能地運作,是一個大問題,也是學者們數十年來努力追求的目標。隨著深度學習的成功,上述目標不再遙不可及,為了解決此大問題,本計畫「基於深度智能之口語處理技術」,將以深度學習之技術來研發深度智能的口語處理系統,有效整合訊號處理、聲學處理、語言處理以及深度學習,研發以下五項關鍵技術:智能多通道處理暨混和語音訊號分離、混雜語言語音辨識、口語翻譯、語音情緒辨識、不限領域語音對話。在口語的選擇上,我們將著重在地之國語、閩南語以及客語。
    在智能多通道處理暨混和語音訊號分離方面,本計畫擬建立一深度學習之架構來去除背景噪音、回音、及包含語音在內之干擾音源,藉此增進後端系統之混語辨識效果。在混雜語言語音辨識方面,本計畫首先擬發展中、英、台、客語的單一語言語音辨識,並架構於深度學習之語言模型及聲學模型之上,其後進一步以整體學習發展混雜語言之語音辨識。在口語翻譯方面,本計畫將根據語音辨識之字詞,發展可處理口語不流利狀況之中台、中客、中英的口語互譯系統。在語音情緒辨識方面,我們透過擷取語音與語意之情緒特徵,發展同時考量情緒內部變異性及情緒間重疊性之語音情緒辨識系統。而在語音對話方面,本計畫擬發展具不限領域語言理解及考慮使用者情緒之任務導向型、問答型以及閒聊型三種對話系統。此外,本計畫所發展之口語處理關鍵技術,也將進行在醫療與居家照護場域下的應用研發。
    本計畫以解決機器口語處理這個大問題作為行動目標,結合有志之士並與海內外頂尖實驗室合作,志在研發領先全球之口語處理技術,目標是成立國際級智能口語處理研究中心。除了培育國家人工智慧的頂尖人才之外,所研發之技術與成果也將在國際上佔有舉足輕重的地位,進而帶領國家擺脫Google等美系大廠在相關產業的可能壟斷趨勢,有效提升國家之產業競爭力。
    關聯: 財團法人國家實驗研究院科技政策研究與資訊中心
    顯示於類別:[資訊工程學系] 研究計畫

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML266檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明