中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/94227
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 40304323      在线人数 : 368
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/94227


    题名: 多模態語音辨識技術;Multimodal Speech Recognition Technology
    作者: 王家慶;黎氏芳
    贡献者: 國立中央大學資訊工程學系
    关键词: 語音辨識;多模態語音辨識;聲學模型;掩碼語言模型;向量量化變分自動編碼器;大型語言模型;Speech Recognition;Multimodal Speech Recognition;Acoustic Model;Masked Language Modeling;Vector Quantized Variational Autoencoder;Large Language Model
    日期: 2024-09-27
    上传时间: 2024-09-30 17:20:17 (UTC+8)
    出版者: 國家科學及技術委員會(本會)
    摘要: 多模態語音辨識技術對社會、經濟和學術發展具有廣泛的預期影響性,在社會影響上,本技術使得社交媒體網路服務更易於使用動。在經濟影響上,多模態語音辨識使得智能裝置和服務更易於操作,推動了智能家居、智能手機和虛擬助手的發展,創造新的商業機會。在學術發展上,多模態語音辨識的成功,將拓展多模態辨識研究的範疇。
    關聯: 財團法人國家實驗研究院科技政策研究與資訊中心
    显示于类别:[資訊工程學系] 研究計畫

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML16检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明