多模態語音辨識技術;Multimodal Speech Recognition Technology

NCU Institutional Repository > 資訊電機學院 > 資訊工程學系 > 研究計畫 > Item 987654321/94227

請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/94227

題名:	多模態語音辨識技術;Multimodal Speech Recognition Technology
作者:	王家慶;黎氏芳
貢獻者:	國立中央大學資訊工程學系
關鍵詞:	語音辨識;多模態語音辨識;聲學模型;掩碼語言模型;向量量化變分自動編碼器;大型語言模型;Speech Recognition;Multimodal Speech Recognition;Acoustic Model;Masked Language Modeling;Vector Quantized Variational Autoencoder;Large Language Model
日期:	2024-09-27
上傳時間:	2024-09-30 17:20:17 (UTC+8)
出版者:	國家科學及技術委員會(本會)
摘要:	多模態語音辨識技術對社會、經濟和學術發展具有廣泛的預期影響性，在社會影響上，本技術使得社交媒體網路服務更易於使用動。在經濟影響上，多模態語音辨識使得智能裝置和服務更易於操作，推動了智能家居、智能手機和虛擬助手的發展，創造新的商業機會。在學術發展上，多模態語音辨識的成功，將拓展多模態辨識研究的範疇。
關聯:	財團法人國家實驗研究院科技政策研究與資訊中心
顯示於類別:	[資訊工程學系] 研究計畫

文件中的檔案:

檔案	描述	大小	格式	瀏覽次數
index.html		0Kb	HTML	32	檢視/開啟

在NCUIR中所有的資料項目都受到原著作權保護.

社群 sharing