姓名 林佳蒼(Chia-Tsang Lin)  查詢紙本館藏   畢業系所 資訊管理學系
論文名稱 多向注意力機制於翻譯任務改進之研究
摘要(中) 機器翻譯是自然語言處理中熱門的研究主題之一,歷年來都有許多模型被提出,其中Transformer運用多向注意力(Multi-head Attention)機制大幅提升了機器翻譯的準確度,但多數研究卻還是專注在模型的創新及架構的調整,而不是對原生的Transformer進行優化,因此本研究將針對Transformer中的多向注意力進行改良,以遮罩的方式在不增加訓練參數及訓練時間的情況下,增加注意力機制學習輸入句子小區資訊的能力,讓Transformer能在中英翻譯任務上提升3.6~11.3%的準確率,德英翻譯任務上提升17.4%的準確率。
摘要(英) Neural Machine Translation (NMT) is one of the popular research topics in Natural Language Processing (NLP). Lots of new model have been proposed by researchers throughout the world each year. Recently, a model called Transformer, which uses only attention mechanism, outperforms a lot of model in NMT. Most research on this model focus on model innovation, but not adjusting the original model itself. Therefore, this work will modify the Multi-head Self-Attention module used in this model to better learn the information about the input. The result increases the performance of the model by 3.6 to 11.3% BLEU score on Chinese-English translation and 17.4% BLEU on Dutch-English translation.
關鍵字(中) ★ 自然語言處理
★ 機器翻譯
★ 注意力機制
★ Transformer
關鍵字(英) ★ Natural Language Processing
★ Machine Translation
★ Attention mechanism
★ Transformer
論文目次 摘要 I
Abstract II
目錄 III
一、 前言 1
1-1 研究背景 1
1-2 研究動機 2
1-3 研究目的 3
1-4 文章架構 3
二、 文獻探討 4
2-1 編解碼器架構 4
2-1-1 RNN Sequence-to-Sequence模型 5
2-2 Transformer模型 8
2-3 注意力機制 9
2-3-1 注意力機制的發展 10
2-3-2 多向注意力機制 12
2-3-3 多向注意力機制的表現 13
三、 研究方法 15
3-1 資料前處理 15
3-2 翻譯模型 17
3-2-1 詞向量 18
3-2-2 Add & Norm 18
3-2-3 Feed Forward 19
3-2-4 混和多向自注意力機制 19
3-2-5 輸出結果 21
3-3 結果評估 22
四、 實驗 23
4-1 實驗環境 23
4-2 實驗設計 24
4-2-1 實驗一:最佳N-gram參數 24
4-2-2 實驗二:混和多向注意力之結果 25
4-2-3 實驗三:德英語言翻譯任務之表現 27
4-2-4 實驗四:實例探討 28
五、 結論與未來方向 32
5-1 結論 32
5-2 研究限制 32
5-3 未來研究方向 32
參考文獻 34
指導教授 林熙禎(Shi-Jen Lin) 審核日期 2020-7-20
