姓名 陳俞琇(Yu-Xiu Chen)  查詢紙本館藏   畢業系所 資訊管理學系
論文名稱 具擷取及萃取能力的摘要模型
摘要(中) 自然語言處理的模型由於需要準備字典給模型做挑選,因此衍生出 Out Of Vocabulary(OOV) 這個問題,是指句子裡面有不存在於字典的用詞,過往有人嘗試在 Recurrent Neural Networks(RNN) 上加入複製機制,以改善這個問題。但 Transformer 是自然語言處理的新模型,不若過往的 RNN 或 Convolutional Neural Networks(CNN) 已經有許多改善機制,因此本研究將針對 Transformer 進行改良,添加額外的輸入和輸 出的相互注意力,來完成複製機制的概念,讓 Transformer 能有更佳的表現。
摘要(英) In natural language processing, Out of Vocabulary(OOV) has always been a issue. It limits the performance of summarization model. Past study resolve this problem by adding copy mechanism to Recurrent Neural Networks(RNN). However, resent study discover a new model – Transformer which outperforms RNN in many categories. So, this work will improve Transformer model by adding copy mechanism in order to enhance the relation of model’s input and output result..
關鍵字(中) ★ 自然語言處理
★ 萃取式摘要
★ 注意力機制
★ Transformer
★ 複製機制
論文目次 摘要 i
Abstract ii
誌謝 iii
目錄 iv
圖目錄 vii
表目錄 viii
一、 緒論 1
1-1 研究背景 1
1-2 研究動機 2
1-3 研究目的 3
1-4 文章架構 3
二、 文獻 5
2-1 摘要類型 5
2-2 Encoder-Decoder 模型 6
2-3 Recurrent Neural Networks 7
2-3-1 Long Short-Term Memory 8
2-3-2 RNN的 Encoder-Decoder 模型 9
2-3-3 注意力機制 10
2-4 複製機制 11
2-4-1 CopyNet 12
2-4-2 Generator/Pointer Switch 14
2-4-3 Pointer-Generator 15
2-4-4 複製機制總整理 16
2-5 Transformer 17
2-5-1 與過往模型的比較 18
三、 研究方法 20
3-1 研究架構 20
3-2 資料集處理 20
3-3 模型 22
3-3-1 多向注意力機制 23
3-3-2 前饋網路 24
3-3-3 注意力分佈 24
3-3-4 Pgen 25
3-3-5 標準化 25
3-3-6 最終輸出 26
3-4 評估結果 26
四、 實驗結果與討論 29
4-1 資料集 29
4-2 實驗環境 30
4-3 實驗設計 30
4-3-1 實驗一:與過往模型之比較 30
4-3-2 實驗二:消融測試之 Norm 模組 32
4-3-3 實驗三:消融測試之 Pgen 模組 33
4-3-4 實驗四:輸入長度測試 34
五、 結論與未來研究方向 36
5-1 結論 36
5-2 資料來源:本研究研究限制 37
5-3 未來研究方向 37
參考文獻 38
指導教授 林熙禎 審核日期 2019-7-19
