姓名 王育任(Yu-Jen Wang) 畢業系所 資訊工程學系
論文名稱 利用 Attentive 來改善端對端中文語篇剖析遞迴類 神經網路系統
(Using Attentive to improve Recursive LSTM End-to- End Chinese Discourse Parsing)
摘要(中) 篇章剖析,可以幫助我們以不同角度來理解文句之間的關係與連結,但篇章剖析的資 料結構目前仰賴人工標記,使得這項技術無法直接被利用在任意篇章中。因此至目前為 止,有許多研究著手於讓電腦能夠自動對篇章進行剖析,並建立出一個完整的剖析樹。以 中文語料庫 CDTB 來說,欲建立完整的篇章剖析程式,其問題主要可以被分成四個,分 別是子句分割、剖析樹建立、子句關係辨識、中心關係辨識。
由於深度學習近幾年發展快速,因此針對篇章剖析的建構方法也從傳統的 SVM, CRF 等,進展到目前已遞迴類神經方式來建構剖析篇章。而在本篇論文中,我們也加入了許多 目前最新的深度學習技術,例如 Attentive RvNN、self-attentive、BERT 等方法,來提高模 型的準確度。
最後,我們成功將每一項任務的 F1 都提高了近 10% 左右,達到目前我們所知研究中 最好的效能。
摘要(英) Discourse parser can help us to understand the relationship and connection between sentences from different angles, but the tree structure data still need to rely on manual marking, which makes this technology cannot be directly used in life. So far, there have been many research studies on automatically construct the complete tree structure on the computer. Since deep learning has progressed rapidly in recent years, the construction method for discourse parser has also changed from the traditional SVM, CRF method to the current recursive neural.
In the Chinese corpus tree library CDTB, the parsing analysis problem can be divided into four main problems, including elementary discourse unit (EDU) segmentation, tree structure construction, center labeling, and sense labeling. In this paper, we use many state-of-the-art deep learning techniques, such as attentive recursive neural networks, self-attentive, and BERT to improve the performance.
In the end, we succeed to increase the accuracy by more than 10% of F1 of each task, reaching the best performance we know so far.
關鍵字(中) ★ 深度學習
★ 篇章剖析
★ 注意力機制
★ 遞迴類神經網路
關鍵字(英) ★ Deep Learning
★ Discourse Parsing
★ Attention
★ Recursive neural network
論文目次 摘要 i
Abstract ii
誌謝 iii
目錄 iv
圖目錄 vi
表目錄 vii
壹、 緒論 1
1.1. 問題定義 2
1.2. 研究動機與目標 4
貳、 相關研究 6
2.1. 篇章剖析語料庫 6
2.1.1. 英文語料庫 6
2.1.2. 中文語料庫 7
2.2. 篇章剖析程式 (Discourse Parser) 8
2.2.1. SVM Base Parser 8
2.2.2. DCRF Base Parser 8
2.2.3. Recursive Deep Models Parser 8
2.2.4. RvNN Chinese Discourse Parser 9
2.2.5. Transition-Based Dependency Parser 12
2.3. 深度學習相關技術 13
2.3.1. Recursive Neural Network (RvNN) 13
2.3.2. Attentive RvNN 15
2.3.3. Self-Attentive Sentence Embedding 16
2.3.4. FastText 16
2.3.5. BERT 16
參、 CDTB語料庫 18
3.1. 子句關係 18
3.2. 隱性關係與顯性關係 20
肆、 模型設計 22
4.1. 子句分割 23
4.2. 文字嵌入與注意力機制 25
4.3. 注意力遞迴類神經網路 26
伍、 實驗 28
5.1. 標準子句實驗 29
5.2. 端對端剖析模型實驗 30
5.3. 二元樹與多元樹比較分析實驗 30
5.4. 二元樹分析實驗 32
5.5. 子句關係分析 33
5.6. 個別實驗數據分析 34
5.6.1. 文字嵌入實驗 34
5.6.2. Self-Attentive 子句效能實驗 34
5.6.3. 多層Attentive RvNN 實驗 35
5.6.4. 子句分割實驗 35
5.7. 學習曲線 36
陸、 結論 37
6.1. 未來展望 37
參考 39
指導教授 張嘉惠(Chia-Hui Chang) 審核日期 2019-8-8
