論文名稱 基於雙層詞性序列對序列模型之對話機器人
(Chatbot based on two layer parts-of-speech Seq2Seq Model)
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]
摘要(中) 對話機器人的智能應答,除可提供快速的客戶服務,亦可以幫助企業節省大量人力,所以提供這樣的服務也代表企業的一種競爭優勢。但其效能調校工作常需耗費時間及人力成本進行維護。我們希望可以提供一種生成式對話機器人,透過深度學習大量資料建立一種自然生成對話的模型。為了提高對話機器人的回覆準確率,我們在機器訓練過程中加入了詞性維度。藉由詞性,讓機器學習了解一個句子的結構及文法,在組成答句時,能夠更貼近人類的語言。
摘要(英) In this paper, I develop a deep learning model to build a chatbot. To improve the response accuracy of the chatbot, I added the parts-of-speech dimension in the model to make the machine can learn the structure and grammar of a sentence.
This research is based on GRU Seq2Seq framework, adding parts-of-speech dimension and generate 4 new models for comparison.
According to the evaluation results, the three models of the 1hPosSeq2Seq Model, CVPoSSeq2Seq Model, and 2LPoSSeq2Seq Model all have higher performance than the benchmark sequence-to-sequence framework. Among them, the performance of the LPoSSeq2Seq model is the most superior, with a performance improvement of 40.08 %.
關鍵字(中) ★ 對話機器人
★ 詞性
★ 序列對序列
論文目次 學位論文授權書 i
論文指導教授推薦書 ii
論文口試委員會審定書 iii
中文摘要 iv
Abstract v
誌謝 vi
目錄 vii
圖次 x
表次 xii
Chapter 1 緒論 1
1.1 研究背景 1
1.2 研究動機與目的 2
1.3 研究貢獻 3
1.4 論文架構 3
Chapter 2 文獻探討 5
2.1 預先訓練之詞向量(詞嵌入) 5
2.2 序列對序列於對話機器人運用現況 5
2.3 詞性在序列對序列之應用 6
2.4 對話機器人技術現況探討 7
Chapter 3 研究方法 9
3.1 詞嵌入 9
3.1.1 連續詞袋模型(Continuous Bag of Words, CBOW) 12
3.1.2 跳躍式模型(Skip-gram) 13
3.2 條件式的遞歸神經網路(Conditional RNN) 14
3.2.1 長短期記憶體(Long Short-term Memory, LSTM) 14
3.2.2 門控遞迴單元(Gate Recurrent Unit, GRU) 16
3.3 詞性序列對序列模型 18
3.3.1 編碼器/解碼器 19
3.3.2 注意力機制 19
3.3.3 詞性Seq2Seq模型建立 21
3.3.4 獨熱詞性序列對序列模型 21
3.3.5 常數向量詞性序列對序列模型 22
3.3.6 雙層詞性神經網路對序列模型 23
3.3.7 雙層詞性序列對序列模型 24
3.4 模型訓練評估 25
3.4.1 分類交叉熵損失函數(Categorical Crossentropy loss function) 26
3.4.2 困惑度(Perplexity) 26
3.4.3 雙語言評估互補(Bi-Lingual Evaluation Understudy, BLEU) 27
Chapter 4 研究結果分析 29
4.1 資料集 29
4.2 實驗設計 31
4.2.1 四種新Seq2Seq模組 31
4.3 實驗參數討論 35
4.3.1 Batch size 35
4.3.2 隱藏層神經元數量之影響 37
4.3.3 資料亂序 38
Chapter 5 結論 40
5.1 研究結果 40
5.2 研究發現 40
5.3 研究限制 42
5.4 未來研究與建議 42
參考文獻 45
附錄 50
結巴詞性 50
對話機器人介面 51
指導教授 陳以錚(Yi-Cheng Chen) 審核日期 2020-7-28
