姓名 柯伯叡(Bo-Ruei Ke)
論文名稱 結合注意力機制與層標準化的神經網路於股價預測之研究
論文名稱 結合注意力機制與層標準化的神經網路於股價預測之研究
(Combining attention mechanism with layer normalized neural network in stock price forecasting: a case study of electronics industry)
摘要(中) 利用消息面預測未來股價趨勢的過往研究中,許多學者在自然語言的處理上多採用靜態表示方式的詞嵌入方法。為了瞭解動態表示方式的詞嵌入方法是否適用基於消息面訊息的股價預測任務上,本研究蒐集了兩間報社(Barron、Reuters)的資料並以蘋果公司(AAPL)及微軟公司(MSFT)為預測標的,搭配兩種動態表示方式的詞嵌入(Sentence-BERT、BERT)與三種靜態表示方式的詞嵌入方法(paragraph Vector、Word2Vec、TF-IDF),探討不同詞嵌入方法對於結果的影響。此外,有鑑於消息面中每個新聞事件對股價的影響力均不一致,本研究提出一個基於注意力機制與層標準化的長短期記憶模型(Attention mechanism and Layer normalization-based LSTM, AL_LSTM),將注意力集中在股票漲跌貢獻較大的新聞事件上,藉此幫助模型掌握關鍵訊息。本研究發現在整體平均下,詞嵌入方法Sentence-BERT表示消息面時在準確度上有正面的影響,並且最高準確度達69.07%。而本研究提出的AL_LSTM相較於深度學習模型LSTM和機器學習模型SVM,平均在準確度上能分別提升4.27%及6.32%,能有效預測未來股價趨勢的變化。
摘要(英) In previous researches using news to predict future stock price trends, many scholars have adopted the word embedding method of static representation in natural language processing. In order to understand the applicability of the word embedding method of dynamic representation in the task of stock price prediction based on news information. We collected data from two newspapers (Barron, Reuters) and used Apple (AAPL) and Microsoft (MSFT) as the forecast targets, with two dynamic representations of word embedding methods (Sentence-BERT, BERT) and three static representations of word embedding methods (paragraph Vector, Word2Vec, TF-IDF) to explore the impact of different word embedding methods on the prediction performance. In addition, because each news event has a different impact on the stock price trend, this study proposes an Attention mechanism and Layer normalization-based LSTM (AL_LSTM) to focus attention on news events that have a greater contribution to the stock price trend, thereby helping the model understand key information. This study found that under the overall average, using Sentence-BERT as the word embedding method for news messages has a positive effect on accuracy, and the highest accuracy is 69.07%. The accuracy of the AL_LSTM proposed in this study is 4.27% and 6.32% higher than the deep learning model LSTM and the machine learning model SVM, which can effectively predict future stock price changes.
關鍵字(中) ★ Sentence-BERT
★ 動態詞嵌入
★ 注意力機制
★ 層標準化
★ 股價預測
關鍵字(英) ★ Sentence-BERT
★ dynamic word embedding
★ attention mechanism
★ layer normalization
★ stock price prediction
★ attention
論文目次 摘要 i
Abstract ii
誌謝 iii
目錄 iv
圖目錄 vi
表目錄 viii
一、 緒論 1
1-1  研究背景 1
1-2  研究動機 2
1-3  研究目的 3
二、 文獻探討 4
2-1  過往股價預測文獻探討 4
2-2  詞嵌入 5
2-2-1 TF-IDF (Term Frequency-Inverse Document Frequency) 7
2-2-2 Word2Vec 8
2-2-3 PV (Paragraph Vector) 9
2-2-4 BERT (Bidirectional Encoder Representations from Transformers) 10
2-2-5 SBERT (Sentence-BERT) 11
2-3  機器學習、深度學習模型 11
2-3-1 SVM (Support Vector Machine) 13
2-3-2 LSTM (Long Short-Term Memory) 13
2-3-3 注意力機制 (Attention mechanism) 14
2-3-4 層標準化 (Layer normalization) 15
2-3-5 殘差連接 (Residual connections) 16
三、 研究方法 18
3-1  研究數據集 19
3-2  非結構化資料前處理 20
3-3  資料標注 22
3-4  實驗參數設定與方法 22
3-5  評估指標 27
四、 實驗結果與分析 28
4-1  視窗大小於機器學習與深度學習的探討 28
4-1-1 視窗大小於各分類器的影響 28
4-1-2 小結 35
4-2  詞嵌入方法的優劣探討 35
4-3  探討機器學習與深度學習於股票預測結果 40
4-4  報社與公司於股市的影響 43
4-4-1 Barron與Reuters報社在相同公司上的差異 44
4-4-2 AAPL與MSFT公司於報社上的差異 48
4-4-3 小結 52
五、 結論 55
5-1  結論與貢獻 55
5-2  研究限制 56
5-3  未來研究與建議 56
參考文獻 57
指導教授 蘇坤良(Kuen-Liang Su) 審核日期 2021-8-11
