姓名 莊以珺(Yi-Chun,Chuang)
論文名稱 可客製化的探索性資料分析平台初探—以台股市場為例
論文名稱 可客製化的探索性資料分析平台初探—以台股市場為例
(Exploring A Customizable Exploratory Data Analysis Platform - A Case Study in the Taiwan Stock Market)
摘要(中) 如何制定與驗證有效的投資策略一直是金融科技領域持續討論的焦點之一。在制定策略之前,從眾多因素中挑選出合適的因子是一項繁瑣的工程。若投資者能夠先對資料進行有系統的綜覽,了解資料的潛在趨勢,將能更有效率地制定投資策略。
摘要(英) How to formulate an effective investment strategy has always been a focal point in the financial technology field. Before devising a strategy, selecting suitable factors from numerous considerations is a meticulous task. If investors can systematically overview the data and understand its underlying trends, they can formulate investment strategies more efficiently.
To achieve this goal, this study proposes an Exploratory Data Analysis (EDA) platform. Through a filtering tool for preliminary screening, we can narrow down the scope of discussions. The trends of stock-related factors are presented visually by means of statistical charts, such as heatmaps, scatter plots, box plots, Facegrid composite plots, etc. This helps inexperienced investors in choosing the direction of factors and assists experienced investors in optimizing their strategies. To cater to investors′ personalized investment preferences, we provide customization options. Investors can customize analysis factors, set analysis parameters, analyze charts, and use XML to navigate the process, creating a personalized investment strategy research approach.
This study demonstrates how to obtain visual information on potential factors through the following three aspects: fundamental, technical, and chip. Users can integrate this tool with other backtesting platforms to ultimately establish the most suitable investment strategy.
關鍵字(中) ★ 探索性分析
★ 投資因子篩選
★ 交易策略擬定
關鍵字(英) ★ EDA
★ Exploratory Data Analysis
★ Investment Factor Screening
★ Trading Strategy Formulation
論文目次 目錄
一、 緒論 1
1.1 研究背景 1
1.2 研究動機 2
1.3 研究目的 4
二、 文獻探討 5
2.1 量化交易 5
2.2 資料探勘跨領域標準流程(Cross-industry standard process for data mining, CRISP-DM) 5
2.2.1 時間序列資料(Time series data) 7
2.2.2 探索性分析(Exploratory Data Analysis, EDA) 7
2.2.3 特徵選擇器 8
2.3 統計圖表 8
2.3.1 熱力圖(Heatmap) 9
2.3.2 旭日圖(Sunburst Chart) 9
2.3.3 直方圖(Histogram) 10
2.3.4 直方+折線圖(displot) 11
2.3.5 箱形圖(box plot) 12
2.3.6 計數圖(countplot) 12
2.3.7 小提琴圖(Violin Plot) 13
2.3.8 散布圖(scatter plot) 14
2.3.9 線性回歸圖(regplot) 14
2.3.10 Pairplot 15
2.3.11 泡泡圖(Bubble Chart) 16
2.3.12 Facegrid圖表 16
2.4 平台操作介面與視覺化工具 17
三、 系統設計與實作 18
3.1 系統架構 18
3.2 資料庫設計 21
3.2.1 資料表設計 21
3.2.2 候選因子 28
3.3 系統流程 29
3.3.1 模組運作流程-資料分析及初覽 29
3.3.2 整合後的資料結構 32
3.3.3 模組運作流程-繪製視覺化圖表 33
3.4 客製化參數 35
3.4.1 XML參數化 36
3.4.2 濾網參數提供 36
3.4.3 客製化候選因子 37
3.4.4 客製化圖表參數 39
四、 系統驗證與分析 43
4.1 實驗變數 43
4.1.1 資料來源 43
4.1.2 目標變數說明 43
4.2 實驗設計 43
4.2.1 實驗流程 43
4.2.2 實驗環境 44
4.3 實驗結果 44
4.3.1 實驗一 雙率雙升濾網(基本面) 44
4.3.2 實驗二-籌碼面 55
4.3.3 實驗三-技術面 63
五、 結論 72
5.1 結論 72
5.2 研究限制 72
5.3 未來建議 73
參考文獻 74
附錄一、可分析候選因子清單 76
指導教授 許智誠(Jyh-Cheng Hsu) 審核日期 2024-7-31
