以RSS演算法挖掘股市交易資料之研究

以作者查詢圖書館館藏

、以作者查詢臺灣博碩士

、以作者查詢全國書目

、勘誤回報

、線上人數：15

、訪客IP：18.224.33.223

姓名

陳柏翰(Bong-Han Chang ) 查詢紙本館藏

畢業系所

資訊管理研究所

論文名稱

以RSS演算法挖掘股市交易資料之研究

相關論文

★ 應用灰色理論於有機農產品之經營管理— 需求預測及關鍵成功因素探討	★ NAND型Flash價格與交運量預測在風險分析下之決策模式
★ 工業電腦用無鉛晶片組最適存貨政策之研究-以A公司為例	★ 砷化鎵代工廠磊晶之最適存貨管理-以W公司為例
★ 資訊分享&決策制定下產銷協同關係之研究 -以IC設計業為例	★ 應用分析層級法於電子化學品業委外供應商評選準則之研究
★ 應用資料探勘於汽車售服零件庫存滯銷因素分析-以C公司為例	★ 多目標規劃最佳六標準差水準: 以薄膜電晶體液晶顯示器C公司製造流程為例
★ 以資料探勘技術進行消費者返廠定期保養之實證研究	★ 以價值鏈觀點探討品牌公司關鍵組織流程之取決-以S公司為例
★ 應用產銷協同規劃之流程改善於化纖產業-現況改善與效益分析	★ 權力模式與合作關係對於報價策略之影響研究—以半導體產業A公司為例
★ 應用資料探勘於汽車製造業之庫存原因分析	★ 以類神經網路預測代工費報價---以中小面板產業C公司為例
★ 電路板產業存貨改善研究-以N公司為例	★ 運用六標準差改善機台備用零件(Spare parts)存貨管理

檔案

[Endnote RIS 格式]

[Bibtex 格式]

[相關文章]

[文章引用]

[完整記錄]

[館藏目錄]

[檢視]

[下載]

本電子論文使用權限為同意立即開放。
已達開放權限電子全文僅授權使用者為學術研究之目的，進行個人非營利性質之檢索、閱讀、列印。
請遵守中華民國著作權法之相關規定，切勿任意重製、散佈、改作、轉貼、播送，以免觸法。

摘要(中)

資料挖礦技術被稱為對資料作最佳的應用，它是一個新的研究領域，其目的在於透過自動化處理，從大量的資料中，挖掘出隱藏在其中的有用資訊、樣式，以對決策階層有所幫助。目前不論是在科學上或商業上，均大量使用資料挖礦的技術，來尋找出有用的規則、資訊，以幫助科學家或決策者進行正確的決策，且已有不錯的應用成效。
本論文主要是以約略集合（Rough Set）的方法，及資料挖掘技術中的關連規則的方法為基礎，發展出適合多屬性序列資料的演算法--RSS（Rough Set Sequence）演算法。此演算法先對所有的條件屬性進行篩選，只剩下最重要的條件屬性，而後再進行大集合序列的挖掘，最後在進行特徵關連的挖掘。而在本論中，我們以股市交易資料為例，將可能影響公司股價當作條件屬性，而將公司股價漲跌情形當作是決定屬性。由於造成股價漲跌情形的因素眾多，但實際上，某些因素可能對甲公司而言，其影響程度較為嚴重，但對乙公司而言，其影響程度可能較為輕微，例如，在本論中討論到影響股價漲跌的八個因素，並非每個屬性都有絕對的影響，因此我們在進行序列關連規則的挖掘前，先將對決策屬性有重要影響的條件屬性找出，過濾掉對決策屬性無幫助的條件屬性，接著再進行序列樣式的尋找，找出最長的序列樣式後，最後進行關連規則的尋找。

關鍵字(中)

★ 序列樣式
★ 約略集合
★ 資料挖掘
★ 關連規則

關鍵字(英)

論文目次

目錄
第1章緒論………………………………………………………………1
第1節研究動機…………………………………………………………1
第2節研究目的…………………………………………………………2
第3節研究方法…………………………………………………………2
第4節論文架構…………………………………………………………3
第2章文獻探討-………………………………………………………-4
第1節資料挖礦…………………………………………………………4
第2節約略集合(ROUGH SET) ……………………………………-19
第3節股價分析方法…………………………………………………-22
第4節時間數列分析、類神經網路與資料挖掘技術的比較…23
第3章資料結構………………………………………………………-27
第1節多屬性序列資料………………………………………………-27
第2節屬性值的分割…………………………………………………-30
第4章演算法…………………………………………………………-38
第5章系統實作………………………………………………………-54
第1節系統環境…………………………………………………………54
第2節系統介面與流程………………………………………………-55
第3節規則檢驗…………………………………………………………62
第6章結論與建議………………………………………………………67
第１節結論與貢獻…………………………………………………-67
第２節未來研究方向與建議………………………………………-68
參考文獻………………………………………………………………………69
圖
圖2-1 Algorithm Aprior……………………………………………………6
圖2-2 apriori-gen function………………………………………………6
圖2-3 交易資料庫……………………………………………………………7
圖2-4 候選項目集合與大項集合的產生……………………………………8
圖2-5 屬性City的概念階層………………………………………………-10
圖2-6 敘述型概念階層之範例………………………………………………12
圖2-7 約略集合圖示…………………………………………………………21
圖2-8 類神經網路單元之模型………………………………………………24
圖3-1 成交周轉率……………………………………………………………31
圖3-2 報酬率…………………………………………………………………31
圖3-3 本益比…………………………………………………………………32
圖3-4 三月期定期利率………………………………………………………32
圖3-5 失業率…………………………………………………………………33
圖3-6 CPI指數………………………………………………………………-33
圖3-7 匯率……………………………………………………………………34
圖3-8 貨幣供給平均年增率…………………………………………………34
圖3-8 領先指標綜合指數……………………………………………………35
圖3-8 重貼現率………………………………………………………………35
圖3-8 痛苦指數………………………………………………………………36
圖4-1 RSS演算法-主程式-…………………………………………………-39
圖4-2 RSS演算法─Cclassification-………………………………………-40
圖4-3 多屬性序列關連規則…………………………………………………53
圖5-1 系統流程………………………………………………………………56
圖5-2 系統主畫面……………………………………………………………57
圖5-3 使用者選擇欲觀看的電子公司及門檻值和信度之設定……………58
圖5-4 進行屬性篩選後之畫面…………………………………………-…-59
圖5-5 產生序列樣式之畫面…………………………………………………60
圖5-5 產生關連規則之畫面…………………………………………………61
表
表2-1 一個學校員工的範例資料庫範例……………………………………11
表2-2 去掉無法歸納的屬性的範例資料庫…………………………………13
表2-3 經過歸納之後的範例資料庫…………………………………………13
表2-4 範例資料庫之特性規則………………………………………………13
表2-5 排序後的交易資料庫…………………………………………………15
表2-6 顧客購買序列…………………………………………………………15
表2-7 大項集合………………………………………………………………16
表2-8 轉換後的資料庫………………………………………………………16
表2-9 Candidate Generation………………………………………………17
表2-10 病人症狀紀錄…………………………………………………………20
表2-11 時間數列分析、類神經網路與資料挖掘的比較……………………25
表3-1 影響股價漲跌因素……………………………………………………29
表3-2 將屬性值轉換成所對應的區間………………………………………37
表4-1 通過門檻值的tuples，並將之編號………………………………-43
表4-2 移除屬性成交周轉率的資料表………………………………………44
表4-3 移除屬性三月期定期利率的資料表…………………………………45
表4-4 刪除掉dispensable屬性的資料表……………………………………46
表4-5 LSS1……………………………………………………………………47
表4-6 CSS2……………………………………………………………………48
表4-7 LSS9……………………………………………………………………49
表4-8 LSS10-…………………………………………………………………50
表5-1 檢驗結果………………………………………………………………62
表5-2 A公司的規則一-………………………………………-……………63
表5-3 A公司的規則二………………………………………………………63
表5-4 B公司的規則一………………………………………………………64
表5-5 C公司的規則一………………………………………………………64
表5-6 D公司的規則一-………………………………………-……………65
表5-7 D公司的規則二………………………………………………………65
表5-8 D公司的規則三………………………………………………………66

參考文獻

[1] Agrawal, Rakesh and Ramakrishnan Srikant, “Fast Algorithms for Mining Association Rules,” Proc. of the 20th VLDB Conference Santiago, Chile, 1994.
[2] Agrawal, Rakesh and R. Srikant, “Mining Sequential Patterns,” Proc. of the Int’l Conference on Data Engineering, Taipei, Taiwan, March 1995.
[3] T. Y. LIN and N.Cercone, “Rough Sets and Data Mining”
[4] Chen, Ming-Syan, J. S. Park, and Philip S. Yu, “Efficient Data Mining for Path Traversal Patterns,” IEEE Transactions on Knowledge and Data Engineering, Vol.0, No. 2, pp.209-221, 1998.
[5] Chen, Ming-Syan, Jiawei Han and Philip S. Yu, “Data mining: An Overview from a Database Perspective,” IEEE Transactions on Knowledge and Data Engineering, Vol. 8, No.6, December 1996.
[6] Carter, Colin L. and Howard J. Hamilton, “Efficient Attribute-Oriented Generalization for Knowledge Discovery from Large Databases,” Member, IEEE Computer, Transactions on knowledge and data engineering, Vol 10, No. 2, March/April 1998.
[7] Germano Lanbert-Torres, Alexandre P. Alves da Silva, “Classification of Power Operation Point Using Rough Set Techniques,” IEEE 1996
[8] Germano Lanbert-Torres, Alexandre P. Alves da Silva, “Knowledge-Base Reduction Based on Rough Set Techniques,” IEEE 1996
[9]Shusaku Tsumoto, ” Automated Discovery of Positive and Negative Knowledge in Clinical Databases,” IEEE. Engineering in Medicine and Biology, July/August 2000
[10] Gary, Jim, Adam Bosworth, Andrew Layman and Hamid Pirahesh, “Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals,” IEEE 1996.
[11] Han, Jiawei, Yandong Cai and Nick Cercone, “Knowledge discovery in databases: An attribute-oriented approach,” In Proc. 18th Int. Conf. Very Large Data Bases, Page 547-559, Vancouver, Canada, August 1992.
[12] Carter C.L. , Hamilton R. J. ,”Efficient attribute-oriented generalization for knowledge discovery from large databases,” Knowledge and Data Engineering, IEEE Transactions on,Volume: 10 Issue:2,March-April 1998,pp 193-208
[13] H. Lu, J.Han, and L. Feng,”Stock Movement and N-Dimensional Inter-Transaction Association Rules,” Proc. Of 1998 SIGMOD’96 Workshop on Research Issues on Data Mining and Knowledge Discovery(DMKD’98), Seattle, Washington, June 1998,pp12:1-12:7
[14] Robert H. Golan, Wojciech Ziarko,”A Mothodology for Stock Market Analysis utilizing Rough Set Theory”,IEEE 1995.
[15] Xiaohua Hu, Cercone H. ,”Mining knowledge rules from databases : a rough set approach,” Data Engineering,1996.Proceedings of the Twelfth International Conference on , 1996, pp96-105.
[16] Kaufman, L. and P. J. rousseeuw, “Finding Groups in Data : An Introduction to Cluster Analysis,” John Wiley and Sons, 1990.
[17] R. Agrawal,S. Ghosh,T. Imielinski,B. Iyer,A. Swami,”An Interval Classifier for Database Mining Application ,”Proc. Of 18th Int’l Conference onVery Large Databases,Vancouver,Aug. 1992,pp560-573
[18] J. Han,J. Pei, and Y.Yin,”Mining Frequent Patterns without Candidate Generation,” Proc. 2000 ACM-SIGMOD Int. Conf. On Management of Data(SIGMOD’00), Dallas,TX, May 2000
[19] Ng, R. and Jiawei Han , “Efficient and Effective Clustering Method for Spatial Data Mining,” Proc. Int’l Conf. Very Large Data Bases, pp. 144-155, Santiago, chile, Step. 1994.
[20].Heikki Mannila, Hannu Toivonen, and A. Inkeri Verkamo,”Discovery of frequent episodes in event sequences,” Data Mining and Knowledge Discovery ,1(3) : pp259-289,Novermber 1997.
[21] Quinlan, J. Ross, “Simplifying Decision Trees,” Int. J. Man-Machine Studies, 27, 1987, pp. 221-234.
[22] Srikant, R. and R. Agrawal, “Mining Quantitative Association Rules in Large Relational Tables,” SIGMOD 1996, pp.1-12.
[23] Mohammed J. Zaki, Neal Lesh, Mitsunori Ogihara,”PlanMine : Predicting Plan Failures using Sequence Mining ,” Artifical Intelligence Review, special issue on the Application of Data Mining, 1999
[24]Jiawei Han, Micheline Kamber, ”Data Mining:Concepts and Techniques,”
[25]C.Bettini,X. S. Wang, S. Jajodia, J.-L. Lin, “Discovering frequent event patterns with multiple granularities in time sequences,” IEEE Trans. On Knowledge and Data Engineering, Volume: 10 Issue :2, 1998 ,pp. 222-237.
[26]George H. John,Stanford University and IBM Peter Miller,Lockhead Martin Corporation Randy Kerber, “Stock Selection Using Rule Induction,” IEEE, 1996
[27] B. Wuthrich,V. Cho, S. Leung, D. Permunetilleke, K. Sankaran, J. Zhang, W.Lam,”Daily Stock Market Forecast from Textual Web Data,”
[28]Brealey Myers, ”Principles of Corporate Finance,” McGraw-Hill
[29]陳智宗,陳振明,許秉瑜,”以資料挖礦法挖掘多屬性序列式資料規則之研究”,中大資管所碩士論文,民89
[30]何鄭陵,”證券投資-產經分析”,華泰書局,民76
[31]張振魁,陳稼興,”以類神經網路提高股票單日交易策略之獲利”,中大資管所碩士論文,民89

指導教授

陳振明(Jen-ming Chen)

審核日期

2001-6-26

推文