不連續序列資料挖掘之研究—以股市為例

以作者查詢圖書館館藏

、以作者查詢臺灣博碩士

、以作者查詢全國書目

、勘誤回報

、線上人數：64

、訪客IP：18.190.253.56

姓名

黃盈彬(Ying-Pin Huang) 查詢紙本館藏

畢業系所

資訊管理學系

論文名稱

不連續序列資料挖掘之研究—以股市為例

相關論文

★ 由組織層面探討軟體程序成熟度	★ 線上溝通平台融入概念圖合作學習之比較研究
★ 線上討論一定就會更好嗎？探討影響群體創造知識過程中知識分享與知識採用因素之研究	★ 群體決策支援系統對團隊績效之影響-以時間壓力為調節因素
★ 在文化差異下，探討創新協同合作工具針對不同任務性質之績效	★ Icon辨識與其設計屬性之關聯性探討
★ 創新協同合作工具之先導因素對績效的影響：強調工具特性與科技特性	★ 以物件導向塑模未來研究方法配適於前瞻研究之系統架構
★ 在匈牙利文化下，探討Icon之設計屬性、主觀熟悉及辨識對其吸引力之影響	★ Icon設計屬性吸引力與情感、支配性認知、意義性認知之影響探討以匈牙利樣本為例
★ 在中國大陸文化下，Icon辨識、主觀熟悉與設計屬性對下載意願之關聯性探討	★ 探討網路交友平台使用者之交友機制使用意圖─以Dcard為例
★ 捷運乘客舒適度調查分析以台北高運量板南-土城線為例	★ 時依性路段暨時窗限制下單一車輛路線問題之研究
★ 飛航組員及客艙組員影響溝通協調關鍵因素之研究	★ 廢棄機車回收廠區位選址之研究

檔案

[Endnote RIS 格式]

[Bibtex 格式]

[相關文章]

[文章引用]

[完整記錄]

[館藏目錄]

[檢視]

[下載]

本電子論文使用權限為同意立即開放。
已達開放權限電子全文僅授權使用者為學術研究之目的，進行個人非營利性質之檢索、閱讀、列印。
請遵守中華民國著作權法之相關規定，切勿任意重製、散佈、改作、轉貼、播送，以免觸法。

摘要(中)

資料挖掘是在資料庫中找尋時常發生的既定規則，利用資料挖掘的技術，可以在大量的交易資料中挖掘出有趣的規則或是特性，這些規則或是特性可以提供我們做為決策參考之用。
以往在多屬性序列式資料的研究中，僅在挖掘具有連續性的序列樣式，對於不連續的序列樣式並無太多的論述。而本論文以LSS演算法為基礎，發展出適合多屬性序列式資料的DSS（Discontinuous Set of Sequence）演算法，並且改善了LSS演算法不能挖掘出不連續序列的特性。此演算法利用模糊集合的概念，將具有連續性的數值屬性轉換適合的語意，再利用DSS演算法的區間搜尋的方式，使得其不但可以找出連續性的序列樣式，也可以找出不連續的序列樣式，最後利用股市的資料來驗證此演算法的可行性。

關鍵字(中)

★ 資料挖掘
★ 關連規則
★ 多屬性序列式資料
★ 不連續序列

關鍵字(英)

★ Data Mining

論文目次

第一章緒論 1
第一節研究動機 1
第二節研究目的 2
第三節研究範圍 3
第四節論文架構 3
第二章文獻回顧 5
第一節資料挖掘 5
第一小節挖掘關聯規則 6
第二小節資料歸納法 9
第三小節序列資料挖掘 14
第二節多屬性序列式資料 15
第三節模糊集合 16
第四節股價分析法 21
第三章多屬性序列式資料結構 23
第一節原始資料 23
第二節屬性值切割 25
第四章演算法 32
第一節門檻值定義 32
第二節序列集合 33
第三節 DSS演算法 34
第四節推導後的關聯規則型式 37
第五章系統實驗 40
第一節系統介紹 40
第二節系統介面 41
第三節產生序列樣式 42
第四節規則檢驗 46
第六章結論與建議 54
第一節結論與貢獻 54
第二節未來研究方向與建議 55
參考文獻 56
表1-1 某序列樣式 2
表2-1 Database D 7
表2-2 pass1 C1與L1 7
表2-3 pass2 C2與L2 8
表2-4 pass 3 C3與L3 8
表2-5 原始資料表, 資料來源[7] 11
表2-6 過濾Graduate屬性, 資料來源[7] 12
表2-7 移除屬性Name, 資料來源[7] 12
表2-8 累加vote值, 資料來源[7] 13
表2-9 資料來源[7] 13
表2-10 資料來源[25] 18
表2-11 資料來源[24] 22
表3-1 各指標的語意 26
表3-2 某上市公司之股市原始資料 29
表3-3 轉換成技術指標 30
表3-4 轉換成語意變數 31
表4-1 1B1C1G 38
表4-2 1B1C1G®1D 38
表4-3 1B1C1G 38
表4-4 1B1C1G®1D 39
表5-1 計算出所有的類別支持度 42
表5-2 去除掉未過門檻值的類別 43
表5-3 第一回合的（L1） 44
表5-4 第三回的候選序列 45
表5-5 某公司的關聯規則 47
表5-6 訓練資料中出現1Y的次數分布 47
表5-7 測試資料中出現1Y的次數分布 48
表5-8 卡方齊一性檢定 48
表5-9 A公司序列為5的關聯規則 49
表5-10 B公司序列為5的關聯規則 49
表5-11 C公司序列為5的關聯規則 49
表5-12 A公司的序列 50
表5-13 B公司的序列樣式 51
表5-14 B公司的序列樣式(續) 52
表5-15 C公司的序列樣式 53
圖2-1 Apriori 演算法 7
圖2-2 屬性City 的概念階層 10
圖2-3 某大學學生的原始概念階層, 資料來源[7] 11
圖2-4 電流的明確集合 17
圖2-5 體溫的模糊集合 18
圖2-6 以明確集合與模糊集合分別定義“天氣舒適度” 19
圖2-7 四種標準歸屬函數資料來源[13] 20
圖2-8 天氣舒適度的標準歸屬函數 20
圖3-1 相對強弱指標 26
圖3-2 心理線 27
圖3-3 乖離率 27
圖3-4 買賣氣勢指標 28
圖3-5 量強弱指標 28
圖4-1 L1 JION L1 33
圖4-2 DSS演算法 36
圖5-1 系統流程 40
圖5-2 系統主畫面 41

參考文獻

參考文獻
[1] R. Agrawal and R. Srikant, “Fast Algorithms for Mining Association Rules,” Proc. of the 20th Int’’l Conference on Very Large Databases, Santiago, Chile, Sept. 1994.
[2] R. Agrawal, T. Imielinski, and A. Swami, “Mining association rules between sets of items in large database,” SIGMOD 93, pp. 207-216.
[3] M. -S. Chen, J. Han, and P. S. Yu , “Data Mining：An Overview from a Database Perspective,” IEEE Transactions on Knowledge and Data Engineering, vol.8 , no. 6,1996, pp. 866-883.
[4] R. Agrawal, T. Imielinski, and A. Swami, “Mining association rules between sets of items in large database,” SIGMOD 93, pp. 207-216.
[5] J. C. Bezdek, “Pattern Recognition with Fuzzy Objective Function Algorithms,” Plenum, New York, 1981.
[6] R. Agrawal and R. Srikant, “Fast Algorithms for Mining Association Rules,” Proc. of the 20th Int’’l Conference on Very Large Databases, Santiago, Chile, Sept. 1994.
[7] Y. Cai, N. Cercone, and J. Han, “Attribute-Oriented Induction in Relational Databases,” Knowledge Discovery in Databases ,Ch 12, AAAI/MIT Press,1991.
[8]Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques,”2001.
[9] R. Srikant, R. Agrawal, “Mining Generalized Association Rules,” Proc. 21st VLDB Conf. Zurich, Swizerland, 1995.
[10] R. Agrawal and R. Srikant, “Mining Sequential Patterns,” Proc. of the Int’’l Conference on Data Engineering (ICDE), Taipei, Taiwan, March 1995.
[11] V. Harinarayan, J. D. Ullman, and A. Rajaraman, “Implementing Data Cubes Efficiently,” Proc. 1996 ACM SIGMOD Int’l Conf. Management Data, pp.205-216, Montreal, Canada, June 1996.
[12] J. Han,J. Pei, and Y.Yin, “Mining Frequent Patterns without Candidate Generation,”Proc.2000 ACM-SIGMOD Int. Conf. On Management of Data(SIGMOD’00), Dallas,TX, May 2000 .
[13] Timothy J. Ross, “Fuzzy logic with engineering application,” International Edition, 1995.
[14] L. A . Zadech, ”Fuzzy Sets,” Information and Controal, 8 ,1965.
[15]Ada Wai-chee Fu, Man Hon Wong, Siu Chun Sze, Wai Chiu Wong, Wai Lun Wong, and Wing Kwan Yu, “Finding Fuzzy Sets for the Mining of Fuzzy Association Rules for Numerical Attributes,” Department of Computer Science and Engineering, Chinese University of Hong Kong.
[16]J. Shu Yue, E.Tsang, D Yeung and Daming Shi, “Mining fuzzy associaton rules with weighted items,”2000 IEEE International Conference on Systems, Man and Cybernetics, 3:1906-1911, 2000.
[17] Robert H. Golan, Wojciech Ziarko, “A Mothodology for Stock Market Analysis utilizing Rough Set Theory”, IEEE.
[18] Gary, Jim, Adam Bosworth, Andrew Layman and Hamid Pirahesh, “Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals,” IEEE 1996.
[19]C.Bettini,X. S. Wang, S. Jajodia, J.-L. Lin, “Discovering frequent event patterns with multiple granularities in time sequences,” IEEE Trans. On Knowledge and Data Engineering, Volume: 10 Issue :2, 1998 ,pp. 222-237.
[20]George H. John,Stanford University and IBM Peter Miller,Lockhead Martin Corporation Randy Kerber, “Stock Selection Using Rule Induction,” IEEE, 1996.
[21]Agrawal, R., Faloutsos, C. and Swami, A. “Efficient Similarity Search in Sequence Databases,” Lecture Notes in Computer Science 730, Springer Verlag, 1993, pp. 69-84.
[22]Chen, M-S., Park, J-S. and Yu, P.S. “Efficient Data Mining for Path Traversal Patterns,’’” IEEE Trans. on Knowledge and Data Engineering, Vol. 10, No. 2, April 1998, pp. 209-221.
[23]陳智宗,(言午)秉瑜,陳振明, “以資料挖礦法挖掘多屬性序列式資料規則之研究,” 中央大學資訊管理研究所碩士論文, 民89.
[24]陳柏翰,(言午)秉瑜, 陳振明, “以RSS演算法挖掘股市交易資料之研究,” 中央大學資訊管理研究所碩士論文, 民90.
[25]范揚明, 吳憲忠, “模糊理論在股市投資決策上的應用,”暨南大學資訊管理研究所碩士論文, 民90.
[26] 陳仕昇,（言午）秉瑜, 陳彥良, “以可重複序列挖掘網路瀏覽規則之研究,” 資管評論第九期, 民88.
[27](言午)長裕何靖遠,”多維度跨界性資料挖掘-以股市為例,” 中央大學資訊管理研究所碩士論文, 民89.
[28]沈清正, 陳仕昇, 高鴻斌, 張元哲, 陳家仁, 黃琮盛, 陳彥良, “資料間隱含關係的挖掘與展望,”中央大學資訊管理系.
[29]杜金龍, “技術指標在台灣股市應用的訣竅,” 金錢文化, 民87.

指導教授

謝浩明(How-Ming Shieh)

審核日期

2002-6-26

推文