資料挖礦中挖掘含有未知數值屬性之多屬性資料之研究

以作者查詢圖書館館藏

、以作者查詢臺灣博碩士

、以作者查詢全國書目

、勘誤回報

、線上人數：54

、訪客IP：18.191.53.185

姓名

賴志東(Zh-Dong Lia ) 查詢紙本館藏

畢業系所

資訊管理研究所

論文名稱

資料挖礦中挖掘含有未知數值屬性之多屬性資料之研究

相關論文

★ 應用結構行動理論探討跨國企業導入供應鏈管理之個案研究-以資訊電子業為例	★ 應用調適性結構行動理論探討ERP卅MES系統導入、轉移和整合之個案研究
★ LCD面板製造廠資訊系統商業價值之個案研究	★ 應用調適性結構行動理論探討CIM系統的導入 -以TFT-LCD產業為例
★ ERP系統品質Enhancement的實徵研究	★ 以資訊處理理論探討出貨管理系統在TFT-LCD產業的導入及影響之個案研究
★ 連接器供應商於中國大陸地區導入出貨管理系統之個案研究	★ 以AHP法探討跨國企業評選固網供應商之決策準則
★ 工具機製造業導入協作式接單服務之探討--以沖床製造廠商為例	★ 製造業導入先進規劃與排程系統之探討—以筆電領導廠商為例
★ 經銷商管理的再造－台灣知名飲料業的個案研究	★ 運用精實六標準差手法改善資料品質─某TFT-LCD業者之個案研究
★ 第三方物流業者之設施規劃與方案評估－以C物流公司為例	★ 期望和認知差異對ERP導入專案的影響-以B公司導入SAP為例
★ 使用者主導系統導入時資訊單位的角色-以W公司導入產品資料管理系統為例	★ 運用限制理論探討F公司大型資訊服務專案執行之研究

檔案

[Endnote RIS 格式]

[Bibtex 格式]

[相關文章]

[文章引用]

[完整記錄]

[館藏目錄]

[檢視]

[下載]

本電子論文使用權限為同意立即開放。
已達開放權限電子全文僅授權使用者為學術研究之目的，進行個人非營利性質之檢索、閱讀、列印。
請遵守中華民國著作權法之相關規定，切勿任意重製、散佈、改作、轉貼、播送，以免觸法。

摘要(中)

在資料庫中所存在的資料多是多屬性的，其中，屬性依其類型可分為類別(categorical)屬性和數值(numeric)屬性兩種。對於類別屬性而言，要如何地區分是很清楚的，像是性別分男性、女性。但是對數值屬性而言，由於數值屬性值域寬廣的特性，使得在資料挖擴的處理上必須做切割對應。現行大多的方法我們會事先切割數值屬性再找關聯規則，但是這種方法用在一個我們毫無相關知識的未知數值屬性上時，很容易地會造成minimum support或是minimum confidence不足的問題。本文以事後切割的方式針對此種未知數值處理做處理，使用者僅需設定一個minimum confidence的值，便可以精確地找出最佳的數值切割區間。這種方法可以避免掉上述的兩種問題，而對於處理含有未知數值屬性的多屬性資料提供了一個較佳的解決方案。

關鍵字(中)

★ 數值屬性
★ 資料挖礦
★ 關聯規則

關鍵字(英)

★ Association Rule
★ Data Mining
★ Numeric Attribute

論文目次

第1章緒論1
第1節研究動機1
第2節研究背景及目的1
第3節論文結構3
第2章文獻探討4
資料挖礦(Data Mining)4
第1節關聯規則(Association Rules)5
第2節數值屬性的切割8
第3節多屬性資料的處理11
第3章演算法20
第1節有意義區間22
第2節 Prefix-Sum Array24
第3節演算法26
第4節異常區間29
第4章系統實作31
第1節系統架構31
第2節健保資料32
第3節範例37
第3節系統效能40
第5章結論與建議43
第1節結論與貢獻43
第2節未來研究方向43
參考文獻45

參考文獻

[AHM+97]Agrawal, R., Ho, C. T., Megiddo, N. and Srikant, R., Range queries in OLAP data cubes, Proc. ACM SIGMOD 97, pp73-88.
[AIS93]R. Agrawal, T. Imielinski, and A. Swami, “Mining association rules between sets of items in large database,” SIGMOD 93, pp. 207-216.
[AS96]R. Agrawal, and R. Srikant, “Mining quantitative association rules in large relational tables,” SIGMOD 96, pp. 1-12.
[BDF97]Barbara, D., DuMouchel, W., Faloutsos, C., Haas, P. J., Hellerstein, J. H., Ioannidis, Y., Jagadish, H. V., Johnson, T., Ng, R., Poosala, V., Ross, K. A., and Servcik, K. C., The New Jersey data reduction report. Bulletion of the Technical Committee on Data Engineering, 20:3-45, Dec. 1997.
[Cat91]Catlett, J., Megainduction: Machine Learning on Very Large Database. Ph.D. Thesis, University of Sydney, 1991.
[CCH92]Cai, Y., Cercone, N., and Han, J., “Knowledge discovery in databases: an attribute-oriented approach,” VLDB 1992, pp. 547-559.
[CCS93]Codd, E. F., Codd, S. B., and Salley, C. T., “Beyond decision support,” Computer World,” 27, July 1993.
[CD97]Chaudhuri, S., and Dayal, U., “An overview of data warehousing and OLAP technology,” ACM SIGMOD Record, 26:65-74, 1997.
[CPY95]Chen, M.-S, Park, J.-S., and Yu, P. S., “An effective hash based algorithm for mining association rules,” Proc. ACM SIGMOD, pp. 175-186, May 1995.
[DP97]Devore, J. and Peck, R., Statistics: The Exploration and Analysis of Data. New York: Duxbury Press, 1997.
[FI93]Fayyad, U. and Irani, K., Multi-interval discretizaion of continuous-values attributes for classification learning. In Proc. 13th Intl. Joint Conf. On Artificial Intelligence(IJCAI’93), pages 1022-1029, Chambery, France, 1993.
[FMMT96]Fukuda, T., Morimoto, Y., Morishita, S., and Tokuyama, T., “Data mining using two-dimensional optimized association rules: Scheme, algorithms, and visualization,” In Proc. of the ACM SIGMOD Conference on Management of Data, June 1996.
[FPS96]U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, “The KDD process for extracting useful knowledge from volumes of data,” IEEE Transactions on Knowledge and Data Engineering, 8(6): pp.866-883, 1996.
[GCB97]Gray, J., Chaudhuri, S., Bosworth, A., Layman, A., Reichart, D., Venkatrao, M., Pellow, F., and Pirahesh, H., “Data cube: a relational aggregation operator generalizing group-by, cross-tab and sub-totals,” Data Mining and Knowledge Discovery,” l:29-54, 1997.
[HK01]J. Han and M. Kamber, Data mining: Concepts and Techniques, Academic Press, 2001.
[KFW98]Kuok, C. M.., Fu, A., Wong, M. H., :Mining fuzzy assocaiation rules in databases,” SIGMOD Record — Quarterly Publication of the Special Interest Group on Management Data v.27 n.1 pp 41-46, 1998.
[LS95]Liu, H. and Setiono, R., Chi2: Feature selection and discretization of numeric attributes. In Proc. 7th IEEE Intl. Conf. Tools with AI(ICTAI’95), pages 388-391, Los Alamitos, CA:IEEE Computer Society, 1995.
[Qui93]Quinlan, J. R., C4.5: Programs for Machine Learning. San Mateo, CA: Morgan Kaufmann, 1993.
[RS97]Rastogi, R. and Shim, K., “Mining optimized association rules for numeric attributes,” Technical Report 0112370971110-25, Bell Laboratories, Murray Hill, 1997.
[RS99]Rastogi, R. and Shim, K., “Mining optimized support rules for numeric attributes,” In Proc. of the 15th International Data Engineering Conference, pp 512-521.

指導教授

何靖遠(Chin-Yuan Ho)

審核日期

2001-7-12

推文