DC 欄位 |
值 |
語言 |
DC.contributor | 資訊管理學系 | zh_TW |
DC.creator | 劉信義 | zh_TW |
DC.creator | Shin-Yat Liu | en_US |
dc.date.accessioned | 2004-7-13T07:39:07Z | |
dc.date.available | 2004-7-13T07:39:07Z | |
dc.date.issued | 2004 | |
dc.identifier.uri | http://ir.lib.ncu.edu.tw:88/thesis/view_etd.asp?URN=91423027 | |
dc.contributor.department | 資訊管理學系 | zh_TW |
DC.description | 國立中央大學 | zh_TW |
DC.description | National Central University | en_US |
dc.description.abstract | 資料挖掘的相關研究在近幾年來受到許多學者的矚目及投入。其中,關聯法則是最常被運用到的方法。藉由關聯法則,決策者可以找到消費者購買商品時的一些特性,並依據這些特性來做行銷規劃、銷售分析及購買行為分析等動作。傳統的關聯法則必須給予一固定的minimum support (簡稱minisup)值,來求得large item sets。然而,在現實生活中使用者往往不瞭解最佳的minisup值是多少,所以必須透過多次的調整才能得到滿意的large item set,此時傳統的演算法就顯得很沒有效率。考慮現實生活中許多資料挖掘的應用,往往提供了額外的記憶體空間與前處理時間。William Cheung等人在 2003年發表的CATS Tree (Compressed and Arranged Transaction Sequences Tree),提出了一個將交易資料預先壓縮成樹狀結構表示,以達到不需事先設定minisup值的關聯法則挖掘方法。可惜其資料結構過於複雜,導致建構時間過長且mining的過程冗長。本論文嘗試改進CATS Tree,首先對資料做適當的前處理動作,然後將處理後的資料轉成自訂的群聚壓縮樹(Grouping Compress Tree簡稱GC Tree)資料結構,最後提出一個有效率的演算法來找出其中的large item set,以求簡化資料建構及挖掘過程的複雜度。實驗結果顯示我們所提出的GC Tree其建構與挖掘時間皆比CATS Tree有效率,此外在考量執行時所需的總記憶體空間亦可能較傳統CATS Tree來的少。是一個能改良系統執行效能以提升現實應用的高效率關聯法則挖掘法。 | zh_TW |
DC.subject | 遞增式關聯法則 | zh_TW |
DC.subject | 資料挖掘 | zh_TW |
DC.subject | 群聚壓縮 | zh_TW |
DC.subject | 虛擬投影 | zh_TW |
DC.subject | 調適性門檻支持度 | zh_TW |
DC.subject | incremental mining | en_US |
DC.subject | association rule | en_US |
DC.subject | data mining | en_US |
DC.subject | grouping compress | en_US |
DC.subject | pesudo projection | en_US |
DC.title | 使用群聚壓縮樹之高效率關聯法則挖掘法 | zh_TW |
dc.language.iso | zh-TW | zh-TW |
DC.title | An Efficiency Incremental Mining with Grouping Compress Tree | en_US |
DC.type | 博碩士論文 | zh_TW |
DC.type | thesis | en_US |
DC.publisher | National Central University | en_US |