使用群聚壓縮樹之高效率關聯法則挖掘法

DC 欄位	值	語言
DC.contributor	資訊管理學系	zh_TW
DC.creator	劉信義	zh_TW
DC.creator	Shin-Yat Liu	en_US
dc.date.accessioned	2004-7-13T07:39:07Z
dc.date.available	2004-7-13T07:39:07Z
dc.date.issued	2004
dc.identifier.uri	http://ir.lib.ncu.edu.tw:88/thesis/view_etd.asp?URN=91423027
dc.contributor.department	資訊管理學系	zh_TW
DC.description	國立中央大學	zh_TW
DC.description	National Central University	en_US
dc.description.abstract	資料挖掘的相關研究在近幾年來受到許多學者的矚目及投入。其中，關聯法則是最常被運用到的方法。藉由關聯法則，決策者可以找到消費者購買商品時的一些特性，並依據這些特性來做行銷規劃、銷售分析及購買行為分析等動作。傳統的關聯法則必須給予一固定的minimum support (簡稱minisup)值，來求得large item sets。然而，在現實生活中使用者往往不瞭解最佳的minisup值是多少，所以必須透過多次的調整才能得到滿意的large item set，此時傳統的演算法就顯得很沒有效率。考慮現實生活中許多資料挖掘的應用，往往提供了額外的記憶體空間與前處理時間。William Cheung等人在 2003年發表的CATS Tree (Compressed and Arranged Transaction Sequences Tree)，提出了一個將交易資料預先壓縮成樹狀結構表示，以達到不需事先設定minisup值的關聯法則挖掘方法。可惜其資料結構過於複雜，導致建構時間過長且mining的過程冗長。本論文嘗試改進CATS Tree，首先對資料做適當的前處理動作，然後將處理後的資料轉成自訂的群聚壓縮樹(Grouping Compress Tree簡稱GC Tree)資料結構，最後提出一個有效率的演算法來找出其中的large item set，以求簡化資料建構及挖掘過程的複雜度。實驗結果顯示我們所提出的GC Tree其建構與挖掘時間皆比CATS Tree有效率，此外在考量執行時所需的總記憶體空間亦可能較傳統CATS Tree來的少。是一個能改良系統執行效能以提升現實應用的高效率關聯法則挖掘法。	zh_TW
DC.subject	遞增式關聯法則	zh_TW
DC.subject	資料挖掘	zh_TW
DC.subject	群聚壓縮	zh_TW
DC.subject	虛擬投影	zh_TW
DC.subject	調適性門檻支持度	zh_TW
DC.subject	incremental mining	en_US
DC.subject	association rule	en_US
DC.subject	data mining	en_US
DC.subject	grouping compress	en_US
DC.subject	pesudo projection	en_US
DC.title	使用群聚壓縮樹之高效率關聯法則挖掘法	zh_TW
dc.language.iso	zh-TW	zh-TW
DC.title	An Efficiency Incremental Mining with Grouping Compress Tree	en_US
DC.type	博碩士論文	zh_TW
DC.type	thesis	en_US
DC.publisher	National Central University	en_US

博碩士論文 91423027 完整後設資料紀錄