中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/25878
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 41663310      在线人数 : 1687
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/25878


    题名: 關聯式資料庫之廣義知識探勘;Generalized Knowledge Discovery from Relational Database
    作者: 吳郁瑩;Yu-Ying Wu
    贡献者: 資訊管理研究所
    关键词: 負相關樣式;屬性導向歸納法;多階層知識探勘;資料探勘;anomaly detection;attribute-oriented induction;knowledge discovery;multiple-level mining;negative pattern;data mining
    日期: 2009-11-11
    上传时间: 2010-06-11 16:58:34 (UTC+8)
    出版者: 國立中央大學圖書館
    摘要: 隨著資料的快速成長與大量累積,資料探勘已被廣泛應用於許多領域,例如:決策支援、詐欺偵測、市場分析、財務預測等等。針對各種不同資料特性與研究議題,已有許多方法與技術被提出,用以從大量資料中歸納出有用的資訊,屬性導向歸納法是其中一項重要技術。然而,現有的屬性導向歸納法存在著二個問題:第一,其只依據二個關鍵門檻值進行歸納,所提供的廣義知識只是資料庫的一個知識片段,若想獲得完整的歸納知識,必須重覆進行多次歸納;第二,現有方法僅關注正向資料,缺乏對負向資料的處理。針對此二項不足,本研究提出二種新的歸納方法,得以一次歸納並產生所有有趣的多階層正向與負向廣義知識。此外,真實世界有著各種不同的知識種類,除了上述正向與負向知識之外,資料庫中亦存在著具有異常誤差的稀少性資料,傳統資料探勘方法僅能偵測異常物件,無法解釋物件中真正發生異常的屬性。因此,本研究提出第三種方法,能從資料庫中挖掘出真正造成物件異常的最小屬性組合,稱之為可疑樣式。經由真實資料集實際測試與評量,證明本研究所提出的方法具可行性並能有效找出有用知識。 Data mining has attracted a great deal of attention in the information industry and in society due to its wide applicability in many areas. Many approaches have been proposed to generalize valuable information patterns and attribute-oriented induction (AOI) is one of the most important methods. However, existing AOI approaches encounter two problems. First, the AOI only provides a snapshot of the generalized knowledge, not a global picture. Second, it only mines knowledge from positive facts in databases. In this study, we proposed two novel methods to generate all interesting multiple-level positive and negative generalized knowledge at one time. Moreover, knowledge types are various in real world. In addition to the positive and negative knowledge, a dataset may include very rare, suspicious values, or the abnormal deviations. Existing researches focused only on the identification of outliers which possess the same dimensional space, what are the explicit anomalous knowledge hidden in the mined outliers is rarely addressed. This study proposed third approach to discover such suspicious knowledge. Both proposed methods have been verified for efficiency and effectiveness by using real datasets.
    显示于类别:[資訊管理研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML723检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明