English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 41635082      線上人數 : 2261
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/68055


    題名: 結合主成分分析之貝氏分類模型;Naive Bayes classifier with Principal Components Analysis for continuous attributes
    作者: 吳若平;Wu,Jo-Ping
    貢獻者: 工業管理研究所
    關鍵詞: 分類方法;貝氏分類;主成分分析;Classification;Naïve Bayesian Classifier;Principal Components Analysis
    日期: 2015-07-06
    上傳時間: 2015-09-23 10:19:51 (UTC+8)
    出版者: 國立中央大學
    摘要: 大數據(Big data)的時代來臨,資料量急劇增加,資料處理分類的速度也成為資料探勘這門學問的一個很重要的環節。單純貝氏分類器(Naïve Bayes classifier)是一種簡單且實用的分類方法,其主要是根據貝氏定理的理論而來,它透過事前機率和事後機率和各屬性彼此間互相獨立的假設,來預測分類結果;此分類法為一種監督式的學習方法。它可以透過簡單的運算,而快速的獲得分類結果,也是其最大的優點。而獨立性假設就是為了能快速得到結果而設定的,但是現實生活中的資料大多是相依的並無法滿足這個假設。所以Naïve Bayes classifier的缺點主要有兩點,一個是現實資料並無法滿足這個獨立性假設,另一個則是他只能使用於類別行變數。
    我們所提出的新方法就是為了繼續保有Naïve Bayes classifier簡單且快速的優點,並且去除現實例子中資料各屬性彼此間無法滿足獨立性假設的問題。我們利用主成分分析的轉換將各屬性轉成相互線性獨立的狀態,再用連續型資料離散化的方法將資料轉換成類別行變數,最後再進行Naïve Bayes classifier,進而提高預測模型的準確度。
    我們利用UCI資料庫的資料進行模型的測試和比較,並建構出一個優於其他分類法(如:原始的Naïve Bayes classifier、decision tree、logistic regression等)的新模型。所以我們分別進行分析及測試,並測試其準確率和信賴區間,觀察資料在不同預測模型中的表現。最後我們還進一步的去探討不同離散化方法以及利用主成分分析後的結果去降低維度時,對於整個模型準確率的影響。;Due to the progressing of the science and technology, the data is growing rapidly. The speed of classifier has become an important part of data mining. Naïve Bayes classifier model is a simple and practical method of classification, it is based on applying Bayes’ theorem with strong independence assumptions between the features. But this assumption is not very realistic as in many real situations.
    We propose a classifier method, PC-Naïve, which is based on Naïve Bayes classifier. We keep the simple and fast advantages of the Naïve Bays classifier and relax vital assumption for independence of the Naïve Bayes classifie model. We use Principal components analysis to transform the original data, make the attributes mutual linearly independence. Then discretization the transform data and calculate the prior and conditional probability. Final we can get the posterior probability and classifier the data.
    We have used the examples to present the classifier procedures in our research and compare the accuracy with four models, including PC-Naïve model, tradition Naïve Bayes model, Decision Tree model and Stepwise Logistic Regression model. At the end, we have discuss the accuracy of different dimension and discretization methods.
    顯示於類別:[工業管理研究所 ] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML934檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明