博碩士論文 102453028 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:37 、訪客IP:18.226.28.97
姓名 秦聖昌(Sheng-Chang Chin)  查詢紙本館藏   畢業系所 資訊管理學系在職專班
論文名稱 支援向量機於乳癌預測之研究
相關論文
★ 利用資料探勘技術建立商用複合機銷售預測模型★ 應用資料探勘技術於資源配置預測之研究-以某電腦代工支援單位為例
★ 資料探勘技術應用於航空業航班延誤分析-以C公司為例★ 全球供應鏈下新產品的安全控管-以C公司為例
★ 資料探勘應用於半導體雷射產業-以A公司為例★ 應用資料探勘技術於空運出口貨物存倉時間預測-以A公司為例
★ 使用資料探勘分類技術優化YouBike運補作業★ 特徵屬性篩選對於不同資料類型之影響
★ 資料探勘應用於B2B網路型態之企業官網研究-以T公司為例★ 衍生性金融商品之客戶投資分析與建議-整合分群與關聯法則技術
★ 應用卷積式神經網路建立肝臟超音波影像輔助判別模型★ 基於卷積神經網路之身分識別系統
★ 能源管理系統電能補值方法誤差率比較分析★ 企業員工情感分析與管理系統之研發
★ 資料淨化於類別不平衡問題: 機器學習觀點★ 資料探勘技術應用於旅客自助報到之分析—以C航空公司為例
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 隨著科技的發達,資料產生的數量越來越多,進入了Big Data的時代,透過資料探勘的技術,可以挖掘出更多的知識或是有趣的內容,也能夠做更好的預測。本研究針對醫療資料中的乳癌資料集進行實驗,透過兩個資料大小差異的乳癌資料集探勘後的數據進行分析,根據特徵選取後所取得資料與原始資料做比較,使用單一分類器及多重分類器搭配不同的核心參數進行實驗。透過所得實驗數據,評估那一種分類器及參數的搭配使用,能夠取得較好的效能時間及正確率,如此可使日後研究及預測上能夠有較好的依據,並能夠輔助做出好的決策。

實驗中透過不同核心參數與分類器的搭配得到數據後,以時間及正確率為主要條件排序,找出較好的組合方式,在本研究中,單一分類器使用SVM搭配RBF核心參數,能夠,而多重分類器使用Bagging及Boosting所產生的數據比較後,Boosting的正確性及效能較好。

摘要(英) Breast cancer prediction is an important problem in the medical and healthcare communities. In particular, various data mining techniques have been employed to construct the prediction models. Since support vector machines (SVM) are the core machine learning technique and they have shown their outperformance than many other related techniques over many pattern classification problems, very few explore the performances of SVM using different learning functions in breast cancer prediction. Therefore, the aim of this thesis is to use the three well-known kernel functions to develop different SVM classifiers, which are the linear, polynomial, and RBF (radial basis function) kernels, to assess their prediction performances. Moreover, the classifier ensemble techniques based on bagging and boosting are also applied to construct the SVM ensemble classifiers. The experimental results based on two related datasets show that boosting based SVM based on the RBF kernel function performs the best in terms of prediction accuracy and ROC.
關鍵字(中) ★ 支援向量機 關鍵字(英) ★ SVM
★ GA
★ Bagging
★ boosting
★ RBF
★ polynomial
★ Linear
★ Kernel function
論文目次 摘要 i

Abstract ii

誌謝 iii

目錄 iv

圖目錄 vi

表目錄 vii

第一章 前言 1

1.1 研究背景 1

1.2 研究動機 1

1.3 研究目的 2

1.4 研究步驟 4

第二章 文獻探討 5

2.1 監督式學習(Supervised learning) 5

2.2 支援向量機(SVM: Support Vector Machine) 5

2.3 前處理(Data Preprocessing) 7

2.3.1特徵選取(feature selection) 7

2.3.2基因演算法(Genetic Algorithms) 8

2.4 多重分類器 9

2.4.1 Bagging 9

2.4.2 Boosting 9

2.5 相關文獻 10

第三章 研究方法 11

3.1 實驗資料集(datasets) 12

3.2 實驗特徵選取(feature selection) 13

3.3 單一分類器之設計 14

3.4 多重分類器設計 16

3.4.1 使用Bagging 16

3.4.2 使用Boosting 17

3.5 評估方法 19

第四章 實驗結果 20

4.1 單一分類器輸出結果 20

4.1.1 單一分類器輸出結果時間分析 22

4.1.2 單一分類器輸出結果正確率分析 23

4.2 多重分類器輸出結果 24

4.2.1 多重分類器輸出結果時間分析 28

4.2.2 多重分類器輸出結果正確率分析 30

4.3 實驗結論 32

4.3.1 單一分類器實驗結論 32

4.3.2 多重分類器實驗結論 33

第五章 研究結論 35

5.1 研究限制 35

5.2 研究貢獻 35

5.3 未來研究方向 36

參考文獻 37

附錄一 40

附錄二 41

附錄三 43

附錄四 44

附錄五 45

附錄六 46

附錄七 48

參考文獻 1. 蘇木春、張孝德,機器學習:類神經網路、模糊系統以及基因演算法則,全華科技圖書股份有限公司,民國九十二年。

2. 曾新穆、李建億譯,資料探勘(R.J. Roiger, M.W. Geatz, Data Mining, A Tutorial-based Primer, Addison Wesley, 2003),東華書局,民國九十三年。

3. 周鵬程,遺傳演算法原理與應用,全華科技圖書股份有限公司,民國九十一年。

4. 朱啟源,2011,資料前處理之研究:以基因演算法為例,國立中央大學,碩士論文。

5. 洪振富,2010,距離式特徵於資料自動分類之研究,國立中央大學,碩士論文。

6. 鍾翔航,2008,監督式學習與非監督式學習為主的資料探勘技術應 用於癌症基因表現資訊之研究,國立高雄應用科技大學,碩士論文。

7. 陶國珍,2010,建構單調性SVM模型之研究,國立成功大學,碩士論文。

8. 張純蓮,2007,應用資料探勘技術於乳癌復發的預測,南台科技大學,碩士論文。

9. 張雅婷,2008,以資料探勘技術建立輔助乳癌診斷模型,國立臺北科技大學,碩士論文。

10. 黃聖育,2009,運用支援向量機、邏輯斯迴歸及決策樹於乳癌存活預測模式之建構,國立雲林科技大學,碩士論文。

11. 林誌銘,2009,應用基因演算法於捷運列車運行計畫之研究,國立交通大學,博士論文。

12. 謝佩鈞,2015,Full Bandwidth RBF核函數參數自動挑選法與其在特徵選取之應用,國立臺中教育大學,碩士論文。

13. 黃承龍、陳穆臻、王界人,2004, 支援向量機於信用評等之應用,計量管理期刊。

14. 石琢暐, 2011,支援向量機簡介Introduction to Support Vector Machine。

15. 陳隆昇、邱慧如,植基於支撐向量機之語意導向分類器,International Journal of Advanced Information Technologies (IJAIT) 。

16. 李俊宏、古清仁,2010,類神經網路與資料探勘技術在醫療診斷之應用研究.工程科技與教育學刊。

17. 張麗娟、許佳豪、張耀元,建構臺灣電子業財務預警 ─以資料探勘技術分析.臺灣銀行季刊第六十三卷第一期.183-216頁。

18. 李根逸,支援向量機教學文件,台灣大學通訊與多媒體研究室。

19. 林宗勳,Support Vector Machines 簡介。

20. 黃建又,乳癌基礎研究最近之發展,義大醫院。

21. 衛生福利部國民健康署 http://www.hpa.gov.tw/

22. Big Data Analysis and Data Mining by Jiun-Yan Shiau, Ph.D

23. Thomas Finley & Thorsten Joachims, Supervised Clustering with Support Vector Machines ,Department of Computer Science, Cornell University, Ithaca, NY 14853 USA

24. Chang, C.C., Lin, C.J., 2001. LIBSVM: a library for support vector machines. Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm.

25. C Cortes, V Vapnik , 1995 -Support-Vector Networks

26. Tan, P. N., Steinbach, M. and Kumar, V., Introduction to Data Mining, Addison-Wesley, Boston, 2006.

27. Jyh-Shing Roger Jang, "Data Clustering and Pattern Recognition," available at the links for on-line courses at the author′s homepage athttp://mirlab.org/jang.

28. Gumn, S. R., “Support vector machines for classification and regression,” Technical Report, University of Southampton, 1998.

29. Lee, Y. J., Mangasarian, O.L.and Wolberg, W. H., Breast cancer survival and chemotherapy: A support vector machine analysis, 2000.

30. Academic, K. (2005). Data mining: Practical machine learning tools and techniques.

31. Bennett, K. P., & Campbell, C. (2000). Support vector machines: Hype or hallelujah? ACM SIGKDD Explorations Newsletter: 13.

32. Cristianini N., S.-T. J. (2000). An Introduction to Support Vector Machines and other Kernel-based Learning Methods. Cambridge University Press.

33. Cristianini N., & Shawe-Taylor J., An Introduction to Support Vector Machines and other Kernel-based Learning Methods, Cambridge,2000

34. Tingting Mu and Asoke K. Nandi. (2007). Breast cancer detection from FNA using SVM with different parameter tuning systems and SOM–RBF classifier. Journal of the Franklin Institute, 344, 285-311.

35. P. S. Hiremath and Jyothi R. Tegnoor (2013). Follicle Detection and Ovarian Classification in Digital Ultrasound Images of Ovaries, Advancements and Breakthroughs in Ultrasound Imaging, Dr. G P P Gunarathne (Ed.), ISBN: 978-953-51-1159-7, InTech, DOI: 10.5772/56518. Available from: http://www.intechopen.com/books/advancements-and-breakthroughs-in-ultrasound-imaging/follicle-detection-and-ovarian-classification-in-digital-ultrasound-images-of-ovaries

36. Leo Breiman (1996), “Bagging predictors ”, Machine Learning, 24 (2) :123-140

37. .Laney, Douglas. "3D Data Management: Controlling Data Volume, Velocity and Variety" (PDF). Gartner. Retrieved6 February 2001.

38. UN GLobal Pulse (2012). Big Data for Development: Opportunities and Challenges (White p. by Letouzé, E.). New York: United Nations. Retrieved from

39. Laney, Douglas (2012). “The Importance of ‘Big Data’: A Definition”. Gartner.

40. Dan Worth (2011) . CERN experiments generating one petabyte of data every second.

41. The Economist.(2010), Data, data everywhere.

42. Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar (2012) Foundations of Machine Learning, The MIT Press ISBN 9780262018258.

43. Reeves, C. R., “Modern Heuristic Techniques for Combinatorial Problems,” John Wiley and Sons, pp. 151-196, NY, USA 1993.

指導教授 蔡志豐 審核日期 2015-8-26
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明