博碩士論文 974303023 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:10 、訪客IP:18.218.38.125
姓名 李兆駿(Chao-chun Lee)  查詢紙本館藏   畢業系所 資訊管理學系在職專班
論文名稱 應用資料探勘技術建立機車貸款風險評估模式之研究-以A公司為例
(A study of the development of mortorcycle loan risk evaluation model by using data mining approaches: a case study of A company)
相關論文
★ 零售業商業智慧之探討★ 有線電話通話異常偵測系統之建置
★ 資料探勘技術運用於在學成績與學測成果分析 -以高職餐飲管理科為例★ 利用資料採礦技術提昇財富管理效益 -以個案銀行為主
★ 晶圓製造良率模式之評比與分析-以國內某DRAM廠為例★ 商業智慧分析運用於學生成績之研究
★ 運用資料探勘技術建構國小高年級學生學業成就之預測模式★ 績效指標評估研究應用於提升研發設計品質保證
★ 基於文字履歷及人格特質應用機械學習改善錄用品質★ 以關係基因演算法為基礎之一般性架構解決包含限制處理之集合切割問題
★ 關聯式資料庫之廣義知識探勘★ 考量屬性值取得延遲的決策樹建構
★ 從序列資料中找尋偏好圖的方法 - 應用於群體排名問題★ 利用分割式分群演算法找共識群解群體決策問題
★ 以新奇的方法有序共識群應用於群體決策問題★ 利用社群網路中的互動資訊進行社群探勘
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   至系統瀏覽論文 ( 永不開放)
摘要(中) 機車貸款業務,貸款人與擔保品都是流動不固定,對於客戶之掌握更為困難,因此貸放前之徵信審查工作與核貸過程是否嚴謹,將更形重要。個案公司長期經營機車貸款業務,以個案公司之現有客戶為資料來源,希望從個案公司過去客戶群中,曾經發生逾期繳款導致損失之個案,將其作較科學及有系統的分析,找出相關影響因素,作為徵授信之準則與依據以減少逾期案件之發生,因而減少損失同時增加獲利與盈餘。
本研究藉由資料探勘技術,建立一套系統的風險評估流程及授信審查機制,以達到作業標準化、過程效率化之目的,日後不管對核貸的風險管理或授信人員的教育訓練,都有依據的方向,並降低承辦到違約案件的機率。
本研究運用SPSS等公司所提出的資料探勘程序模型(CRIPS-DM)結合資料探勘技術中的分類方法,找出授信戶發生逾期還款的主要特徵及因素並建置預測模型。並以SQL Server 2008資料探勘工具針對個案公司提供之實際資料進行資料分析及建置模型。
結果本研究發現,將四種演算法整合應用投票之預測性正確性及成本評估比較都比單一演算法為佳。
摘要(英) Motorcycle loans, lenders and collateral are total current assets to cause the difficulty in grasp of customers, so it will be even more important by rigorous credit review and loan approval process before loan. Case study the company run motorcycle loan business in a long-term period, hope by a scientific and systematic analysis on the case of existing customers as sources of information, to identify related factors from the case base in the past clients have caused the loss of late payment, as the criteria and the basis for levy credit to reduce the occurrence of overdue cases, thus reducing the losses and increase profits and earnings.
This research data mining techniques can establish a system of risk evaluation and credit examined mechanism to achieve the purposes of standardized operation and efficiency of process. On loans of credit risk management education and training staff have the basis of the direction and contractors to reduce the probability of default cases.
In this study, companies such as the use of SPSS data mining program proposed model (CRIPS-DM) combined with data mining techniques in the classification of credit account to find out the main features of occurrence of late repayment and build prediction models and factors. And to SQL Server 2008 data mining tools provided for the case of real data to analyze the data and build models.
The results of this study found that the integrated application of the four algorithms to predict voting comparative evaluation of accuracy and cost is better than a single algorithm.
關鍵字(中) ★ 資料探勘
★ 授信風險
關鍵字(英) ★ credit risk
★ data mining
論文目次 目錄
中文摘要 …………………………………………………………………………… i
英文摘要 …………………………………………………………………………… ii
誌謝 …………………………………………………………………………… iii 2
目錄 …………………………………………………………………………… iv
圖目錄 …………………………………………………………………………… vi
表目錄 …………………………………………………………………………… vii
一、 緒論……………………………………………………………………… 1
1-1 研究背景與動機………………………………………………………… 1
1-2 研究目的………………………………………………………………… 2
1-3 研究架構與流程…………………………………………………………合…………………………………………………………… 2
二、 文獻探討………………………………………………………………… 6
2-1 授信評估原則…………………………………………………………… 6
2-2 國內外信用評等相關文獻……………………………………………… 9
2-3 資料探勘…………………………………………………………………合…………………………………………………………… 13
2-3-1 資料探勘之定義…………………………………………………………合…………………………………………………………… 13
2-3-2 資料探勘之步驟…………………………………………………………合…………………………………………………………… 14
2-4 資料探勘模式……………………………………………………………合…………………………………………………………… 17
2-4-1 決策樹……………………………………………………………………合…………………………………………………………… 19
2-4-2 類神經網路………………………………………………………………合…………………………………………………………… 20
2-4-3 羅吉斯迴歸………………………………………………………………合…………………………………………………………… 22
2-4-4 貝氏機率…………………………………………………………………合…………………………………………………………… 23
三、 研究方法………………………………………………………………… 24
3-1 個案公司簡介…………………………………………………………… 24
3-2 系統工具介紹…………………………………………………………… 24
3-3 資料來源與格式…………………………………………………………
合…………………………………………………………… 31
3-4 資料前處理……………………………………………………………… 32
3-5 資料分割…………………………………………………………………合…………………………………………………………… 34
3-6 相關變數檢定……………………………………………………………合…………………………………………………………… 37
四、 實證評估………………………………………………………………… 39
4-1 決策樹分析………………………………………………………………合…………………………………………………………… 40
4-2 類神經網路分析…………………………………………………………合…………………………………………………………… 44
4-3 羅吉斯迴歸分析…………………………………………………………合…………………………………………………………… 45
4-4 貝氏機率分析……………………………………………………………合…………………………………………………………… 46
4-5 模型整合應用……………………………………………………………合…………………………………………………………… 48
4-6 結果討論…………………………………………………………………合…………………………………………………………… 52
五、 結論與建議……………………………………………………………… 61
5-1 結論……………………………………………………………………… 61
5-2 後續研究建議…………………………………………………………… 62
5-3 研究限制…………………………………………………………………
合…………………………………………………………… 62
參考文獻 …………………………………………………………………………… 63
中文部分………………………………………………………………… 63
英文部分………………………………………………………………… 64
圖目錄
圖1-1 研究流程圖……………………………………………………………………… 5
圖2-1 Kdnuggets.com 票選最常使用的資料探勘方法學圖………………………… 15
圖2-2 CRISP-DM資料探勘程序架構圖……………………………………………… 16
圖2-3 倒傳遞類神經網路架構圖……………………………………………………… 21
圖3-1 SQL Serve商業智慧架構圖…………………………………………………… 26
圖3-2 資料分割1整合流程圖………………………………………………………… 34
圖3-3 資料分割2整合流程圖………………………………………………………… 36
圖4-1 SQL Server Business Intelligence Development Studio 圖…………………… 39
圖4-2 決策樹相依性網路圖…………………………………………………………… 41
圖4-3模型整合應用投票圖…………………………………………………………… 48
表目錄
表2-1 影響消費者信用放款的影響變數表…………………………………………… 11
表2-2 資料探勘定義表………………………………………………………………… 14
表2-3 決策樹演算法之比較表………………………………………………………… 20
表3-1 客戶類型分配表………………………………………………………………… 31
表3-2 轉換前各欄位原始資料型態表………………………………………………… 32
表3-3 處理後輸入變數對照表………………………………………………………… 33
表3-4 資料分割1之資料分類表……………………………………………………… 35
表3-5 變數檢定結果表………………………………………………………………… 37
表4-1 分類矩陣表……………………………………………………………………… 40
表4-2 決策樹訓練集1模型結果表…………………………………………………… 40
表4-3 決策樹訓練集2模型結果表…………………………………………………… 41
表4-4 決策樹相依性網路關聯表……………………………………………………… 42
表4-5 決策樹變數關聯性得分表……………………………………………………… 44
表4-6 類神經網路訓練集1模型結果表……………………………………………… 44
表4-7 類神經網路訓練集2模型結果表……………………………………………… 45
表4-8 羅吉斯迴歸訓練集1模型結果表……………………………………………… 45
表4-9 羅吉斯迴歸訓練集2模型結果表……………………………………………… 46
表4-10 貝氏機率分析訓練集1模型結果表………………………………………… 47
表4-11 貝氏機率分析訓練集2模型結果表………………………………………… 47
表4-12 整合應用投票1之訓練集1結果表…………………………………………… 49
表4-13 整合應用投票1之訓練集2結果表…………………………………………… 49
表4-14 整合應用投票2之訓練集1結果表…………………………………………… 50
表4-15 整合應用投票2之訓練集2結果表…………………………………………… 50
表4-16 整合應用投票3之訓練集1結果表…………………………………………… 51
表4-17 整合應用投票3之訓練集2結果表…………………………………………… 52
表4-18 演算法模型正確率結果表…………………………………………………… 53
表4-19 模型整合應用投票正確率結果表…………………………………………… 53
表4-20 演算法模型型Ⅰ錯誤率結果表……………………………………………… 54
表4-21 模型整合應用投票型Ⅰ錯誤率結果表……………………………………… 54
表4-22 演算法模型型Ⅱ錯誤率結果表……………………………………………… 55
表4-23 模型整合應用投票型Ⅱ錯誤率結果表……………………………………… 55
表4-24 模型結果綜合比較表………………………………………………………… 56
表4-25 呆帳率10%成本評估比較表………………………………………………… 57
表4-26 呆帳率5%成本評估比較表…………………………………………………… 58
表4-27 呆帳率5%~10%成本評估彙總比較表……………………………………… 59
表4-28呆帳率12%~20%成本評估彙總比較表……………………………………… 60
參考文獻 一、 中文部分
1. Berry M. J., & Linoff G. S.,資料探勘理論與實務,吳旭智、賴淑貞譯,維科圖書有限公司,2001年。
2. 尹相志,SQL Server 2005 Data Mining資料探勘與Office 2007資料探勘增益集,悅知文化出版社,2007年。
3. 呂美慧,「銀行授信評等模式—Logistic Regression 之應用」,政大金融所碩士論文,2000年。
4. 林芝儀,「應用資料探勘於信用卡授信決策模式之實證研究」,元智大學工管所碩士論文,2003年。
5. 林傑斌,資料採掘與OLAP 理論與實務,文魁出版社,2002年。
6. 施孟隆、游清芳及李佳珍,「Logit Model 應用於信用卡信用風險審核系統之研究—以國內某銀行信用卡中心為例」,金融財務月刊,第4期,pp. 85-104,1999年10月。
7. 張仁哲,「我國信用卡現代化問題之研究」,政大企研所碩士論文,1982年。
8. 曾俊堯,「信用卡信用風險評估模式之研究」,中州學報,第8期,pp. 300-314,1995年10月。
9. 葉怡成,應用類神經網路,儒林圖書公司,1999年。
10. 謝忠榮,「授信風險影響因素之探討—以汽車貸款為例」,臺中健康暨管理學院經營管理研究所碩士論文,2004年。
11. 簡安泰,「消費者信用評分制度之研究」,政大企研所碩士論文,1971年。
12. 龔昶元,「Logistic Regression模式應用於信用卡信用風險審核之研究—以國內某銀行信用卡中心為例」,台北銀行月刊,第28卷第9期,pp. 35-49,1997年。
二、 英文部分
1. Cabena, P., Hadjinian, P., Stadler, R., Verhees, J. and Zanasi, A., Discovering data mining from concept toimplementation, Prentice Hall, 1998.
2. Fayyad, U. M., Piatetsky-Shapiro, G.., and Smyth, P., “From Data Mining to Knowledge Discovery in Databases,” AI Magazine, Vol.17, pp. 37-54, 1996.
3. Feinberg, S., The analysis of cross-classified categorical data (2nd ed.), MA: MIT Press, 1985.
4. Glorfeld, L. W., and Hardgrave, B. C., “A performance comparison of eight inductive decision models for predicting commercial loan creditworthiness”, Computer and Operations Research, Vol.23, pp. 933-944., 1996.
5. Grupe, F. H., and Owrang, M. M., “Database Mining Discovering New Knowledge and Cooperative Advantage,” Information Systems Management, Vol.12, pp. 26-31, 1995.
6. Han, J., and Kamber, M., Data Mining : Concepts and Techniques , Morgan Kaufmann, 2000.
7. Kantardzic, M., Data mining : concepts, models, methods, and algorithms, Wiley-Interscience, 2003.
8. Kennedy, R. L., Lee, Y., Roy, B. V., Reed, C. D., and Lippmann, R. P., Solving Data Mining Problems Through Pattern Recognition, Prentice Hall, 1998.
9. Duda, R.O., and Hart, P.E., Pattern Classification and Scene Analysis, Wiley, 1973.
10. Rock, A., “Sure Ways to Score with Lenders”, Money, September, pp.125-136, 1984.
11. Steenackers, A., and Goovaerts, M.J., "A Credit Scoring Model for Personal Loans", Insurance Mathemaics Economics Economics, pp.31-34, 1989.
12. Hastie, T., Tibshirani, R., and Friendman, J., The Element of statistical Learning : Data Mining, Inference and Prediction, Springer-Verlag, 2001.
13. Tom M. Mitchell, Machine Learning, The McGraw-Hill companies, Inc., 1997.
指導教授 陳彥良 審核日期 2010-7-8
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明