以作者查詢圖書館館藏 、以作者查詢臺灣博碩士 、以作者查詢全國書目 、勘誤回報 、線上人數:41 、訪客IP:18.222.113.135
姓名 劉明音(Min-Yin Liu) 查詢紙本館藏 畢業系所 統計研究所 論文名稱 強韌迴歸在資料探勘上之應用 相關論文 檔案 [Endnote RIS 格式] [Bibtex 格式] [相關文章] [文章引用] [完整記錄] [館藏目錄] [檢視] [下載]
- 本電子論文使用權限為同意立即開放。
- 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
- 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
摘要(中) 資料挖掘的特性之一便是資料量的龐大。而分析龐大資料量的困難之一在於計算機的記憶體有限,所以無法一次完成對全部資料的處理。因此因應的方式之一便是將資料分割或分類儲存,之後再將分開處理的結果做一個結合,如此一來便可以解決計算機記憶體不足的問題。
資料量之龐大是資料探勘的特徵之一。而數目龐大的資料往往有資料來源不同分配的問題。分析這類的混合資料 (mixture data),原本就是棘手的問題。而當資料來源分配之個數以及分配之形式都未知時,統計分析的工作便更加的困難。
Royall & Tsou (2003) 提出了強韌概似函數 (robust likelihood function) 觀念。在樣本數大的時候,即使資料的真正分配未知,根據強韌概似函數還是能得到參數的正確的推論。而Tsou (2003) 則將強韌概似函數的方法推廣到在廣義線性模型架構之下的迴歸參數的推論的問題上。
本文將針對線性複迴歸模型,利用Tsou (2003) 介紹的強韌迴歸方法,針對分配未知的龐大資料,經由簡單平均和加權平均的結合方式,結合分段所估計出的迴歸參數,並對迴歸參數做統計推論。關鍵字(中) ★ 強韌迴歸
★ 資料挖掘關鍵字(英) ★ robust likelihood function
★ data mining論文目次 第1章 緒論……………………………………………………………1
第2章 大樣本下的問題………………………………………………4
第3章 文獻回顧………………………………………………………8
3.1 常態實作模型的修正項…………………………………………11
3.2 伽碼實作模型的修正項…………………………………………13
第4章 結合方法………………………………………………………16
第5章 模擬研究………………………………………………………18
第6章 結論……………………………………………………………29
參考文獻………………………………………………………………31參考文獻 Chao, M. T. and Lin, G. D. (1993). The asymptotic distributions of the remedians, Journal of Statistical Planning and Inference, 37, 1-11.
Hand, D. J. (1998). Data mining: statistics and more? The American Statistician. Vol. 52. No. 2.
Huang, H-D, Chang, H-L, Tsou, T-S, Liu, B-J, Kao, C-Y and Horng, J-H (2003). A data mining method to predict transcriptional regulatory sites based on differentially expressed genes in human genome. IEEE, 297-304.
Hurley, C. and Modarres, R. (1995). Low-storage quantile estimation. Computational Statistics, 10:311-325.
Rousseeuw, P. J. and Bassett , G.W., Jr. (1990). The remedia: A robust averaging method for large data sets. J. Amer. Statist. Assoc. Vol.85. No. 409, 97-104.
Royall, R.M and Tsou, T-S (2003). Interpreting statistical evidence using imperfect models: Robust adjusted likelihood functions. JRSS-B, 65, 391-404.
Tsou, T-S (2003). Parametric robust inferences for regression parameters under generalized linear models. (Submitted)
馬瀰嘉、蘇佩芳和林共進 (2001). 資料探勘-超大型資料庫基本統計量的計算。成功大學統計學報,第二十四期,68-84.指導教授 鄒宗山(Tsung-Shan Tsou) 審核日期 2003-7-14 推文 facebook plurk twitter funp google live udn HD myshare reddit netvibes friend youpush delicious baidu 網路書籤 Google bookmarks del.icio.us hemidemi myshare