博碩士論文 90225017 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:37 、訪客IP:18.218.48.101
姓名 劉明音(Min-Yin Liu)  查詢紙本館藏   畢業系所 統計研究所
論文名稱 強韌迴歸在資料探勘上之應用
相關論文
★ 不需常態假設與不受離群值影響的選擇迴歸模型的方法★ 用卜瓦松與負二項分配建構非負連續隨機變數平均數之概似函數
★ 強韌變異數分析★ 用強韌概似函數分析具相關性之二分法資料
★ 利用Bartlett第二等式來估計有序資料的相關性★ 相關性連續與個數資料之強韌概似分析
★ 不偏估計函數之有效性比較★ 一個分析相關性資料的新方法-複合估計方程式
★ (一)加權概似函數之強韌性探討 (二)影響代謝症候群短期發生及消失的相關危險因子探討★ 利用 Bartlett 第二等式來推論模型假設錯誤下的變異數函數
★ (一)零過多的個數資料之變異數函數的強韌推論 (二)影響糖尿病、高血壓短期發生的相關危險因子探討★ 一個分析具相關性的連續與比例資料的簡單且強韌的方法
★ 時間數列模型之統計推論★ 複合概似函數有效性之探討
★ 決定分析相關性資料時統計檢定力與樣本數的普世強韌法★ 檢定DNA鹼基替換模型的新方法 - 考慮不同DNA鹼基間的相關性
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 資料挖掘的特性之一便是資料量的龐大。而分析龐大資料量的困難之一在於計算機的記憶體有限,所以無法一次完成對全部資料的處理。因此因應的方式之一便是將資料分割或分類儲存,之後再將分開處理的結果做一個結合,如此一來便可以解決計算機記憶體不足的問題。
資料量之龐大是資料探勘的特徵之一。而數目龐大的資料往往有資料來源不同分配的問題。分析這類的混合資料 (mixture data),原本就是棘手的問題。而當資料來源分配之個數以及分配之形式都未知時,統計分析的工作便更加的困難。
Royall & Tsou (2003) 提出了強韌概似函數 (robust likelihood function) 觀念。在樣本數大的時候,即使資料的真正分配未知,根據強韌概似函數還是能得到參數的正確的推論。而Tsou (2003) 則將強韌概似函數的方法推廣到在廣義線性模型架構之下的迴歸參數的推論的問題上。
本文將針對線性複迴歸模型,利用Tsou (2003) 介紹的強韌迴歸方法,針對分配未知的龐大資料,經由簡單平均和加權平均的結合方式,結合分段所估計出的迴歸參數,並對迴歸參數做統計推論。
關鍵字(中) ★ 強韌迴歸
★ 資料挖掘
關鍵字(英) ★ robust likelihood function
★ data mining
論文目次 第1章 緒論……………………………………………………………1
第2章 大樣本下的問題………………………………………………4
第3章 文獻回顧………………………………………………………8
3.1 常態實作模型的修正項…………………………………………11
3.2 伽碼實作模型的修正項…………………………………………13
第4章 結合方法………………………………………………………16
第5章 模擬研究………………………………………………………18
第6章 結論……………………………………………………………29
參考文獻………………………………………………………………31
參考文獻 Chao, M. T. and Lin, G. D. (1993). The asymptotic distributions of the remedians, Journal of Statistical Planning and Inference, 37, 1-11.
Hand, D. J. (1998). Data mining: statistics and more? The American Statistician. Vol. 52. No. 2.
Huang, H-D, Chang, H-L, Tsou, T-S, Liu, B-J, Kao, C-Y and Horng, J-H (2003). A data mining method to predict transcriptional regulatory sites based on differentially expressed genes in human genome. IEEE, 297-304.
Hurley, C. and Modarres, R. (1995). Low-storage quantile estimation. Computational Statistics, 10:311-325.
Rousseeuw, P. J. and Bassett , G.W., Jr. (1990). The remedia: A robust averaging method for large data sets. J. Amer. Statist. Assoc. Vol.85. No. 409, 97-104.
Royall, R.M and Tsou, T-S (2003). Interpreting statistical evidence using imperfect models: Robust adjusted likelihood functions. JRSS-B, 65, 391-404.
Tsou, T-S (2003). Parametric robust inferences for regression parameters under generalized linear models. (Submitted)
馬瀰嘉、蘇佩芳和林共進 (2001). 資料探勘-超大型資料庫基本統計量的計算。成功大學統計學報,第二十四期,68-84.
指導教授 鄒宗山(Tsung-Shan Tsou) 審核日期 2003-7-14
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明