DC 欄位 |
值 |
語言 |
DC.contributor | 統計研究所 | zh_TW |
DC.creator | 楊棋全 | zh_TW |
DC.creator | Chi-Chuan Yang | en_US |
dc.date.accessioned | 2004-6-21T07:39:07Z | |
dc.date.available | 2004-6-21T07:39:07Z | |
dc.date.issued | 2004 | |
dc.identifier.uri | http://ir.lib.ncu.edu.tw:88/thesis/view_etd.asp?URN=91225008 | |
dc.contributor.department | 統計研究所 | zh_TW |
DC.description | 國立中央大學 | zh_TW |
DC.description | National Central University | en_US |
dc.description.abstract | 依照Rubin的分類,處理遺失值可分為(1)完整的觀察體分析(complete-case analysis)(2)加權法(weight)(3)插補法(imputation)及(4)模式建構法四種方法。
在工業裡,指數與韋伯分佈是較常使用的統計模型,主要是用於表示產品的壽命。但是在收集資料同時,難免會遇到數據收集不到的情況,產生了遺失值。一般企業的作法為採用可觀測的資料來作決策,也就是將遺失資料刪除,一旦可觀測資料過少時,這些可觀測的資料是否值得相信?所作成的決策是否可信賴?這是令人質疑的地方。所以必須要有與其它遺失資料處理的一個比較方法,才能引導決策者正確下決策。
本文將重點放到指數與韋伯分佈遺失值插補法的比較,其中,數種插補法為本文首度提出,例如類似信賴區間插補法、類似預測區間插補法、分位數插補法、修正的分位數插補法、機率圖、附帶額外變異的機率圖。有些插補方法來自於Little與Rubin(2002)的著作,例如平均數插補法、熱卡法。還有一些來自於Wang與Rubins(1998)發表的結果。至於中位數插補法,本文針對韋伯分佈另外提出一種新的插補構想。此外,本文也將插補的結果與(1)完整的觀察體分析(complete-case analysis)及(4)模式建構法作一番比較。其中,完整的觀察體分析採用不同的參數估計量,例如MLE、動差法估計量、最小平方法估計量、廣義最小平方法估計量、絕對誤差估計量。模式建構法,則主要採用EM插補法。
比較的過程中,本文假設資料原本應該有n個,現在可觀測值有s個,遺失值有n-s個。採用多重插補法中,假設插補次數共有m次。本文分別考慮遺失比率(1-s/n)為20%、50%、80%,輔助樣本數(n)分別為10、20、40、60、80、100,搭配插補次數(m)為1~20、40、60、100,比較不同插補法的優缺點。比較的準則,主要是採用參數估計量的mse(mean square error),估計量的mse越小,表示該項方法越好。此外,針對插補方法,本文還採用一些評價指標作比較,另外也提出新的評價指標。這個動作主要是比較遺失資料插補前的數值與插補後的數值的差異。若比較結果差異為最小,表示此插補方法為還原遺失資料的最佳方法。
從參數估計量mse的比較上,可以得到本文所提的中位數插補法與分位數插補法在樣本數60以下為指數分佈下最佳的參數估計量;對於韋伯分佈,本文所提出的類似預測區間插補法、中位數插補法、修正的中位數插補法、修正的分位數插補法、附帶額外變異的機率圖在不同的樣本情況下,皆獲得不錯的成效。對於多重插補法次數m的決定,本文的結果建議要增加Rubin所建議的5~12次到8~20次,這樣才會獲得比較穩定的參數mse值。
除此之外,在常態分佈下,李興南(2002)證明出Rubin所提出的多重插補參數估計量的變異數估計量是不偏的估計量,代表此變異數估計量是適合的,但是本文在指數分佈下,證明出此變異數的估計量並非不偏,所以Rubin所提的變異數估計量並不是對任何分佈皆適用。 | zh_TW |
DC.subject | 遺失值 | zh_TW |
DC.subject | 多重插補法 | zh_TW |
DC.subject | 指數分佈 | zh_TW |
DC.subject | 韋伯分佈 | zh_TW |
DC.subject | 熱卡法 | zh_TW |
DC.subject | multiple imputation | en_US |
DC.subject | missing value | en_US |
DC.subject | hot deck | en_US |
DC.subject | mse | en_US |
DC.subject | Weibull distribution | en_US |
DC.subject | Exponential distribution | en_US |
DC.title | 指數與韋伯分佈遺失值之處理 | zh_TW |
dc.language.iso | zh-TW | zh-TW |
DC.type | 博碩士論文 | zh_TW |
DC.type | thesis | en_US |
DC.publisher | National Central University | en_US |