dc.description.abstract | 假設 n_{i},i=1,...,K , 是多項分佈第 i 類的觀察值 , 則第 i 格機率
的最大概似估計量是 ,i=1,...,K . 因為當觀察值個數 n 很小或當 K 值
很大時則很多 值為 0 .為改善此缺點 , Aitchison 和 Aitken (1976) 提
出下列離散型估計量
= (1- ) +
i=1,...,K . 文獻中有很多決定平滑參數 的方法 , 例如 , 最大修正概似值
法 ( maximize-modified-likelihood ) ( Aitchison 和 Aitken (1974) ) , 最
小均方差法 ( minimize-mean-squar-error ) ( Hall (1981) ) , 和 交叉認
證法 ( cross-validation ) ( Stone (1974) ), 等等 , 詳細內容請參考 Hand
(1982)的書.
這篇論文之想法得自定點連續核估計法 . 連續機率密度 f(x) 之核估計為
= ,
其中 h 為窗距 , 為一已知的密度函數 . 理想的 h 是 f(x) 的函數 , 以
h = S(f(x))表之而 又是 h 的函數以 = H(h) 表示 , 因任一好的估計
式 (x) ~ (x) , 故 h 滿足一個定 點方程式 h ~ S( (x)) = S(H(h)) , 詳
細內容請參考 Sheather 和 Jones (1991) . 這個方法叫第二代的窗距選法 , 它
比第一代窗距選法較可靠 . 詳細內容請參考 . Jones et al . (1996) .
定點法也能應用到離散型核估計而這也是本文的目的 . 換言之設
= (p ,...,p ) 和 = ( ,..., ) . 任何理想的 是機率的函數 , 即
= F(P) . 顯然地 , 是 的函數也就是 = G( ) . 任意好的估計
量必 定接近 P , 所以 = F(G( )) 或 = G(F( )) .本文將討論此
兩個方程式之定點 ,當作 和 P 之估計式 .
本文之第二節討論平滑參數 之定點方程式及近似解 , 第三節討論機
率 P 之定點方程式及近似解 , 第四節為結論 .
第二節 平滑參數 之定點方程式及近似解
令
M( ) = E
其中 = 1 , 且 0 1 , i=1,.......,K .
則
M( ) = (1- )
解方程式上述方程式之根為
由下列方程式
在將代入上式
可得
[ ( -2 + ) + ] - [ ( -2 + ) + ] + (1- ) = 1 - [ ( -2 + ) + ] ,
最後表成 之三次多項方程式
[(1- ) - + ] +[( -2) + - ] + [(1- ) - + +1] + - 1 = 0
令
a = (1- ) - + , b = ( -2) + - .
c = (1- ) - + +1 , d = - 1 .
則可簡化成下列方程式 a +b +c +d = 0
因為上列的不等式在 n n+1 時成立 , 而當 n 夠大時 n n+1 必成立 .
(若存在 j 使 n=n 恒成立則 p = 1 , 我們不考慮此特殊情形) .
由上述結果 , 我們得到下式
= 0
且
= O( )} ,
故
a +b +c +d = 0 ~ c +d = 0
即 近似解
所以當 n 3 時
所以我們可得
> 0 .
本節之結論為定點法不只在小樣本有合理解釋在大樣本時亦是有效的.
| zh_TW |