博碩士論文 90225019 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:7 、訪客IP:18.190.153.51
姓名 邵莉雅(Li-Ya Shao)  查詢紙本館藏   畢業系所 統計研究所
論文名稱 龐大資料集之線性迴歸分析
(Linear regression for large data base.)
相關論文
★ 具Box-Cox轉換之逐步加速壽命實驗的指數推論模型★ 多元反應變數長期資料之多變量線性混合模型
★ 多重型 I 設限下串聯系統之可靠度分析與最佳化設計★ 應用累積暴露模式至單調過程之加速衰變模型
★ 串聯系統加速壽命試驗之最佳樣本數配置★ 破壞性加速衰變試驗之適合度檢定
★ 串聯系統加速壽命試驗之最佳妥協設計★ 加速破壞性衰變模型之貝氏適合度檢定
★ 加速破壞性衰變模型之最佳實驗配置★ 累積暴露模式之單調加速衰變試驗
★ 具ED過程之兩因子加速衰退試驗建模研究★ 逆高斯過程之完整貝氏衰變分析
★ 加速不變原則之偏斜-t過程★ 花蓮地區地震資料改變點之貝氏模型選擇
★ 颱風降雨量之統計迴歸預測★ 花蓮地區地震資料之長時期相關性及時間-空間模型之可行性
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   [檢視]  [下載]
  1. 本電子論文使用權限為同意立即開放。
  2. 已達開放權限電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
  3. 請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。

摘要(中) 隨著科技的進步,各行各業的資料可能數以”億”計。但在極大集資料分析上,受計算工具儲存容量的限制,使得傳統的方法不可行。本文提出分段加權最小平方法來取代傳統的迴歸方法。我們將資料予以分組,先在各區段中估計迴歸係數,再將各段迴歸係數估計量的變異數加入考慮,使得較大變異區段之估計量具有較小的權重,進而探討估計量之性質。另外並提出一檢定迴歸係數之分段檢定法以及切斷分割原理和選擇變數的方法。
摘要(英) Many classical methods are not used for large data base . This paper is base on the statistic point to analysis the large data base . We prefer three regression methods to analysis data of large data base.
關鍵字(中) ★ 龐大資料集
★ 迴歸
★ 資料挖掘
關鍵字(英) ★ Large data base
★ Data Mining
★ regression
論文目次 目 錄
第1章 緒論…………………………………………………………1
1.1 研究動機……………………………………………………1
1.2 研究方法……………………………………………………3
第2章 傳統模型與方法……………………………………………5
2.1 傳統迴歸模型………………………………………………5
2.2 傳統迴歸變數選擇法………………………………………6
2.3 龐大資料集…………………………………………………8
第3章 模型與方法…………………………………………………9
3.1 分段加權最小平方法………………………………………9
3.2 最佳加權估計量之抽樣分配………………………………12
第4章 龐大資料集之檢定與變項選取法…………………………15
4.1 迴歸係數之加權檢定及區間估計…………………………15
4.2 迴歸係數分段檢定法………………………………………16
4.3 分段樣本數研究……………………………………………18
4.4 分段變數選擇法……………………………………………20
第5章 模擬結果及實例分析………………………………………23
5.1 迴歸係數分段檢定法及區間估計之模擬…………………23
5.1.1 各區段誤差項具相同變異數……………………………23
5.1.2 各區段誤差項具不同變異數……………………………25
5.2 分段變數選擇法之模擬……………………………………27
5.3 戶口普查資料分析…………………………………………31
5.3.1 資料描述…………………………………………………31
5.3.2 分段變數選擇法對映於普查資料………………………34
第6章 討論及未來發展方向………………………………………37
第7章 參考文獻……………………………………………………38
表 目 錄
表1:各區段誤差項具相同變異數,不同 , 組合下之臨界值 和型一誤差 …………………………………………………………………24
表2:各區段誤差項具相同變異數下,兩種分段加權平均之區間估計的覆蓋機率 ……………………………………………………………25
表3:各區段誤差項變異數不同下,最佳權重與等量權重之比較……26
表4:模型 選出變數係數之估計量 …………………………………29
表5:模型 選出變數係數之估計量 …………………………………30
表6:普查資料之各變項相關係數表 …………………………………34
表7:普查資料選入變數係數之估計量………………………………36
圖 目 錄
圖1:普查資料之個人年收入直方圖………………………………33
圖2:普查資料之log(個人年收入)直方圖………………………33
參考文獻 2. Chao, M. T. and Lin, G. D. (1993). The Asymptotic Distributions of the Remedians. Journal of Statistical Planning and Inference, 37, 1-11.
3. Draper, N. R. , Smith, H. (1998). Applied Regression Analysis 3nd Ed.
Wiley, New York .
4. Hand, D. J., Blunt, G., Kelly, M. G. and Adams, N. M. (2000). Data
mining for Fun and Profit. Statistical Sciences, 15, 111-131.
5. Hand, D. J. (1998). Data mining : Statistics and more ? .American Statistician, 52, 112-119.
6. Hurley, C. and Modarres, R. (1995).Low-storage quantile estimation. Computational Statistics, 10, 311-325.
7. Neter, J., Kutner, M. H., Nachtsheim, C. J. and Wasserman W. (1996). Applied Linear Regression Models, 3rd ED, Richard D. Irwin, Burr Ridge,Illinois.
8. 林共進和林億雄(2001)。 龐大資料集的統計推論方法。成功大學統計學報,第二十四期,68-84。
9. 馬瀰嘉、蘇佩芳和林共進(2001)。資料探勘-超大型資料庫基本統計量的計量。成功大學統計學報,第二十四期,85-99。
10.任眉眉、林億雄和林共進(2002)。龐大資料集之簡單線性迴歸分析。Manuscript 。
指導教授 樊采虹(Tsai-Hung Fan) 審核日期 2003-6-26
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明