姓名 陳正浩(Zheng-Hao Chen)  查詢紙本館藏   畢業系所 軟體工程研究所
論文名稱 半監督學習下自定義編碼特徵的大規模比較
(A Large-scale Comparison of Customized Feature Encodings under Semi-supervised Learning)
摘要(中) 自定義編碼方式可有效提升深度學習模型在監督式任務的表現,但自定義編碼方式在自監督對比學習的效果則尚未被大規模驗證。本論文設計並實現了一個靈活的自定義特徵編碼框架,讓研究者可以大規模比較比較不同編碼方式在自監督任務的效果。同時,我們提出了一種新的編碼方式,探索其在不同資料集上的潛力和應用價值。
摘要(英) Custom encoding methods can effectively enhance the performance of deep learning models in supervised tasks. However, custom encoding′s effectiveness in self-supervised contrastive learning has yet to be extensively validated. This paper designs and implements a flexible framework for custom feature encoding evaluation, allowing researchers to comprehensively compare the effects of different encoding methods on self-supervised tasks. Additionally, we propose a new encoding method to explore its potential and application value across various datasets.
關鍵字(中) ★ 自監督學習
★ 對比學習
★ 表格資料
★ 自定義編碼
關鍵字(英) ★ Self-supervised learnin
★ Contrastive learnin
★ tabular data
★ custom encoding
論文目次 目錄
摘要 v
Abstract vi
誌謝 vii
目錄 viii
使用符號與定義 xiii
一、 緒論 1
二、 相關研究 3
2.1 SCARF .................................................................... 3
2.1.1 損壞特徵的數據增強 .......................................... 3
2.1.2 SCARF 方法 .................................................... 3
2.2 數值特徵編碼 ............................................................ 5
2.2.1 分段線性編碼 ................................................... 5
2.2.2 分段線性編碼方法 ............................................. 6
2.2.3 週期激勵函數 ................................................... 7
2.2.4 週期激勵函數方法 ............................................. 8
三、 框架設計 9
3.1 框架設計理念 ............................................................ 9
3.2 框架架構 .................................................................. 9
3.2.1 核心組件 ......................................................... 9
3.2.2 模組間的交互 ................................................... 10
3.3 應用程式界面 (API).................................................... 11
四、 研究模型及方法 12
4.1 整體模型架構 ............................................................ 12
4.2 標準差編碼 ............................................................... 14
4.3 自定義編碼器設計 ...................................................... 15
4.3.1 基本訓練 ......................................................... 15
4.3.2 快速實驗 ......................................................... 15
4.3.3 自定義模型 ...................................................... 16
五、 實驗結果與分析 21
5.1 實驗環境、參數細節及設定 .......................................... 21
5.2 資料集 ..................................................................... 21
5.3 實驗結果 .................................................................. 25
5.3.1 二元分類 ......................................................... 25
5.3.2 多元分類 ......................................................... 26
5.3.3 高維度特徵分類 ................................................ 27
5.3.4 大型資料集分類 ................................................ 28
5.4 討論 ........................................................................ 29
六、 總結 30
6.1 結論 ........................................................................ 30
6.2 未來展望 .................................................................. 30
參考文獻 32
附錄 A 實驗程式碼 35
附錄 B 資料集 36
指導教授 陳弘軒(Hung-Hsuan Chen) 審核日期 2024-7-30
