姓名 王承凱(Cheng-Kai Wang) 畢業系所 軟體工程研究所 論文名稱 利用 SCPL 分解端到端倒傳遞演算法
摘要(中) 倒傳遞 (Backpropagation, BP) 是當今深度神經網路更新權重演算法
的基石,但反向傳播因反向鎖定 (backward locking) 的問題而效率不佳。
本研究試圖解決反向鎖定問題,並將提出的新方法命名為 Supervised
Contrastive Parallel Learning (SCPL),SCPL 利用監督對比損失函數作為每個卷積層的區域目標函數,因為每一層的區域目標函數間互相隔離,
SCPL 可以平行地學習不同卷基層的權重。
各自的優勢與限制,並討論此議題未來的研究方向。摘要(英) Backpropagation (BP) is the cornerstone of today’s deep learning algorithms to update the weights in deep neural networks, but it is inefficient partially because of the backward locking problem. This thesis proposes Supervised Contrastive Parallel Learning (SCPL) to address the issue of backward locking. SCPL uses the supervised contrastive loss as the local objective function for each layer. Because the local objective functions in different layers are isolated, SCPL can learn the weights of different layers in parallel. We compare SCPL with recent works on neural network parallelization. We discuss the advantages and limitations of the existing methods. Finally, we suggest future research directions on neural network parallelization. 關鍵字(中) ★ 倒傳遞
★ 反向鎖定
★ 監督對比損失函數
★ 平行化訓練
★ 監督式 對比平行學習關鍵字(英) ★ Backpropagation
★ backward locking
★ supervised contrastive loss
★ parallel learning
★ supervised contrastive parallel learning論文目次 摘要 v
Abstract vi
致謝 vii
目錄 viii
一、 緒論 1
二、 相關研究 4
三、 研究模型及方法 6
3.1 對比學習的機制 ......................................................... 6
3.2 監督對比損失函數 ...................................................... 8
3.3 學習機制與網路架構 ................................................... 9
3.4 推論函數及假設空間 ................................................... 11
3.5 與其他方法比較 ......................................................... 11
3.6 模型虛擬碼 ............................................................... 12
四、 實驗結果與分析 14
4.1 實驗設定與實作細節 ................................................... 14
4.1.1 實驗設定 ......................................................... 14
4.1.2 實作細節 ......................................................... 14
4.2 分類任務準確率 ......................................................... 17
4.2.1 CIFAR-10 ........................................................ 17
4.2.2 CIFAR-100....................................................... 18
4.2.3 TinyImageNet-val .............................................. 18
4.3 泛化能力測試 ............................................................ 19
4.4 消融實驗 .................................................................. 21
4.4.1 資料擴增 ......................................................... 21
4.4.2 批次大小 ......................................................... 22
4.4.3 投影頭 ............................................................ 23
4.5 討論 ........................................................................ 24
4.5.1 方法比較與分析 ................................................ 24
4.5.2 問題探討 ......................................................... 25
五、 總結 27
5.1 結論 ........................................................................ 27
5.2 未來展望 .................................................................. 28
參考文獻 29
指導教授 陳弘軒(Hung-Hsuan Chen) 審核日期 2022-7-19