姓名 朱冠宇(Guan-Yu Zhu)  查詢紙本館藏   畢業系所 光電科學與工程學系
論文名稱 基於卷積神經網路之光場顯示眼動追蹤模型
(CNN-Based Gaze Estimation for Light Field Display)
摘要(中) 本論文旨在開發應用於頭戴式光場顯示的眼動追蹤模型。本模型以機器學習為基礎,以可見光的攝影機進行拍攝,利用捕捉到人眼的可見光影像作為輸入,經過神經網路得到對應的人眼凝視點作為輸出。
本模型是由兩種網路架構串連而成的,分別為特徵定位模型以及映射模型,其中特徵定位模型利用卷積神經網路(convolution neural network,簡稱CNN)提取RGB影像的特徵圖,再使用特徵圖計算人眼在影像中的對應座標X_e、Y_e,目前並沒有對應的資料庫能夠符合光場顯示的應用場域,因此我們設計了一套拍攝架構用於產生眼睛影像的資料庫;映射模型為全連接網路(fully connected network,簡稱FCN)架構,在每次眼動追蹤前紀錄一組校正影像,接著使用校正影像訓練映射模型的參數,訓練完成的映射模型能將眼睛(影像)座標X_e、Y_e轉換成凝視點(螢幕)座標X_g、Y_g,達到眼動追蹤的目的。
摘要(英) This study aims to develop an eye-tracking model for use in head-mounted light field displays. The model is based on machine learning and utilizes a visible light camera to capture images. It takes the captured visible light images of the human eye as input and employs a neural network to output the corresponding gaze point.
The model consists of two interconnected network architectures: the feature localization model and the mapping model. The feature localization model utilizes a Convolutional Neural Network (CNN) to extract feature maps from RGB images. These feature maps are then used to compute the corresponding coordinates, X_e and Y_e, of the human eye in the image. Since there is currently no existing database that matches the application domain of light field displays, we designed a capture setup to generate a database of eye images.
The mapping model employs a Fully Connected Network (FCN) architecture. Before each eye-tracking session, a set of calibration images is recorded. The parameters of the mapping model are then trained using these calibration images. The trained mapping model can convert the eye (image) coordinates X_e and Y_e to gaze point (screen) coordinates X_g and Y_g, thereby achieving eye-tracking.
The main contributions of this research are as follows: (1) Establishing an eye-tracking database for light field displays, (2) Developing an eye-tracking model specifically designed for light field displays, and (3) Utilizing RGB images for tracking without the need for additional light sources.
關鍵字(中) ★ 眼動追蹤
★ 卷積神經網路
★ 光場
論文目次 摘要 I
Abstract II
致謝 III
目錄 IV
圖目錄 VI
表目錄 IX
第一章 緒論 1
1.1 引言 1
1.2 研究動機 2
第二章 眼動追蹤之基本原理 4
2.1 眼動追蹤簡介 4
2.2 眼動追蹤方法 6
2.2.1 2D回歸法 6
2.2.2 3D模型法 8
2.2.3 交叉比率法 10
2.2.4 基於容貌的方法 11
2.2.5 基於形狀的方法 13
2.3 MR眼鏡相關技術 15
2.3.1 擴瞳技術 16
2.3.2 光場顯示技術 18
2.3.3 MR眼鏡之眼動追蹤 21
2.4 人工智慧簡介 23
2.5 機器學習 23
2.5.1 類神經網路 24
2.5.2 反向傳遞 26
2.6 卷積神經網絡 29
第三章 實驗設計與流程 32
3.1 實驗設計 32
3.2 實驗流程 35
3.3 資料庫的建立 39
3.4 模型參數 42
第四章 實驗結果 45
4.1 特徵定位模型 45
4.2 映射模型 49
第五章 結論 68
參考文獻 69
