博碩士論文 104553006 詳細資訊




以作者查詢圖書館館藏 以作者查詢臺灣博碩士 以作者查詢全國書目 勘誤回報 、線上人數:5 、訪客IP:3.216.28.250
姓名 吳國群(Kuo-Chun Wu)  查詢紙本館藏   畢業系所 通訊工程學系在職專班
論文名稱 降低半色調HEVC畫面內預測計算複雜度之研究
(Computation Reduction For Half-toned HEVC Intra Prediction)
相關論文
★ 10Gb/s MM XFP光收發模組設計與實現★ 資訊產品自動化測試之研究
★ 高電流密度鰭式氮化鎵高電子遷移率電晶體研究★ 電子郵件及壓縮檔案解碼之研究
★ 渦輪碼在光學記錄系統上之應用★ 離散餘弦轉換硬體架構之研究
★ 動態影像之錯誤隱藏研究★ 即時性無失真壓縮編碼之研究
★ 類神經網路在手寫數字辨識之研究★ 事後機率演算法則在資料儲存系統之研究
★ 紅外線傳輸協定及通道之研究★ 低密度同位元檢查碼在數位資料儲存系統之研究
★ 一種新型的JPEG2000竄改偵測與還原技術★ 即時性無失真壓縮之研究
★ 混合快速模式決策演算法之研究★ 光學記錄MEPR2通道系統之時序恢復探討與研究
檔案 [Endnote RIS 格式]    [Bibtex 格式]    [相關文章]   [文章引用]   [完整記錄]   [館藏目錄]   至系統瀏覽論文 (2023-7-20以後開放)
摘要(中) 新一代的視訊壓縮標準HEVC(High Efficiency Video Coding)畫面內預測之角度模式提升至33個不同的方向,使得畫面內預測更加精確,進而提升壓縮效率。本文提及半色調技術包含有序抖色法與錯誤擴散法,我們運用此技術於HEVC畫面內預測,可改善複雜紋理區塊之預測畫面。33種角度模式在加入半色調技術後,畫面內預測種類激增為原始預測角度種類的兩倍,此作法雖可提升編碼效率,但相對的需要增加處理時間。
為了減少編碼時間,將針對預測單元及編碼單元兩部分分別運用快速模式決策演算法與支持向量機(Support vector machine, SVM)將成本較高的預測模式與部分深度省略以減少找尋最佳模式與深度的複雜度。在畫面內預測此步驟,將RDO(Rate-Distortion Optimization)程序中各候選模式的SATD成本參數與該預測單元最小SATD成本參數比較,若大於門檻值,即刪除該候選模式,藉此減少候選模式個數以節省時間;在編碼單元上,根據支持向量機的預測結果,分類編碼單元為複雜或是平滑紋理,以判斷當前的編碼單元要提前略過或提早終止,藉此加速編碼單元深度的判定,以達節省時間的效果。
摘要(英) The new video compression standard is the High Efficiency Video Coding (HEVC). In order to predict more accurately, the intra prediction has increased 33 different angle modes to promote the efficiency of compression. Half-toning techniques mentioned in this article including order dithering and error diffusion. We utilize those techniques in intra prediction dealing with complex textures. After adopting Half-toning techniques with 33 intra angle modes, it augments the prediction modes tremendously to two times of the original angle modes. Though the methods achieve better performance, the time consumption increases.
For the purpose to diminish time consumption, we aim at prediction units and coding units by employing fast-mode decision algorism and support vector machine (SVM) separately to skip modes with high candidate costs and some depths for reducing the complexities.
In the procedure of Rate Distortion Optimization (RDO) of intra prediction, we will compare the SATD costs of all candidate modes with the smallest one. If the ratio is higher than the threshold, then we delete the modes to reduce the number of candidates for time saving. When dealing with coding units, we skip the current depth or terminate deeper depths according to the results of SVM. By the results of SVM, we can know the texture is complex or smooth to accelerate choosing depth of coding units for the expectation of time reducing.
關鍵字(中) ★ HEVC
★ 畫面內預測
★ 半色調
★ 有序抖色法
★ 錯誤擴散法
★ 支持向量機
關鍵字(英) ★ HEVC
★ Intra Prediction
★ Half-toning
★ Ordered Dithering
★ Error Diffusion
★ SVM
論文目次 章節目錄
第一章 緒論 1
1.1 高效率視訊編碼(HEVC)簡介 1
1.2 研究動機與目的 6
1.3 論文架構 7
第二章 畫面內預測介紹與文獻回顧 8
2.1 HEVC畫面內預測模式探討 8
2.1.1 HEVC畫面內預測模式簡介與文獻回顧 10
2.1.2 HEVC畫面內預測之預測畫面優缺點分析 18
2.2 利用渲染方法改善HEVC畫面內預測論文回顧 20
2.3 利用半色調技術改善HEVC畫面內預測論文回顧 23
2.3.1 有序抖色法簡介與文獻回顧 24
2.3.2 錯誤擴散法簡介與文獻回顧 27
第三章 降低半色調技術於HEVC畫面內預測之複雜度方法 31
3.1 有序抖色法與HEVC畫面內預測之結合型演算法 31
3.2 畫面內預測快速模式決策演算法 36
3.2.1 畫面內預測快速模式決策演算法之探討與改良 36
3.2.2 深度與量化參數影響門檻值之探討 42
3.2.3 針對深度與量化參數探討β及γ值 45
3.3 有序抖色法運用畫面內預測快速模式決策演算法 59
3.4 錯誤擴散法與HEVC畫面內預測之結合型演算法 69
3.5 錯誤擴散法運用畫面內預測快速模式決策演算法 74
第四章 運用SVM加速半色調技術於HEVC畫面內預測編碼 93
4.1 支持向量機(Support Vector Machine)介紹 93
4.2 SVM特徵選取介紹 96
4.2.1 鄰近編碼單元深度資訊(Neighboring CU Depth Info) 96
4.2.2 變異數(Variance) 97
4.2.3 低頻交流值(AClow) 98
4.3 SVM應用於編碼單元(CU)進行快速深度決策 100
4.4 SVM深度決策及預測單元快速演算法之合併 107
第五章 結論與未來展望 122
參考文獻 124

圖目錄
圖 1.1 HEVC編碼架構 2
圖 1.2 編碼單元大小示意圖 3
圖 1.3 編碼單元八種切割方式 4
圖 2.1 畫面內預測35個預測模式對應之編號及方向 9
圖 2.2 二維參考像素投影至一維示意圖 10
圖 2.3 畫面內預測33個角度對應方向模式之編號 11
圖 2.4 Planar預測方式示意圖 12
圖 2.5 畫面內預測模式決策圖 13
圖 2.6 MPM鄰近區塊的參考預測單元 14
圖 2.7 HEVC畫面內預測流程圖 16
圖 2.8 決策編碼單元之最佳深度分割流程示意圖 17
圖 2.9 HEVC預測平滑區塊(DC模式) 18
圖 2.10 HEVC預測單一方向邊界特性的區塊(模式10) 19
圖 2.11 HEVC預測雙方向邊界特性區塊 (模式24) 20
圖 2.12 In-painting實例 21
圖 2.13 半色調法僅經過二值化與集中式有序抖色法之結果比較圖 25
圖 2.14 半色調法僅經過二值化與分散式有序抖色法之結果比較圖 26
圖 2.15 錯誤擴散法運算流程圖 28
圖 2.16 錯誤擴散法將誤差擴散的兩種概念 29
圖 2.17 半色調法僅經過二值化與加入錯誤擴散法之結果比較圖 30
圖 3.1 HEVC畫面內預測編碼之畫面分割方式 31
圖 3.2 16x16大小預測區塊之左上方部分與所使用遮罩示意圖 33
圖 3.3 HEVC角度預測與有序抖色法之結合型畫面內預測演算法流程圖 34
圖 3.4 HEVC量化參數22,各深度候選模式成本比例 37
圖 3.5 HEVC量化參數37,各深度候選模式成本比例 37
圖 3.6 HEVC加入有序抖色法,量化參數22,各深度候選模式成本比例 38
圖 3.7 HEVC加入有序抖色法,量化參數37,各深度候選模式成本比例 38
圖 3.8 ?值影響BDBR與時間趨勢圖 41
圖 3.9 有序抖色法加入快速模式決策演算法流程圖 45
圖 3.10 α值從1.5調整至1.0之BDBR與時間變化 62
圖 3.11 People On Street加入OD與AR後編碼效能比較 64
圖 3.12 BQ Terrace加入OD與AR後編碼效能比較 65
圖 3.13 BQ Mall加入OD與AR後編碼效能比較 66
圖 3.14 Basketball Pass加入OD與AR後編碼效能比較 67
圖 3.15 Vidyo3加入OD與AR後編碼效能比較 68
圖 3.16 擴散至四點和擴散至三點 70
圖 3.17 由 Ostromoukhov[25]修改之錯誤擴散方式 70
圖 3.18 預測區塊分割示意圖 71
圖 3.19 HEVC角度預測與錯誤擴散法之結合型畫面內預測演算法流程圖 72
圖 3.20 HEVC加入錯誤擴散法量化參數22,各深度候選模式成本比例 75
圖 3.21 HEVC加入錯誤擴散法量化參數37,各深度候選模式成本比例 76
圖 3.22 ?值影響BDBR與時間趨勢圖 79
圖 3.23 錯誤擴散法加入快速模式決策演算法流程圖 82
圖 3.24 α值從1.5調整至1.0之BDBR與時間變化 85
圖 3.25 People On Street加入ED與AR後編碼效能比較 87
圖 3.26 BQ Terrace加入ED與AR後編碼效能比較 88
圖 3.27 BQ Mall加入ED與AR後編碼效能比較 89
圖 3.28 Basketball Pass加入ED與AR後編碼效能比較 90
圖 3.29 Vidyo3加入ED與AR後編碼效能比較 91
圖 4.1 SVM分類示意圖 94
圖 4.2 SVM多元分類示意圖 95
圖 4.3 鄰近CU與當前CU的示意圖 96
圖 4.4 影像區塊與變異數的關係 97
圖 4.5 離散餘弦轉換後之方向性分布 99
圖 4.6 影像區塊與低頻交流值的關係 99
圖 4.7 SVM應用於編碼單元快速演算法流程圖 100
圖 4.8 畫面內預測應用SVM及半色調技術流程圖 103
圖 4.9 畫面內預測應用SVM、半色調技術與Adaptive Ratio流程圖 107
圖 4.10 OD+AR α值從1.5調整至1.0之BDBR與時間變化 110
圖 4.11 ED+AR α值從1.5調整至1.0之BDBR與時間變化 110
圖 4.12 People On Street加入OD、AR、SVM後編碼效能比較 112
圖 4.13 BQ Terrace加入OD、AR、SVM後編碼效能比較 113
圖 4.14 BQ Mall加入OD、AR、SVM後編碼效能比較 114
圖 4.15 Basketball Pass加入OD、AR、SVM後編碼效能比較 115
圖 4.16 Vidyo3加入OD、AR、SVM後編碼效能比較 116

表目錄
表 1.1 編碼單元深度及單元大小 3
表 1.2 不同深度之轉換單元大小 5
表 2.1 4x4集中式有序抖色遮罩 24
表 2.2 集中式有序抖色實際比對遮罩 24
表 2.3 貝氏遮罩 25
表 2.4 貝氏之實際比對遮罩 26
表 2.5 常見的錯誤擴散法遮罩 28
表 3.1 HM16.0加入有序抖色法之編碼效益、時間比較表 35
表 3.2 ?=1.5至1.0之BDBR表 39
表 3.3 ?=1.5至1.0之時間變化表 40
表 3.4 QP22 Basketball Pass前100張frame加入OD的最佳模式分布比例 42
表 3.5 QP37 Basketball Pass前100張frame加入OD的最佳模式分布比例 43
表 3.6 Basketball Pass QP22 & 37深度2、4之最佳模式分布比例(OD) 43
表 3.7 β=0.2 γ=0各量化參數、深度之閾值表 47
表 3.8 僅考慮預測單元大小β=0.2, γ=0之BD效能表 47
表 3.9 β=0.1 γ=0各量化參數、深度之閾值表 48
表 3.10 僅考慮預測單元大小β=0.1, γ=0之BD效能表 48
表 3.11 β=0.05 γ=0各量化參數、深度之閾值表 49
表 3.12 僅考慮預測單元大小β=0.05, γ=0之BD效能表 49
表 3.13 β=0 γ=0.016各量化參數、深度之閾值表 50
表 3.14 僅考慮量化參數β=0, γ=0.016之BD效能表 50
表 3.15 β=0 γ=0.008各量化參數、深度之閾值表 51
表 3.16 僅考慮量化參數β=0, γ=0.008之BD效能表 51
表 3.17 β=0 γ=0.004各量化參數、深度之閾值表 52
表 3.18 僅考慮量化參數β=0, γ=0.004之BD效能表 52
表 3.19 HEVC加入有序抖色法QP為22之各層深度分布比例 53
表 3.20 HEVC加入有序抖色法QP為37之各層深度分布比例 53
表 3.21 β=0.1 γ=0.008各量化參數、深度之閾值表 55
表 3.22 考慮量化參數與區塊大小β=0.1, γ=0.008之BD效能表 55
表 3.23 β=0.05 γ=0.004各量化參數、深度之閾值表 56
表 3.24 考慮量化參數與區塊大小β=0.05, γ=0.004之BD效能表 56
表 3.25 β=0.025 γ=0.002各量化參數、深度之閾值表 57
表 3.26 考慮量化參數與區塊大小β=0.025, γ=0.002之BD效能表 57
表 3.27 α=1.5至1.0之BDBR表 60
表 3.28 α=1.5至1.0之時間變化表 61
表 3.29 Stucki 遮罩 69
表 3.30 由Stucki 遮罩改良的錯誤擴散法權重遮罩 69
表 3.31 將Stucki 遮罩改小 71
表 3.32 HM16.0加入錯誤擴散法之編碼效益、時間比較表 73
表 3.33 ?=1.5至1.0之BDBR表 77
表 3.34 ?=1.5至1.0之時間變化表 78
表 3.35 QP22 Basketball Pass前100張加入ED的最佳模式分布比例 80
表 3.36 QP37 Basketball Pass前100張加入ED的最佳模式分布比例 80
表 3.37 Basketball Pass QP22 & 37深度2、4之最佳模式分布比例(ED) 81
表 3.38 α=1.5至1.0之BDBR表 83
表 3.39 α=1.5至1.0之時間變化表 84
表 4.1 鄰近編碼單元的權重值 96
表 4.2 6個代表性QP之參數表 101
表 4.3 HM16.0加入SVM編碼效能、時間比較表 102
表 4.4 HEVC加入有序抖色法與SVM之編碼效能、時間表 104
表 4.5 HEVC加入有序抖色法與SVM之編碼效能、時間表 105
表 4.6 HEVC加入有序抖色法、AR與SVM之編碼效能、時間表 108
表 4.7 HEVC加入錯誤擴散法、AR與SVM之編碼效能、時間表 109
表 4.8 HEVC加入有序抖色法、AR與SVM之編碼效能、時間表 117
表 4.9 HEVC加入錯誤擴散法、AR與SVM之編碼效能、時間表 118
表 4.10 HEVC加入有序抖色法、AR與SVM之編碼效能、時間表 119
表 4.11 HEVC加入錯誤擴散法、AR與SVM之編碼效能、時間表 120
參考文獻 6參考文獻
[1] “Generic coding of moving pictures and associated audio information,” ISO/IEC 13818-2: Video (MPEG-2), May 1996.
[2] “Coding of audio-visual objects - Part 2: Visual,” in ISO/IEC 14496-2 (MPEG-4 Visual Version 1), Apr. 1999.
[3] Advanced Video Coding for Generic Audio-Visual Services, ITU-T Rec.H.264 and ISO/IEC 14496-10 (AVC), ITU-T and ISO/IEC JTC 1, May2003 (and subsequent editions).
[4] JCT-VC, “High Efficiency Video Coding (HEVC) Test Model 11(HM 11) Encoder Description”, JCTVC-L1002,JCT-VCMeeting, Incheon,Jan.2013.
[5] Ying-Hsiu Lai and Yinyi Lin, “Error Diffused Intra Prediction for HEVC,” in Proc. ICASSP, PP. 1424-1427, April 2015.
[6] Chien-Hung Chen and Yinyi Lin, “Enhanced HEVC Intra Prediction with Ordered Dither Technique,” in Proc. ICASSP, PP. 1447-1450, April 2016.
[7] J. Min, S. Lee, I. Kim, W. J. Han, J. Lainema, and K. Ugur, “Unification of the directional intra prediction methods in TMuC,” JCTVC-B100, Geneva, CH, 21-28 July 2010.
[8] T. K. Tan, M. Budagavi, and J. Lainema, “Summary Report for TE5 on Simplification of Unified Intra Prediction,” JCTVC-C046, Guangzhou, China, Oct. 2010.
[9] M. Wien, “Variable block-size transform for H.264/AVC,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, No.7, 604-619, 2003.
[10] G. J. Sullivian, J. R. Ohm, W. J. Han and T. Wiegand, “Overview of the High Efficiency Video Coding(HEVC) Standard,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 12, Dec. 2012.
[11] M. Bertalmio, G. Sapiro, V. Caselles and C. Ballester, “Image inpainting,” in Proceedings of ACM SIGGRAPH, Jul. 2000, pp. 417-424.
[12] T. F. Chan and J. Shen, “Mathematical models for local non-texture inpainting,” SIAM Journal on Applied Mathematics, vol. 62, no. 3, pp.1019-1043, 2002.
[13] T. F. Chan and J. Shen, “Non-texture inpainting by curvature-driven diffusions,” Journal of Visual Communication and Image Representation, vol. 12, issue 4, pp. 436-449, 2001.
[14] Y. Wu, M. Wang, X. Liu, “A Fast Inpainting Algorithm Using Half-Point Gradient,” in Proceedings of IEEE Second International Workshop on Computer Science and Engineering, China, 28-30 Oct. 2009.
[15] D. Liu, X. Sun, F. Wu and etc., “Edge-oriented Uniform Intra Prediction,” IEEE Transactions on Image Processing, vol. 17, no. 10, pp. 1827-1836, Oct. 2008.
[16] D. Doshkov, P. N. Nya, H. Lakshman and etc., “Towards Efficient Intra Prediction based on Image Inpainting Method,” in Proceedings of Picture Coding Symposium, Dec. 2010, pp.470-473.
[17] X. Qi, T. Zhang, F. Ye and etc., “Intra Prediction with Enhanced Inpainting Method and Vector Prediction for HEVC”, IEEE International Conference on ICASSP, pp. 1217-1220, March 2012
[18] Y. Zhang, “Improving HEVC Intra Prediction with Inpainting Method,” Master Thesis, National Central University, July 2013.
[19] R. Ulichney, “A review of halftoning techniques,” Cambriddge Research Lab, Cambridge, MA 02139, USA.
[20] Henry R. Kang, “ Digital Color Halftoning, ”Peerless Systems Corporation, 1999.
?
[21] Jae-Woo Ahn and Wonyong Sung, Member,“Multimedia processor-based implementation ofan error-diffusion halftoning algorithm exploiting subword parallelism, ” Circuits and Systems for Video Technology, IEEE Transactions on, Volume:11 Issue: 2 , Feb 2001. Page(s): 129 -138
[22] R. W. Floyd and L. Steinberg, “An adaptive algorithm for spatial grayscale,” in Proceedings of the Society of Information Display, 1976, vol. 17/2, pp. 75-77.
[23] J. Jarvis, C. Judice, and W. Ninke, “A survey of techniques for the display of continuous tone pictures on bilevel displays,” Computer Graphics and Image Processing, vol. 5, pp. 13-40, May 1976.
[24] P. Stucki, “Image processing for document reproduction,” Advances in Digital Image Processing, New York, NY: Plenum, pp. 177-218, 1979.
[25] V. Ostromoukhov, “A Simple and Efficient Error-Diffusion Algorithm,”
Universit’e de Montr’eal, pp.567-572
[26] B. E. Bayer, “An optimum method for two-levelrendition of continuous-tone pictures, ” IEEE Int.Conf. Commum., Vol. 1, 1973.
[27] G. Bjontegarrd, “Calculation of average PSNR differences between RD curves,” in Proceedings of International Telecommunication Union SC16/Q6 13th Vedio Coding Experts Group meeting(ITU-T VCEG), Austin, TX, Apr. 2001, No.VCEG-M33.
[28] Yang Wang, Xiaopeng Fan, Liang Zhao, Siwei Ma, Debin Zhao, Wen Gao, “A Fast intra coding Algorithm for HEVC”, IEEE International Conference on Image Processing(ICIP),10.1109/ICIP.2014.7025836, Oct.2014
[29] Liquan Shen, Zhaoyang Zhang, Ping An, “Fast CU Size Decision and Mode Decision Algorithm for HEVC Intra Coding”, IEEE Transactions on Consumer Electronics, vol. 59, no 1, Feb.2013
[30] Syun-Jie Cai and Yinyi Lin, “Reduction of Computation Complexity for HEVC Intra Prediction with Support Vector Machine,” Master Thesis, National Central University, July 2017.
指導教授 林銀議(Yin-Yi Lin) 審核日期 2018-7-20
推文 facebook   plurk   twitter   funp   google   live   udn   HD   myshare   reddit   netvibes   friend   youpush   delicious   baidu   
網路書籤 Google bookmarks   del.icio.us   hemidemi   myshare   

若有論文相關問題,請聯絡國立中央大學圖書館推廣服務組 TEL:(03)422-7151轉57407,或E-mail聯絡  - 隱私權政策聲明