English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 42118989      線上人數 : 1262
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/83959


    題名: 結合語義分割特徵與注意力模型之室內場景分類系統;Indoor Scene Image Classification System combining Semantic Segmentation Features and Attention Module
    作者: 黃健銘;Huang, Jian-Ming
    貢獻者: 資訊工程學系
    關鍵詞: 場景辨識;語義分割;注意力模型;特徵融合
    日期: 2020-07-21
    上傳時間: 2020-09-02 17:46:55 (UTC+8)
    出版者: 國立中央大學
    摘要: 場景辨識是電腦視覺中重要的一個環節,現今機器學習的方法效能遠遠高於傳統處理的方式,然而,直接使用神經網路進行分類往往會遺失物體、空間佈局、和背景之間關聯的資訊,導致分類效果不佳。因此抓取出物體、空間佈局、和背景之間關聯的資訊,並使用有效的方式將這些資訊、特徵與原圖結合進行分類,是目前場景分類中重要的挑戰。
    本論文提出的方法,對影像做語義分割,並將語義分割影像與原圖影像分別使用神經網路模型提取特徵,將語義分割特徵使用注意力模型與原圖特徵進行特徵融合,最後進行分類、辨識。
    實驗結果證明,在我們收集的旅館室內場景資料集中,準確率能達到最好的效果。在公開15-Scene資料集中,比較其他論文方法,我們方法的效果可以取得更好的分類準確度。因此,透過使用語義分割的方式,能夠抓取到物體、空間佈局和背景之間關聯的資訊,並使用注意力模型進行特徵融合,能在場景辨識中取得更好的辨識效果。
    ;Scene recognition is an important part of computer vision. The efficiency of current machine learning methods is much better than traditional processing methods. However, using neural networks directly for classification often loses more information of objects, spatial layout, and background. Resulting in poor classification. Therefore, it is an important challenge in scene classification to capture the information of objects, spatial layout, and background, and use an effective method to merge these features to classify scene.
    The method proposed in this paper performs semantic segmentation on the image. Use Neural network model to extract the features of the semantic segmentation image and original image respectively. And then, use the attention module to fuse the semantic segmentation features with original image features. Finally, according to these fused features to classify images.
    The experiment results show that our method can achieve the best result on the Hotel Indoor Scene dataset. Furthermore, in the public 15-Scene dataset, our method can outperform existing methods. Therefore, by using semantic segmentation, the information of objects, spatial layout and background can be captured. Using the attention module to do feature fusion can achieve better accuracy in scene recognition.
    顯示於類別:[資訊工程研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML110檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明