中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/81202
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 81570/81570 (100%)
造访人次 : 47024866      在线人数 : 113
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/81202


    题名: 基於深度學習之工業用智慧型機器視覺系統:以文字定位與辨識為例;An Industrial AI Vision System based on Deep Learning : A Case Study of Industrial Text Localization and Recognition
    作者: 楊凱霖;Yang, Kai-Lin
    贡献者: 資訊工程學系
    关键词: 深度學習;機器視覺;Deep Learning;Computer Vision
    日期: 2019-07-26
    上传时间: 2019-09-03 15:39:14 (UTC+8)
    出版者: 國立中央大學
    摘要: 光學影像上文字定位與辨識的應用相當廣泛,例如:辨識生產日期、產品料號和藥物編號等…。若要辨識影像上的文字,則首先定位出文字的邊界框,之後在對邊界框內的文字進行辨識。

    而若要在深度學習的方法下得到非常準確以及穩健的結果,則往往需要非常大量的資料作進行網路模型的訓練;另外在深度學習進行訓練以及測試前提下,需要對影像做預處理如:影像的裁切、影像的縮放與轉正、影像的標記以及利用影像處理的方法增加影像的數量等…。然而影像的預處理是一件非常耗費時間與精力的工作,所以為了能夠只需要少量資料,而得到很好的準確率以及穩健性的目標,本篇論文利用了遷移學習的方法。除了在預訓練模型需要耗費大量資料與時間之外,對於再訓練模型的後續應用上,能夠以少量的文字影像資料,使得測試準確度可達到95% 以上的水準。
    ;The application of text detection and recognition on optical images is quite extensive. For example, recognition of production date, product part number and drug number, etc... To recognize the text on an image, one has to first detect the bounding box of the text, and then perform the text recognition for the localized image.

    However, in order to get a very accurate and robust results under deep learning method, huge amount of data is indispensable for the training of the network model. In addition, before training and testing a deep learning model, it is important to preprocess the image, such as image cropping, scaling and rotating… etc. Data augmentation, which is an approach to increase the number of images, is also important. However, image preprocessing is a very time-consuming and tedious work. In this research, transfer learning is applied to achieve the goal of deep learning training using a small amount of data and get a model with a good accuracy and robustness. In addition to the large amount of data and time required in pre-training a model, the subsequent retrained model can achieve an accuracy higher than 95% in a small amount of text image data.
    显示于类别:[資訊工程研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML170检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明