English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 78852/78852 (100%)
造訪人次 : 35108560      線上人數 : 352
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/81187


    題名: 華語--印尼語機器翻譯;Chinese-Indonesian Low-Resource Neural Machine Translation
    作者: 穆何曼;Fhadli, Muhammad
    貢獻者: 資訊工程學系
    關鍵詞: 中文;印度尼西亞語;機器翻譯;師生框架;轉學習;Chinese;Indonesian;Machine Translation;Teacher-StudentFramework;Transfer Learning
    日期: 2019-07-25
    上傳時間: 2019-09-03 15:38:48 (UTC+8)
    出版者: 國立中央大學
    摘要: 從低資源數據中構建一個好的機器翻譯器是最近的挑戰之一。為了解決這個問題,出現了轉移學習並為此問題提供了解決方案。機器翻譯器的另一個重要問題是構建沒有平行語料庫資源的良好機器翻譯器。該問題的解決方案之一是使用師生框架來生成生成並行語料庫的源-目標機器。在本文中,我們試圖利用機器生成的語料庫來解決構建低資源機器翻譯的問題。基本上,我們結合解決低資源和零資源機器翻譯問題的解決方案來解決資源機器翻譯本身的問題。我們的想法是生成大量機器生成的數據,我們可以將這些數據用於培訓,然後使用轉移學習繼續使用低資源數據進行培訓。我們在本論文中的貢獻證明,機器生成的數據可以幫助我們培訓低資源的人為數據。據我們所知,由於數據稀缺問題,之前沒有討論中印機器翻譯的論文。因此,我們以英語為中心進行中印機器翻譯,並利用一些馬來西亞語料庫。;Build a good machine translator out of low resource data is one of the challenges recently. In order to tackle this issue, transfer learning came up and bring a solution to this problem. Another substantial problem for machine translator is to build the good machine translator with no resource of parallel corpus available. One of the solutions for this problem is to use the teacher-student framework to produce a source-target machine-generated parallel corpus.In this thesis, we tried to tackle the problem of building low resource machine translatorby utilizing machine-generated corpus. Basically, we combinethe solution for tackling low resource and zero resource machine translation problem to address the problem of low resource machine translation itself. The idea is to produce huge machine-generated data that we can use for training and then use transfer learning to continue the training with low resource data.Our contribution in this thesis is proved that machine-generated data can help us to train low resource human-generated data. As far as we know, there is no previous paper that discusses Chinese-Indonesian machine translation because of the data scarcity problem. Therefore, we do Chinese-Indonesian machine translation with English as a pivot and utilize some of the Malaysian corpora.
    顯示於類別:[資訊工程研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML164檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明