English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 42119863      線上人數 : 1365
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/84703


    題名: 基於其他語言條目之維基百科條目內容自動生成;Automatic Wikipedia Article Generation Based on Articles in Other Languages
    作者: 蔡宗翰
    貢獻者: 資訊工程學系
    關鍵詞: 跨語言百科內容自動生成;跨語言階層式 Transformer神經網路模型;循環生成對抗網路﹑文章風格轉換;自動改寫;Wikipedia article content generation;Cross lingual hierarchical transformer;Cycle generative adversarial network;Article style conversion;Automatic rewriting
    日期: 2020-12-08
    上傳時間: 2020-12-09 10:45:20 (UTC+8)
    出版者: 科技部
    摘要: 隨著網路與社群媒體的興起,線上百科已是現代人日常生活重要之知識來源。維基百科因其自由開放與共享之精神,是目前網路上最大且最重要的百科全書知識庫。然中文維基百科雖然參與者眾,其條目數與西方主流語言的維基百科相比,仍然存在數倍以上的巨大差距,幾乎不可能以人工弭平。本計畫期望能以人工智慧的方法弭平這種知識差距。我們的構想是:研發人工智慧的技術,根據其他多種語言的條目,自動生成中文條目及內容,以擴充中文維基百科的知識涵蓋率,從而實現中文知識內容的流通與傳播。我們的發展步驟如下:第一年,我們將發展跨語言英中維基百科條目內容改寫技術,透過「跨語言階層式 Transformer」,將英文內容轉換生成為中文條目內容。第二年,我們擬發展基於循環生成對抗網路之文章風格轉換方法,自動學習如何依據目標用戶的習慣調整風格。第三年,我們將發展利用多語條目及外部資料之自動改寫技術。此技術利用維基百科多語種之優勢,將不同語言版本的百科知識以中文呈現,進而使中文維基百科的內容更加完備。 ;With the rise of Internet and social media, online encyclopedia has become an important source of knowledge in modern people's daily life. Wikipedia is the largest and most important encyclopedia knowledge base on the Internet because of its free and open spirit. Although Chinese Wikipedia has a large number of participants, its number of entries is still far less than the number of Wikipedia entries in mainstream Western languages (such as English). This research project is expected to develop methods for automatically generating Chinese encyclopedia entries based on other language entries to expand the Chinese Wikipedia knowledge base, thereby achieving the circulation and dissemination of Chinese knowledge content. Our plan is as follows. In the first year, we will develop cross-language English-Chinese Wikipedia entry content rewriting technology and use the "cross-language hierarchical Transformer" to convert English content into Chinese entry content. In the second year, we plan to develop an article style conversion method based on recurring adversarial networks, and automatically learn how to adjust the style according to the taste of target users. In the third year, we will develop automatic rewriting technology that uses multilingual entries and external sources. This technology takes advantage of Wikipedia's multilingualism and presents encyclopedic knowledge in different language versions in Chinese, thereby making the content of Chinese Wikipedia more complete.
    關聯: 財團法人國家實驗研究院科技政策研究與資訊中心
    顯示於類別:[資訊工程學系] 研究計畫

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML156檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明