中大學術數位典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/99007
English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 84007/84007 (100%)
造訪人次 : 62336965      線上人數 : 655
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: https://ir.lib.ncu.edu.tw/handle/987654321/99007


    題名: 強化學習中機率安全邊界與風險累積分析( I );Probabilistic Safety Bounds and Risk Accumulation Analysis in Reinforcement Learning( I )
    作者: 陳昱嘉
    貢獻者: 國立中央大學通訊工程學系
    關鍵詞: 強化學習;安全邊界;馬可夫決策過程;拉格朗日對偶方法;安全探索策略;Reinforcement Learning;Safety Bound;Markov Decision Process;Lagrangian Dual Method;Safe Exploration Strategy
    日期: 2026-01-22
    上傳時間: 2026-01-23 16:25:13 (UTC+8)
    出版者: 國家科學及技術委員會(本會)
    摘要: 本研究計畫的核心目的在於創建一個基於鞅理論(Martingale Theory)的可驗證 AI安全框架,目標解決當前強化學習應用於真實世界時,無法對其學習與適應過程 本身提供可靠安全保證的關鍵難題。計畫將從理論層面出發,為AI的累計決策風險建立嚴謹的數學邊界,並進一步設計能即時監測與主動控制自身風險的自適應演算法,最終實現能在偵測到災難性風險時立即中止的硬性安全保障,將AI安全從經驗性的事後驗證,提升至可預測、可控制、可認證的科學領域。此研究的成功,預期將產生深遠的影響。在社會層面,它將透過提供透明且可信賴的安全證明,建立公眾對AI在自駕車、智慧醫療等關鍵領域應用的信任,並為相關監管法規的制定奠定科學基礎。在經濟層面,這將大幅降低企業部署AI的風險與成本,解鎖過去因安全疑慮而無法進入的高價值市場,並催生AI安全認證與審計等新興產業。對於產業發展而言,本計畫將突破工業4.0、6G通訊與自主系統等前瞻領域的技術瓶頸,提供從模擬走向現實應用的關鍵賦能技術,進而強化我國在可信賴AI此一全球戰略領域的技術話語權與國際競爭力。
    關聯: 財團法人國家實驗研究院科技政策研究與資訊中心
    顯示於類別:[通訊工程學系] 研究計畫

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML5檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明