English
| 正體中文 |
简体中文
|
全文筆數/總筆數 : 84007/84007 (100%)
造訪人次 : 62332470 線上人數 : 671
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by
NTU Library IR team.
搜尋範圍
全部NCUIR
資訊電機學院
通訊工程學系
--研究計畫
查詢小技巧:
您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
進階搜尋
主頁
‧
登入
‧
上傳
‧
說明
‧
關於NCUIR
‧
管理
NCU Institutional Repository
>
資訊電機學院
>
通訊工程學系
>
研究計畫
>
Item 987654321/99007
資料載入中.....
書目資料匯出
Endnote RIS 格式資料匯出
Bibtex 格式資料匯出
引文資訊
資料載入中.....
資料載入中.....
請使用永久網址來引用或連結此文件:
https://ir.lib.ncu.edu.tw/handle/987654321/99007
題名:
強化學習中機率安全邊界與風險累積分析( I )
;
Probabilistic Safety Bounds and Risk Accumulation Analysis in Reinforcement Learning( I )
作者:
陳昱嘉
貢獻者:
國立中央大學通訊工程學系
關鍵詞:
強化學習
;
安全邊界
;
馬可夫決策過程
;
拉格朗日對偶方法
;
安全探索策略
;
Reinforcement Learning
;
Safety Bound
;
Markov Decision Process
;
Lagrangian Dual Method
;
Safe Exploration Strategy
日期:
2026-01-22
上傳時間:
2026-01-23 16:25:13 (UTC+8)
出版者:
國家科學及技術委員會(本會)
摘要:
本研究計畫的核心目的在於創建一個基於鞅理論(Martingale Theory)的可驗證 AI安全框架,目標解決當前強化學習應用於真實世界時,無法對其學習與適應過程 本身提供可靠安全保證的關鍵難題。計畫將從理論層面出發,為AI的累計決策風險建立嚴謹的數學邊界,並進一步設計能即時監測與主動控制自身風險的自適應演算法,最終實現能在偵測到災難性風險時立即中止的硬性安全保障,將AI安全從經驗性的事後驗證,提升至可預測、可控制、可認證的科學領域。此研究的成功,預期將產生深遠的影響。在社會層面,它將透過提供透明且可信賴的安全證明,建立公眾對AI在自駕車、智慧醫療等關鍵領域應用的信任,並為相關監管法規的制定奠定科學基礎。在經濟層面,這將大幅降低企業部署AI的風險與成本,解鎖過去因安全疑慮而無法進入的高價值市場,並催生AI安全認證與審計等新興產業。對於產業發展而言,本計畫將突破工業4.0、6G通訊與自主系統等前瞻領域的技術瓶頸,提供從模擬走向現實應用的關鍵賦能技術,進而強化我國在可信賴AI此一全球戰略領域的技術話語權與國際競爭力。
關聯:
財團法人國家實驗研究院科技政策研究與資訊中心
顯示於類別:
[通訊工程學系] 研究計畫
文件中的檔案:
檔案
描述
大小
格式
瀏覽次數
index.html
0Kb
HTML
5
檢視/開啟
在NCUIR中所有的資料項目都受到原著作權保護.
社群 sharing
::: Copyright National Central University. | 國立中央大學圖書館版權所有 |
收藏本站
|
設為首頁
| 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
DSpace Software
Copyright © 2002-2004
MIT
&
Hewlett-Packard
/
Enhanced by
NTU Library IR team
Copyright ©
-
隱私權政策聲明