中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/98210
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 83776/83776 (100%)
造访人次 : 59513672      在线人数 : 836
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: https://ir.lib.ncu.edu.tw/handle/987654321/98210


    题名: 基於 ChatGPT 資料擴增技術在金融法規遵循文本多標籤分類研究;Research on Multi-Label Classification of Financial Regulatory Compliance Texts Based on ChatGPT Data Augmentation Techniques
    作者: 傅宣妮;Fu, Hsuan-Ni
    贡献者: 資訊管理學系
    关键词: 金融法遵;ISO27001;文字特徵;GPT-4o;多標籤;機器學習;Financial compliance;ISO 27001;Text features;GPT-4o;Multi-label classification;Machine learning
    日期: 2025-07-01
    上传时间: 2025-10-17 12:29:49 (UTC+8)
    出版者: 國立中央大學
    摘要: 在金融業,資訊法規遵循對企業資訊安全和客戶敏感資料的保護至關重要。然而,金融資訊安全法規的分類需耗費大量人力,為企業帶來沉重負擔。機器學習提供了一種快速且準確的分類解決方案,使法規能夠高效對應至 ISO 27001控制項目。此外,由於一條法規可能涉及多個不同項目,採用多標籤分類方法能夠更精準地對應法規內容。然而,多標籤分類面臨標註資料成本高昂、類別不平衡等挑戰,這也是法遵領域應用中的重要限制。
    本研究透過傳統過採樣及欠採樣技術 (如 SMOTE、 IPF、 ADASYN)與 GPT-4o擴增方法來緩解類別不平衡問題,並比較傳統與預訓練語言模型的特徵提取效果。接著,使用多種機器學習分類器 (K-Nearest Neighbor、 XGBoost、 Logistic Regression、 Naive Baye、Support Vector Machine)進行效能評估。實驗結果顯示, GPT-4o的取樣方法能有效模擬
    法規文本,並在分類表現上達到最佳效果。;Regulatory compliance in the financial industry is crucial for ensuring information security and protecting customers′ sensitive data. However, classifying financial information security regulations requires significant human resources, placing a heavy burden on enterprises. Machine learning offers a fast and accurate classification solution, enabling efficient mapping of regulations to ISO 27001 control items. Moreover, since a single regulation may correspond to multiple control items, multi-label classification provides a more precise categorization approach. However, multi-label classification faces challenges such as high annotation costs and class imbalance, which remain significant limitations in regulatory compliance applications.
    This study addresses these issues by leveraging traditional oversampling techniques and GPT-4o-based data augmentation to mitigate class imbalance. We compare feature extraction methods from both traditional and pretrained language models and evaluate classification performance using various machine learning classifiers. The experimental results demonstrate that GPT-4o’s sampling approach effectively simulates regulatory texts and achieves the highest classification performance.
    显示于类别:[資訊管理研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML8检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明