中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/93456
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 80990/80990 (100%)
造访人次 : 41642727      在线人数 : 1313
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/93456


    题名: Applying Content-Defined Chunking to OCSSD-based Deduplication Systems
    作者: 陳哲民;Chen, Che-Min
    贡献者: 資訊工程學系
    关键词: 快閃記憶體;固態硬碟;內容定義分塊;重複資料刪除技術;NAND Flash;Solid State Drives;Content-Defined Chunking;Data Deduplication
    日期: 2023-08-11
    上传时间: 2024-09-19 17:02:37 (UTC+8)
    出版者: 國立中央大學
    摘要: 本文探討了將內容定義分塊 (Content-Defined Chunking, CDC) 技術應用於基於固態硬碟(Solid State Drive, SSD) 的重複資料刪除系統(Data Deduplication System)上所遭遇得挑戰與機會。CDC 是一種根據資料的內容,而非根據邏輯位址,將資料分割成不特定長度的分塊的技術。CDC 可以減少寫入儲存系統的重複資料量,從而提高 SSD 的效能和儲存效率。然而,CDC 也為基於 SSD 的重複資料刪除系統帶來了一些難題,例如分塊與 SSD 頁面之間的不對齊,以及邏輯區塊位址 (LBAs) 與實體頁面位址 (PPAs) 之間的低效率位址映射。

    為了解決這些問題,我們提出了利用主機管理型 SSD (例如 OCSSD、ZNS) 的方法,這是一種新型的 SSD,它將其內部區塊暴露給主機系統,並允許主機系統完全控制 SSD 內的資料放置。我們提出了一種簡單的資料對齊技術,以減輕不對齊對讀取效能的負面影響。我們還結合了多重串流 (multi-streaming) 的概念,根據資料的壽命將其分配到不同的串流中,並利用主機提供的關於分塊大小和創建時間的資訊,以實現更好的資料放置和減少垃圾收集的花費。我們用模擬實作的方式來評估我們提出的方法,並分享一些關於我們所遭遇得挑戰的見解。;This paper explores the challenges and opportunities of applying Content-Defined Chunking (CDC) to SSD-based deduplication systems. CDC is a technique that divides data into variable-sized chunks based on their content, rather than fixed-sized blocks based on their logical addresses. CDC can reduce the amount of redundant data written to the storage system, which can improve the performance and storage efficiency of SSDs. However, CDC also introduces some difficulties for SSD-based deduplication systems, such as misalignment between chunks and SSD pages, and inefficient address mapping between logical block addresses (LBAs) and physical page addresses (PPAs).

    To address these issues, we propose to leverage host-managed SSDs (e.g. OCSSD, ZNS), a new type of SSDs that that expose their internal blocks to the host system and allow the host system to to fully control the data placement within the SSD. We proposed a simple data fitting technique to alleviate the negative impact of misalignment on read performance. We also combine the concept of multi-streaming, which distribute data based on lifetime into different streams, with the host-provided information about chunk′s size and creation time, to achieve better data placement and mitigate the overhead of garbage collection, and. We evaluate our approach with a simulated implementation and share some insights of the challenges.
    显示于类别:[資訊工程研究所] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML20检视/开启


    在NCUIR中所有的数据项都受到原著作权保护.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明