中大機構典藏-NCU Institutional Repository-提供博碩士論文、考古題、期刊論文、研究計畫等下載:Item 987654321/9056
English  |  正體中文  |  简体中文  |  Items with full text/Total items : 80990/80990 (100%)
Visitors : 41820026      Online Users : 1930
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version


    Please use this identifier to cite or link to this item: http://ir.lib.ncu.edu.tw/handle/987654321/9056


    Title: 動態網頁之樣版與資料分析研究;Differentiating Templates and Data Values from Semi-Structured Web Pages
    Authors: 李季壕;Ji-Hao Li
    Contributors: 資訊工程研究所
    Keywords: 動態網頁;樣版;等價類;dToken;equivalence class;EXALG
    Date: 2005-07-07
    Issue Date: 2009-09-22 11:40:17 (UTC+8)
    Publisher: 國立中央大學圖書館
    Abstract: 由於網際網路WWW的迅速發展,所以現有愈來愈多企業及一般網路使用者等都會透過Web來呈現他們的訊息或資料;而網路服務(Web Services)的盛行如網路書店、網路購物、入口網站等諸多服務更是帶動了網路使用爆發性的成長,而這些的類型網站通常會提供了一個搜索介面來便利使用者進行資料的查詢,例如透過一個CGI程式來進行該網站的資料庫搜索,並將與使用者查詢相關的資料嵌入到一個固定的網頁樣版中(Template)後呈現該網頁給使用者觀看,而此方式所產生的網頁我們稱之為動態網頁(Dynamic HTML)。從這些網頁中,我們不難地可以觀察到:這些網頁往往夾雜了多種不同來源的廣告或是不相關於使用者查詢的資訊;為了過濾這些雜訊以及資料收集的簡便,於是便有資料擷取(Information Extraction)研究因應而生,希望透過資料擷取系統來減少資料收集工作的瑣事。而此種系統對於資訊整合的工作者來說甚為重要,因為欲對不同網站上的進行資料整合工作時,他必須需要先手動地將不同網站的資料內容ㄧㄧ擷取出來,並將該資料存到Excel或是資料庫中後,才可進行後端的資訊整合步驟(Information Integration),以提供一套整合性的網路服務或資料分析。但是由於網站開發者常常會因為需求的變更,而對於其網站進行若干的修改,造成原本已整合完成的工作得重新進行擷取分析、並整合等複雜的重複工作。 有鑑於此,近來有許多自動化的網頁擷取系統被廣泛的討論,它們從一群網站所收集回來的動態網頁中,透過網頁之間的比對來產生該網站動態網頁資料的擷取模組,稱之為Wrapper,並且利用該模組來進行該網站的動態網頁資料擷取;而此擷取模式不僅簡便了網路資訊整合者的工作,更可以加速處理於不同類型的網站整合工作使用。
    Appears in Collections:[Graduate Institute of Computer Science and Information Engineering] Electronic Thesis & Dissertation

    Files in This Item:

    File SizeFormat


    All items in NCUIR are protected by copyright, with all rights reserved.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明