壹、背景說明
隨著網際網路的快速成長,與全球資訊網(WWW, World Wide Web)的風行, 在台灣學術網路(TANet)上,已經有愈來愈多的學校與圖書館,將各項圖書資訊服 務、教學、研究成果、招生、行政服務等各項資訊,透過WWW來做為整合與管 理應用的服務"窗口"。根據[教育部電算中心,1998]的統計,87年7月份TANet 到INTERNET的網路服務流量共1,421,067,678 KBytes,其中WWW的使用率為 56.93%,,可見WWW的使用與服務已漸居網際網路的主要地位。因此,如何妥善管 理代表學校資訊服務"窗口" -─ WWW 網站的問題,也愈來愈為重要。
然而任何需要管理的事物,都必須要有一套衡量品質的標準,才能作為後續 改進的評估方向與指標。因此, [Buchanan and Lukaszewski 1997]提出了網站管理 生命週期(Web Site Life Cycle) 的觀念,將WWW資訊服務的管理工作,分為 1.定 義需求 (Define Need)、2.規劃分析 (Planning and analysis)、3.製造開發(Production and Development)、 4.施行推廣 (Implementation and Promotion)、5.評估演進(Measurement and Evolution) 五個階段,並強調五個階段都必須縝密規劃與執行,才能促使網站 品質與服務水準不斷的提升與演進。
在過去網際網路與台灣學術網路的相關研究中,有 關WWW的技術、應用、內容設計等課題,均引起廣泛的 討論,並獲致相當的成果。而有關網站服務的使用衡量 與行為分析方面的課題,則相對地還有許多未知的問題 需要研究探討,面對未來越多越多的WWW資訊服務與使 用者,甚至一些電子商務(E-Commerce)應用與服務的來 臨,及早發展相關的網站衡量策略,以了解使用者與網 站的行為模式,對於提升資訊服務的品質與經營成效, 將具有重大的意義與影響。
貳、問題探討
2.1使用衡量的層次與類型:
[Buchanan and Lukaszewski 1997]將WWW 網站的使用衡量(Usage Measurement) 分為如圖1.中的四種類型,其意義與關係分述如下。
圖1.使用衡量的階層圖
(1). | Raw Measure:原始資料分析,直接由server上記錄檔所獲取的資料,如 訪客的Domain,每個網頁(Webpage)被瀏覽的次數等。
|
(2). | Consolidated Measure:加強合併分析,由原始資料中,經分析統計所產生 的指標。
|
(3). | Approximated Measure:概略分析,由於量化資料無法獲得,而所採用的 一些非量化或質的衡量指標。
|
(4). | Impact Measure:衝擊影響分析,由上述量化與質化的指標,綜合分析所 得,通常代表一個網站的整體使用狀況與品質的指標。
|
2.2 使用衡量的單位
(1). | Hits: 每向WWW server要求下載一個物件,即稱為一個hit。例如有一個 網頁包括了一個html檔、3個圖檔、一個聲音檔。當當瀏覽此網頁時, 會被算為5個hits。
|
(2). | Accesses: 每瀏覽每一個網頁稱為一個Access。一個訪客可能瀏覽至少一 個以上的網頁。
|
(3). | Sessions: 一個電腦與伺服器由連線到離線的服務活動。
|
(4). | Host: 一部向WWW server要求資料的電腦,通常是一部PC或工作站。
|
通常一個訪客至少會瀏覽一個網頁,也就是一個Access,但是一個Host並不 能代表一個訪客。以一個Session來作為訪客的估計單位,雖然比較接近,但由於 WWW的使用是採取所謂stateless的方式,亦即WWW server將user所要求的資料 傳給browser後,就不再保持連線,所以也很難以把一個連線到離線的狀態,視為 是一個訪客。目前較為人接受的估計方式是,如果某一部機器在WWW server上瀏 覽資料後,經過一段相當時間(如網路統計軟體WebTrend的預設值是半小時)[4], 沒有繼續要求瀏覽資料,就算是一個訪客。問題是這一段所謂的"相當時間"到底是 多久才合理,是否需要以實驗、模擬、或資料回溯追蹤的方式,來找出一個更具體 合理的估計時間,還有待繼續深入研究與探討[5]。
2.3 衡量方法的選擇:
一般網站的衡量方式大致可歸納為下列幾類,分述如下:
(1). | 安裝計數器:在網站首頁或特定網頁上安裝一計數器(counter),可以快 速知道網頁被瀏覽的總數。
|
(2). | 外包專業廠商:由一些專業廠商來安裝其特定的軟體,並分析網站的使 用狀況與流量。
|
(3). | 分析記錄檔:直接由網站中的記錄檔(log file)中,擷取分析可用的資料。
|
(4). | 非量化的方法:例如訪客的e-mail回函,問卷調查,使用者訪談等方 式,也可以收集到一些質方面的資料。
|
參、實例分析-中大圖書館網站的使用衡量
3.1 WWW 網站系統架構與組織
中央大學圖書館網站上現提供Webpac、期刊目次、光碟檢索、視聽資料、虛擬圖 書館、線上考古題、網路教材、訊息通告等功能。在系統架構上,為了確保系統的 長期穩定運作,網站的架構與使用的統計軟體如下:
系統架構 | 規格版本 |
主機平臺 | IBM RS6000 570 Server |
O.S. AIX 4.2 | |
WWW Server軟體 | Apache V1.2b6 |
記錄檔統計軟體 | 1. AccessWatch V1.33[7] |
2. WWWCount V2.4 | |
3. Web TrendsV2.0 | |
4. Wusage 6.0[8] |
透過這些記錄檔的分析,可以讓我們了解使用者使用圖書館資源的狀態、頻率、與 模式,對於規劃未來使用者需求與資源分配,均有重要的意義與價值。
有關中大圖書館網站使用者分析的統計資料,可至本館全球資訊網 (http://www.lib.ncu.edu.tw/)中,在 【本站使用統計分析】下查詢。
肆、未來方向
WWW的使用量與提供的資料服務越多,就越有衡量的需要與價值,透過記錄檔的統 計分析,可以讓網站管理與資料提供人員,更加了解網路使用者的行為模式、與網 站的服務成效,然而除了定量的資料分析仍有待繼續發展之外,另外還有許多質的 定性方面的研究也需要去探討,為了解台灣學術網路上的使用行為與需求,提升國 內網際網路服務的品質與水準,在使用衡量的研究領域裡,還有相當多的問題,需 要大家共同來思考與研究。
【參考文獻】
87.11.30 資策會周中理先生及叡揚資訊公司蘇守謙先生到館演講『認識ISO 9000』