1 數字圖書館前沿問題 1.1 北京 DL高級研討班概況 2006年8月14日-16日,“2006·北京 數字圖書館前沿問題(發(fā)展戰(zhàn)略與實踐)高級研討班”在清華大學舉行。該研討班由清華大學圖書館、美國斯坦福大學圖書館和中國圖書館學會數字圖書館建設與研究專業(yè)委員會聯(lián)合主辦,中國學術期刊(光盤版)電子雜志社協(xié)辦。來自全國78所高校圖書館和相關機構的200多位代表參加了本次研討會。這是繼“2004·深圳”、“2005·廈門”兩屆研討會之后,海內外從事數字圖書館研究和建設的同仁們第三次相聚在一起,共同分享信息、交流經驗,尤其就某些數字圖書館前沿問題進行廣泛而深入地探討。 1.2 三屆數圖高研班主題 (表) 1.3 北京DL研討班專家報告綜述 1.3.1 國內數字圖書館的發(fā)展概況 .數字圖書館管理處孫衛(wèi)總工程師.《國家圖書館二期工程暨國家數字圖書館工程》; 中國科學院文獻情報中心副主任、國際圖聯(lián)采訪與藏書發(fā)展專業(yè)委員會孫坦研究員《E-science條件下的數字圖書館建設》,重點介紹了CSDL開放體系的基本設計原則、基本架構以及CSDL開放建設的進一步設想。 CALIS管理中心副主任、北京大學圖書館副館長、教育部高等學校圖書情報工作指導委員會副主任兼秘書長朱強教授介紹了CALIS的現狀與進展以及CALIS通過驗收的情況。 1.3.2 數字圖書館戰(zhàn)略策劃 闡述數字圖書館發(fā)展的戰(zhàn)略趨勢。 霍普金斯大學圖書館系統(tǒng)部主任王雪茅先生,《全球圖書館環(huán)境中的領導培養(yǎng)》,首先介紹了全球化、全球圖書館以及領導培養(yǎng)的理念,然后從多個方面剖析了所在高校數字化圖書館的五年戰(zhàn)略規(guī)劃,從理論與實踐結合的角度闡述了領導培養(yǎng)應該考慮哪些方面的問題。 爵碩大學林夏博士《數字圖書館新技術展望》,指出新一代數字圖書館必須建立在新的觀念上,要掌握數字信息的本質以及研究信息實體之間新生的鏈接和關系,提出一門建立在網絡科學、圖書館和信息科學,認知科學基礎之上的新學科——數字信息組織(DIO),并且介紹了幾種知識組織新技術。 肯特州立大學圖書情報學院的曾蕾教授《數字保存》,闡述長期保存的重要性,解釋了長期保存(Preservation)和獲取使用(Access)的關系,并指出天生的數字資源應該有長期保存的優(yōu)先權并推薦了做長期保存項目應該參考和遵循的十個文件,最后介紹了長期保存的一些實用技術。 斯坦福大學圖書館的張甲先生做了題為《數字時代的信息服務》報告,他從項目背景、項目進展、合作原則等方面介紹了斯坦福大學圖書館和Google合作的圖書全文檢索項目,另外還介紹了斯坦福大學掃描圖書的流程以及全文檢索的各種檢索功能,具體的檢索層面分為字段檢索、知識分類檢索、聯(lián)想檢索、引文檢索、信息工具、定題追蹤、建議/推薦、導航工具。他指出圖書館的作用正在發(fā)生轉變:從編制書目到知識導航,從提供館藏到提供滿足讀者信息需求的工具,從收集書刊到保存知識和發(fā)展數字文獻內容,變單館運作為知識源提供機構的成員。 1.3.3 知識組織與內容管理 上海圖書館劉煒博士《數字圖書館2.0》,展示了目前流行的Web2.0的理念、原則、結構、語言和技術特征,進而結合web2.0在圖書館界的影響和應用論述了圖書館2.0的服務理念、類型和原則。另外三位專家從不同角度闡述了知識組織和管理的發(fā)展歷程和技術方法?!对跒g覽和檢索界面設計中利用知識組織系統(tǒng)》(曾蕾),介紹了第一代到第四代網絡界面的特征和變遷,如何在實際工作中利用KOS的原理和方法提高用戶的檢索效率?!缎畔嫿ǖ目捎眯詼y試》(周曉英),主要從人機界面的可用性、信息構建與可用性、數字圖書館系統(tǒng)的可用性及其測試方法等方面闡述這一主題。 1.3.4 數圖技術科研與應用 《信息可視化與可視分析》(林夏),指出信息可視化應用的新浪潮即將到來,新的應用將體現在信息搜索、知識發(fā)現、信息分析和集成方案等領域中?!缎畔⒊槿〖捌湓跀底謭D書館中的應用研究》(張智雄),從信息抽取的概念、層次、類型、應用等方面對信息抽取做了詳細介紹,對信息抽取技術在數字圖書館的應用中作了展望。《OpenURL及其在鏈接解析系統(tǒng)中的應用》(劉偉玲),《機構庫——背景、現狀及思考》(李春旺)。 1.3.5 資源整合與知識檢索 《資源整合與門戶建設——清華大學圖書館的實踐》(姜愛蓉),主要從資源整合的層面、方法、效果和門戶建設的思路、內容、應用等方面匯報了清華大學圖書館資源整合與門戶建設的基本情況、實踐經驗和引發(fā)的思考。 《從無的放矢到個性化的知識檢索》,提出了完全以用戶需求為中心組織資源的理念,倡導將圖書館的資源作為其他大型研究和學習組織的一部分來提供服務,旨在方便讀者使用。 《數字資源管理的實例介紹:利用圖書館自動化系統(tǒng)以及開發(fā)數字資源》(劉偉玲)。 1.4 重點講兩個前沿問題 一個是因為與《數字圖書館》課程密切相關;一個是因為與信息管理與信息系統(tǒng)專業(yè)密切相關。 1.4.1 數字圖書館2.0 DL2.0=DL+WEB2.0 數字圖書館1.0(圖) 數字圖書館2.0(圖) 2.0只是表示一種版本升級,呈現出與以往的一些不同 DL2.0:具有許多Web2.0特征的數字圖書館(以Web2.0作為技術和理念背景的DL) 具有不同的問題域和不同的側重點,例如 以用戶為中心 更復雜(細粒度)的數字對象結構 更普遍的鏈接性 更多的多媒體而不是文本 更普遍的手持設備與p2p應用等 Web 2.0技術特征 分布式架構——物理位置不同而共享資源與服務 松散耦合——高互操作性組建按需聯(lián)絡,統(tǒng)一的消息傳遞機制 平臺獨立性——不同應用平臺(指操作系統(tǒng)、數據庫平臺)具有通用的機器界面和人機界面 開放API‘s ——服務的使用和通信等開放接口(或符合通用協(xié)議標準),技術文檔齊全 支持Web服務——訪問(共享/重用)Web2.0組件的 的趨勢(例如采用SOA架構,但并非都這樣) 2.0為什么會成功(Web2.0的核心競爭力) 服務,而非軟件。 通過使更多用戶使用獨特的、難以復制的數據而獲得價值; 把用戶作為開發(fā)者; 獲得集體智能; 通過用戶的“自服務”而服務于“長尾”; 輕型用戶界面、開發(fā)模型以及商務模型(普及、普及、普及) Web2.0與圖書館2.0比較 Web 2.0 互聯(lián)網成為平臺(參與體系)而不是利用互聯(lián)網來統(tǒng)治和控制; 充分重視并利用集體力量和智慧; 將數據變成“Intel Inside”; 分享和參與的架構驅動的網絡效應; 通過帶動分散的、獨立的開發(fā)者把各個系統(tǒng)和網站組合形成大匯集的改革; 通過內容和服務的聯(lián)合使輕量的業(yè)務模型可行,分享經濟的模式; 注重用戶體驗的持續(xù)的服務(“永久的Beta 版”); 服務和應用無處不在(非單機版和單一平臺版本); 圖書館2.0 以用戶為中心; 富技術(technology-savy)環(huán)境; 提供長尾化服務; 內容為多種設備而準備; 軟件的組件化,而不是單一的ILS解決方案; 持續(xù)不斷的變化; 采用Web2.0的應用和服務; 開放標準 1.4.2 信息可視化 可視化向人們提供一種方法和手段,利用這種方法和手段人們可以觀察人們所不能觀察到事務或概念。 可視化基本上可以劃分為兩個大類:科學的可視化(醫(yī)學信息的可視化、氣象信息的可視化)和信息的可視化(軟件工程的可視化、信息檢索的可視化、因特網的可視化)。這兩者的根本區(qū)別在于科學的可視化在顯示和展示事務和概念時,繼承事務和概念在它本體中的固有結構。 傳統(tǒng)信息檢索系統(tǒng)(Internet搜索引擎,以及傳統(tǒng)圖書館文獻目錄檢索系統(tǒng)) 1 沒有考慮人的檢索查詢行為。 2 對用戶來講是一個不透明的黑箱。 3 用戶對傳統(tǒng)信息檢索系統(tǒng)的檢索過程是不連續(xù)的。 4 檢索結果是一種簡單的線性表達。 5 缺乏一種有效的檢索反饋機制。 6 檢索結果不能夠有效地展示大量文獻體。 信息檢索可視化優(yōu)勢: 1 一個可視化的信息檢索環(huán)境利于用戶進行信息瀏覽,信息開發(fā),信息挖掘。 2 可以使一個信息檢索過程透明。 3 可以向用戶提供更為豐富的信息。 4 有可能開發(fā)出新的信息檢索和信息瀏覽方法和機制。 5 可以將人的認知能力融入信息檢索和信息瀏覽過程之中。 6 是一個良好的人機對話和交流的環(huán)境。 7 可以大大改善信息檢索的檢全率以及檢準率。 8 為傳統(tǒng)的信息檢索打開了一扇全新的窗口,開拓了嶄新的應用以及研究領域,提升了信息檢索的檔次, 它代表著信息檢索系統(tǒng)發(fā)展的未來。 建立信息檢索可視化系統(tǒng)的一般步驟: 1 選擇應用領域以及信息檢索系統(tǒng)類型。 2 鑒別和定義要進行可視化的目標以及特征。 3 對可視化空間的定義。 4 目標體從原始數據庫影射到可視化空間的算法和方法。 5 定義可視化空間中信息檢索和信息瀏覽方法。 6 可視化系統(tǒng)設計語言的選擇。 可視化信息檢索系統(tǒng)的常見功能: 1 允許用戶在可視化空間中觀察文獻與文獻之間,可能的話文獻與提問之間的語義關系,瀏覽可視化空間中任意特定領域。 2 根據用戶的需求,在可視化空間中動態(tài)地調整文獻分布。 3 根據用戶的需求,在可視化空間中擴大/縮小一個特定的局部空間領域。 4 根據用戶的需求,在可視化空間中任意地選擇一個文獻并且閱讀它的有關詳細信息。 5 提供信息查詢手段。 6 展示并且解釋標準的情報檢索模型以及其他信息檢索機制。 信息檢索可視化面臨的問題: 1 怎樣在有限的顯示空間內展示海量信息? 2 怎樣有效地定義和建立信息可視化空間? 3 怎樣有效地評價信息檢索可視化系統(tǒng)? 4 信息檢索可視化系統(tǒng)空間維數的爭論。 互聯(lián)網信息的可視化主要反映在以下方面: 1 對搜索引擎結果的可視化。 2 對互聯(lián)網之中網頁之間節(jié)點聯(lián)系的可視化。 3 對互聯(lián)網之中用戶使用網絡的情況進行可視化處理。 信息檢索的可視化系統(tǒng):TileBars;VISUAL NET;GRIDL;DARE。(很遺憾,似乎為小范圍實驗系統(tǒng),筆者未能體驗。) (注:以下資料源自林夏先生的PPT。) 信息可視化是一門邊緣學科(計算機科學,信息科學,心理學;教育學及其他應用領域) 1995年前后,隨著網絡信息技術的發(fā)展,一批可視技術有了新的突破。信息可視化領域的一個里程碑是1995年開始的InfoVis年會。另一個里程碑是1999年出版的“Readings in Information Visualization”。 信息可視化的三大支柱:感知的功能;圖形的功力;聯(lián)想的潛力。 信息可視化是對人類智能一種新的開發(fā):理性的智慧;感性的智慧;知性的智慧(理解感知的能力:認知的功能、圖形的功能、聯(lián)想的功能;通過計算機的功能來提高,放大認知的功能) 信息可視化尋求人機合作(計算機將大量抽象的信息映射到圖像上;人們通過圖像的結構,特征等來理解認識從而獲得知識。) 計算機與人各顯神通(電腦的高速信息處理能力遠遠超過人腦;人腦的識辨,理解能力是電腦所不可及的) 今天的信息世界(信息爆炸:怎樣組織它們?信息超載:怎樣理解它們?所有信息是相互關聯(lián)的:怎樣介入它們?知識淹沒在信息中:怎么發(fā)現知識?信息以各種形式展現:怎樣顯示他們?) 信息可視化在數字圖書館中的應用(用可視化揭示信息的分布;用可視化顯示檢索的結果;用可視化為大量的信息分類;用可視化幫助用戶瀏覽;用可視化為信息個體化服務) 信息可視化的應用實例: TheBrain: http://www./ Touchgraph: http://www./ Grokker: http://www./service/grok/g_products.html Topic maps Highwire: http://www. 信息可視化開發(fā)工具: http://iv.slis./ InfoVis Cyberinfrastructure – Indiana University: http://iv.slis./ Piccolo Toolkit – University of Maryland: http://www.cs./hcil/piccolo/ the prefuse visualization toolkit: http://prefuse./ The visualization toolkit: http://public./VTK/ OpenDX: http://www./ 2 圖書館信息技術部建設 2.1 中美圖書館信息技術及相關機構設置調查 根據2006中國高校排名、2006美國大學排名,逐一訪問各自前10名高校圖書館網站,結合筆者占有的資料,從中分別選取關于機構設置信息最新最多的5所高校作為研究對象。中國選取清華大學(1)、浙江大學(3)、復旦大學(5)、武漢大學(8)、中山大學(10)。美國選取Princeton University(2)、Yale University(3)、University of Pennsylvania(4)、Duke University(5)、Stanford University(6)。(注:學校后邊括號內的數據為其名次。)表1為信息來源網址,訪問時間均為2006年6月26日。 中美圖書館信息技術及相關機構設置調查表
調查結論: (1)機構名稱混亂,崗位職責不夠明晰。機構名稱五花八門。如系統(tǒng)部、系統(tǒng)中心、數字資源中心、數字化部、數字資源部均貌似“信息技術部”,具體崗位職責不得而知。這給讀者服務與館際交流帶來若干不便。 (2)美國設有數字圖書館研究部(或組), 具體從事有關數字圖書館的技術和服務方面的研究, 中國稱數字化部等, 其職能遠不及美國, 只是從事簡單的資源數字化工作, 職能與美國相近的也只有清華大學圖書館的數字圖書館研究室。美國數字圖書館的發(fā)展過程,經歷了由靜態(tài)表達到動態(tài)檢索,最后實現信息同步這樣一個由初級向高級階段遞進的發(fā)展過程,數字圖書館的實現方式也由自己開發(fā)軟件向購買商業(yè)軟件轉向,并始終保持與 IT業(yè)界發(fā)展同步和享用IT行業(yè)的技術與成果,因此,圖書館界非常關注IT技術的發(fā)展和IT技術在圖書館方面的應用問題,關注數字化文獻保存技術。國內高校圖書館數字化技術的重視程度還遠不及美國,對數字圖書館的研究乃至對信息技術的應用均落后于美國。 2.2 圖書館2.0與圖書館信息技術部的建設 現代技術與圖書館的發(fā)展密切相關這是一個共識。但我國目前圖書館信息技術部的建設很不理想。(其實,技術部門的叫法,依舊是五花八門,我堅持用圖書館信息技術部來稱謂它。)“圖書館2.0:觀念與技術”,觀念是前提,技術是手段,圖書館需要自己的技術人才。 廣義的現代圖書情報技術:數字圖書館相關技術問題的理論探討與實踐交流,如數字圖書館體系結構;個性化服務的技術、算法及管理機制;分布式數據庫技術;基于內容的多媒體信息檢索;海量信息存儲、組織和管理;元數據標準和規(guī)范的研究和制定;館藏數字化技術;基于Web的搜索引擎技術;自然語言處理技術以及語義網研究等。計算機信息管理技術的應用、研究與發(fā)展。計算機技術在圖書館學、情報學中的應用。 現代圖書情報技術具體到圖書館領域,主要是指應用于現代圖書館管理與服務中的現代信息技術。主要包括以下內容: 硬件層面。包括網絡綜合布線工程、網絡設備、UPS、計算機設備及其他信息技術設備。前期的設備規(guī)劃,中期的管理與維護,后期的報廢處理都需要技術。圖書館員(技術人員)在里邊起的作用主要是一種協(xié)調作用,包括館內的協(xié)調,館外的協(xié)調(比如與硬件供應商,維修商等等的協(xié)調。)對于各種信息技術設備,我們的圖書館員(技術人員)要盡可能熟悉其原理,擁有相應的一些維修設備,能夠進行一些日常維護。 軟件層面。核心是圖書館自動化系統(tǒng),系統(tǒng)管理員在圖書館是一個非常重要的角色。其他還有電子閱覽室管理系統(tǒng)、網站發(fā)布系統(tǒng)、辦公自動化系統(tǒng),電子書電子期刊服務系統(tǒng)等等。圖書館員(技術人員)需要有較強的學習能力,熟悉SQL語言,了解相關技術,最好是精通一門編程語言,此外要有較強的溝通能力,現代信息技術運用能力。 服務層面。比如網站的設計與制作,網站日志分析,自動化系統(tǒng)數據挖掘,學科導航設計,數字參考咨詢,開展網絡調查等等方面。這個層面需要有敏銳的洞察力及較強的歸納分析能力,需要有較深的理論基礎及較強的信息技術應用能力。 在上海召開的“圖書館2.0:觀念與技術”研討會閑聊中,進一步感受了圖書館信息技術部的生存狀況。有專門技術部門的館對信息技術部館員的評價,簡單說就是:沒本事,脾氣大。兩年前,也是外出開會,跟一位老師聊起他們的技術部主任,感覺恨得咬牙切齒:利用圖書館設備干私活,人在心不在。如此等等。這幾年我親身走訪過的幾十所不同類型的圖書館,去任何一館,我都會盡可能的去了解他們的信息技術部狀況,令人滿意的太少。 很多館都提出要計算機人才,招聘的時候明確說要計算機專業(yè)的。有個結論(或體會)就是,真正優(yōu)秀的技術人才根本不到圖書館;翅膀硬了的技術人才不留圖書館。沒有圖書情報功底、且對圖書情報工作沒有激情的“技術人才”是不可能干好圖書館信息技術部工作的。開會的過程中,有與會者(大概是高校圖書館技術部負責人)抱怨說,圖書館2.0工作無從開展,原因是領導不支持,同事不理解。技術部工作我個人深有體會,跟同行也有過好些交流。感覺沒事干、干不了事情的圖書館信息技術部很多。我看到好些圖書館信息技術部人員減少、職能萎縮,非常痛心,因為是被迫的,而不是因為技術進步了、管理方式進步了等積極因素導致。 我們的圖書館工作要做到三個結合:理論和實際相結合;技術與內容相結合;人腦和電腦相結合。圖書館要實現真正意義上的圖書館2.0,需要一支有戰(zhàn)斗力的信息技術隊伍。圖書館信息技術部人員的職業(yè)生涯設計,我們圖書館行業(yè)需要給予更多的關注。 3 交流與探討 參考文獻: 1 http://dlSeminar.lib. 2王平.《2006.北京.數字圖書館前沿問題(發(fā)展戰(zhàn)略與實踐)高級研討班》會議綜述.數字圖書館論壇,2006(9):72-76 3 數圖高研班的主題.http://my.donews.com/keven/page/3/ 4 劉煒.數字圖書館2.0. 數字圖書館前沿問題(發(fā)展戰(zhàn)略與實踐)高級研討班資料.2006.8 5 (張進.信息檢索可視化)曾民族主編.知識技術及其應用._北京:科學技術文獻出版社,2005.11431-460 6 林夏.信息可視化與數字圖書館.廈門數字圖書館高級研討班PPT,2005.7 7 林夏.信息可視化與可視分析.數字圖書館前沿問題(發(fā)展戰(zhàn)略與實踐)高級研討班資料.2006.8 |
|