小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

信息檢索初級(jí)篇

 南書風(fēng) 2007-04-17
利用信息資源之基礎(chǔ)篇——信息檢索漫談
 修改時(shí)間:2006-7-29 23:04:46

利用信息資源之基礎(chǔ)篇
——信息檢索漫談
■ 賈延霞 撰稿

編者按:
網(wǎng)絡(luò)搜索固然是現(xiàn)代社會(huì)利用信息的便捷方式之一,與此同時(shí),我們還希望更多關(guān)注數(shù)字圖書館資源的利用問題。各種花費(fèi)巨額資金所購買的高質(zhì)量數(shù)據(jù)庫資源是否被用戶高效利用?在查詢信息的過程中,是否遇到過各種各樣的問題?信息檢索已經(jīng)逐漸成為每個(gè)人都應(yīng)該具備的一項(xiàng)基本技能。本刊欲推出系列內(nèi)容,面向普通大眾介紹文獻(xiàn)信息檢索的基礎(chǔ)知識(shí)、主要工具和檢索案例,力圖建立信息服務(wù)人員實(shí)踐經(jīng)驗(yàn)探討分享的環(huán)境,提升信息用戶的檢索技能,提高信息資源的利用效率。
一、信息檢索發(fā)展回顧
今天,計(jì)算機(jī)和互連網(wǎng)絡(luò)已經(jīng)成為人們獲取信息的基本工具,這種局勢(shì)并不是一朝一夕形成的,而是經(jīng)過了幾十年的發(fā)展歷史?,F(xiàn)代信息檢索工具和技術(shù)都在不斷發(fā)展,但一些核心思路和方法現(xiàn)在仍然被廣泛利用。所以,了解計(jì)算機(jī)信息檢索的發(fā)展歷史對(duì)于我們開展信息檢索實(shí)踐仍然有一定的意義。
從脫機(jī)檢索到網(wǎng)絡(luò)檢索
計(jì)算機(jī)檢索是在計(jì)算機(jī)技術(shù)和通信技術(shù)發(fā)展的基礎(chǔ)上建立起來的,它產(chǎn)生于20世紀(jì)50年代,發(fā)展于80年代中期,90年代后隨著國(guó)際互聯(lián)網(wǎng)技術(shù)的發(fā)展而進(jìn)入了一個(gè)嶄新的時(shí)期。回顧計(jì)算機(jī)檢索服務(wù)模式,發(fā)展歷程大致可以概括為脫機(jī)批量處理、商業(yè)性聯(lián)機(jī)檢索、光盤檢索和網(wǎng)絡(luò)檢索幾個(gè)階段。2 0世紀(jì) 90年代以來,因特網(wǎng)進(jìn)入商業(yè)化時(shí)期,用戶每年以 2 0 %以上的速度迅速增加。
隨著網(wǎng)上信息量的激增,各種網(wǎng)上檢索工具應(yīng)運(yùn)而生,網(wǎng)絡(luò)信息檢索逐漸發(fā)展成為信息檢索領(lǐng)域的一個(gè)重要學(xué)科分枝。
信息檢索服務(wù)方式的不斷發(fā)展,為信息獲取提供了廣闊的空間,而檢索技術(shù)的進(jìn)步為人們利用信息提供更方便快捷的手段。目前,信息檢索技術(shù)正向兩個(gè)方向發(fā)展:一是傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索的發(fā)展,在深度上提高管理和組織信息的能力,如探索自動(dòng)抽詞、自動(dòng)索引、自動(dòng)檢索、自動(dòng)文摘、自動(dòng)分類、自動(dòng)翻譯等;二是信息資源的網(wǎng)絡(luò)化和分布化,面向Internet中浩瀚無垠的資源,在廣度上提高管理和組織信息的能力。在信息檢索技術(shù)研究領(lǐng)域中,基于概念、超文本信息和多媒體信息檢索技術(shù)已取得了突破性發(fā)展。未來,多媒體信息檢索、可視化檢索、語義檢索、基于網(wǎng)格的檢索等將是網(wǎng)絡(luò)信息檢索研究發(fā)展的方向。
二、信息檢索的基本知識(shí)
我們正進(jìn)入一個(gè)飛速發(fā)展的信息時(shí)代,能否廣泛、迅速地獲取所需要的信息直接影響到學(xué)習(xí)、科研和工作的效率與成敗。在較短的時(shí)間里獲取最有價(jià)值的信息,是每一位現(xiàn)代科技工作者必須具備的基本能力。許多人都有查找資料的經(jīng)驗(yàn),例如,在計(jì)算機(jī)和網(wǎng)絡(luò)未出現(xiàn)的年代,常去書店或圖書館,注意相應(yīng)領(lǐng)域新書出版的情況,定期閱覽書評(píng)與文獻(xiàn)報(bào)道,了解學(xué)術(shù)會(huì)議的召開和論文交流情況等。這種方法雖然有效,但只限于本人所遇到的機(jī)會(huì),發(fā)現(xiàn)有價(jià)值的資料帶有一定的偶然性。網(wǎng)絡(luò)環(huán)境下,人們查找資料的方式發(fā)生很大改變?;ヂ?lián)網(wǎng)檢索工具搜索引擎和網(wǎng)頁目錄的出現(xiàn),給人們利用網(wǎng)絡(luò)資源提供了極大的方便。搜索引擎以其使用方法簡(jiǎn)單、搜索范圍廣泛而成為人們利用網(wǎng)絡(luò)資源的首選工具。然而,搜索引擎的很多檢索技術(shù)和原理仍然來源于傳統(tǒng)的計(jì)算機(jī)檢索。掌握計(jì)算機(jī)檢索的一些基本知識(shí),不僅對(duì)于用戶有效利用圖書館電子資源有很大幫助,對(duì)搜索引擎使用技能的提高也能起到很好的借鑒作用。
1、什么是信息檢索?
通俗地說,信息檢索(Information Retrieval)就是信息用戶為處理解決各種問題而查找、識(shí)別、獲取相關(guān)的事實(shí)、數(shù)據(jù)、知識(shí)的活動(dòng)及過程。廣義的信息檢索則包括兩部分,一是將信息按一定方式組織和存儲(chǔ)起來,二是針對(duì)信息用戶的特點(diǎn)需求查找出所需信息內(nèi)容的過程。在網(wǎng)絡(luò)環(huán)境下,信息檢索將幫助用戶從數(shù)字化的資源(包括數(shù)字圖書館、萬維網(wǎng)和資料庫)中得到他們有用的信息。
信息檢索的內(nèi)涵也隨著時(shí)代發(fā)展而不斷改變。20世紀(jì)中葉以前,信息的存貯和傳播主要以紙介質(zhì)為載體,信息檢索活動(dòng)主要圍繞相關(guān)文獻(xiàn)的獲取和利用而展開,因此“文獻(xiàn)檢索”一詞被廣泛使用。20世紀(jì)50年代以后,信息傳播和存儲(chǔ)載體多元化,人們不再拘泥于載體研究信息檢索,于是“情報(bào)檢索”一詞開始廣泛使用。90年代以來,人們?cè)絹碓絻A向于使用信息檢索這一含義更為廣泛的概念。
信息檢索研究的分枝學(xué)科有哪些?
在傳統(tǒng)或者非萬維網(wǎng)的世界里,信息檢索主要是編制文本索引并且在一個(gè)數(shù)據(jù)庫集合中查找有用的文獻(xiàn)資料或信息?,F(xiàn)在,信息檢索研究的領(lǐng)域非常廣泛,包括模型化、文檔分類、搜索引擎、用戶界面、數(shù)據(jù)可視化、信息過濾,自然語言處理、信息檢索語言、信息檢索系統(tǒng)體系構(gòu)建等等。從數(shù)字化資源的角度來看,信息檢索研究關(guān)注數(shù)據(jù)挖掘、多媒體信息檢索和數(shù)字圖書館資源整合等問題。
什么樣的機(jī)構(gòu)在從事信息檢索研究?
作為普通用戶,接觸到的是各種各樣的數(shù)據(jù)庫系統(tǒng)和相應(yīng)的用戶界面,如何使用這些數(shù)據(jù)庫是用戶關(guān)心的問題。但是,數(shù)據(jù)庫系統(tǒng)的構(gòu)建和用戶界面的設(shè)計(jì)等確需要有專門從事信息檢索研究的人或團(tuán)體做大量探索開發(fā)工作。
(1)計(jì)算機(jī)科學(xué)學(xué)?;驒C(jī)構(gòu)。他們的研究主要集中在計(jì)算機(jī)檢索算法、數(shù)據(jù)結(jié)構(gòu)和檢索技術(shù)。
(2)信息科學(xué)類學(xué)?;驒C(jī)構(gòu)。他們的研究可能集中在以用戶為中心的檢索相關(guān)問題解釋,關(guān)注人們?cè)鯓永斫夂褪褂眯畔ⅲ从脩舻男畔⑿袨椤?br>(3)其它。比如經(jīng)濟(jì)學(xué)?;驒C(jī)構(gòu)評(píng)價(jià)信息檢索產(chǎn)品(搜索引擎、數(shù)據(jù)資源庫等)的經(jīng)濟(jì)價(jià)值和效益,心理學(xué)研究團(tuán)體研究用戶心理,為改進(jìn)用戶界面提供參考。
2、有哪些類型的數(shù)據(jù)庫?
現(xiàn)代信息檢索依賴于各類數(shù)據(jù)庫提供信息資源。數(shù)據(jù)庫有不同的類型,根據(jù)數(shù)據(jù)庫內(nèi)容可分為全文數(shù)據(jù)庫、目錄數(shù)據(jù)庫、事實(shí)數(shù)據(jù)庫等等;根據(jù)信息載體的不同,還分為光盤數(shù)據(jù)庫、網(wǎng)絡(luò)數(shù)據(jù)庫等。隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)庫占據(jù)著越來越重要的地位,越來越多的基于Web界面的文摘數(shù)據(jù)庫、全文數(shù)據(jù)庫涌現(xiàn)出來。目前,各種圖書館、文獻(xiàn)機(jī)構(gòu)都采購或建設(shè)了大量的電子資源,包括全文數(shù)據(jù)庫、文摘數(shù)據(jù)庫、電子圖書等,提供網(wǎng)絡(luò)化服務(wù)。
3、什么是檢索語言?
說到檢索語言,有些用戶可能不知道確切的解釋,其實(shí)在我們查找信息的過程中檢索語言的作用可不小。圖書的分類體系,一些檢索工具書如《科學(xué)文摘》提供主題索引、《化學(xué)文摘》提供的化合物分子式、登記號(hào)等都是檢索語言。檢索語言是用來描述文獻(xiàn)特征、表達(dá)主題提問的一種專門的人工語言。它可以是對(duì)自然語言作規(guī)范化處理后的詞匯與技術(shù)術(shù)語;可以是某種分類體系的分類類目及分類號(hào);或者是某類事物及其某方面特征的代碼。常見的檢索語言有:分類語言、主題語言、分類主題一體化語言、代碼語言、引文語言等。
很多檢索系統(tǒng)和檢索工具是按一定的檢索語言編制的。比如我們熟悉的《工程索引》(EI)提供的主題詞表、敘詞表、分類表等都是情報(bào)檢索語言。
在網(wǎng)絡(luò)環(huán)境下,情報(bào)檢索語言仍然被廣泛利用并不斷發(fā)展。例如,分類法仍然是組織網(wǎng)絡(luò)信息的一種重要方法,所用到的分類表(傳統(tǒng)分類體系或適合網(wǎng)絡(luò)環(huán)境的自編分類體系)就是分類檢索語言,網(wǎng)頁目錄、分類搜索等廣為熟知;幾乎每一個(gè)搜索引擎都具有關(guān)鍵詞檢索功能 ,這意味著搜索引擎的索引數(shù)據(jù)庫采用了關(guān)鍵詞進(jìn)行信息組織;分類主題一體化檢索語言在搜索引擎、網(wǎng)絡(luò)目錄、元數(shù)據(jù)、聯(lián)機(jī)數(shù)據(jù)庫檢索系統(tǒng)中也有廣泛應(yīng)用;搜索引擎Google正是開發(fā)并使用了基于引文索引語言的檢索結(jié)果組織技術(shù)PageRank而一躍成為最優(yōu)秀的搜索引擎。隨著技術(shù)進(jìn)步和大量全文數(shù)據(jù)庫的出現(xiàn),自然檢索語言的使用越來越廣泛。檢索語言在網(wǎng)絡(luò)檢索中的重要發(fā)展趨勢(shì)之一是受控語言——自然語言一體化。
檢索語言綜合利用的最終目的是為用戶提供更快、更準(zhǔn)、更全的文獻(xiàn)信息。用戶應(yīng)該依據(jù)信息需求的類型、信息需求層次及信息需求的特點(diǎn),熟悉并掌握更多的信息檢索語言,不斷提高檢索效率。
4、你會(huì)使用這些檢索技術(shù)嗎?
大多數(shù)人都有過使用搜速引擎查找信息的經(jīng)歷,在Google中,輸入“信息檢索 發(fā)展趨勢(shì)”便可以找到信息檢索發(fā)展趨勢(shì)的相關(guān)資源。在這樣的查詢過程中,實(shí)際上使用了布爾邏輯符“AND”,這其實(shí)就是一種檢索技術(shù)。信息檢索過程中,為了保證檢索結(jié)果的快、全、準(zhǔn),僅靠一個(gè)檢索詞難以滿足檢索的需要,有時(shí)需要用各種算符將若干個(gè)檢索詞組成檢索式進(jìn)行檢索。信息檢索技術(shù)是指利用現(xiàn)代信息檢索系統(tǒng),如聯(lián)機(jī)數(shù)據(jù)庫、光盤數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫檢索有關(guān)信息而采用的相關(guān)技術(shù),主要有布爾邏輯符檢索、截詞符檢索和限制符檢索等。
布爾邏輯符檢索是用布爾邏輯算符將檢索詞進(jìn)行邏輯組配,凡符合邏輯組配所規(guī)定條件的為命中文獻(xiàn)。它是信息檢索中最常用的一種檢索方法。邏輯算符主要有:邏輯“與”(AND或*)、邏輯“或”(OR或+)、邏輯“非”(NOT或-)。利用檢索詞的詞干或不完整詞形進(jìn)行查找的過程為截詞檢索,它可以起到擴(kuò)大檢索范圍,提高查全率的作用。尤其在英文檢索系統(tǒng)中檢索時(shí),若遇到名詞的單復(fù)數(shù)形式,詞的不同拼寫法,詞的后綴變化時(shí),均可采用此方法。限制符檢索是通過限制檢索范圍,達(dá)到優(yōu)化檢索結(jié)果的方法。比如可以用字段標(biāo)題、文摘、作者、刊名等來限制檢索的范圍。
這些規(guī)則有著較長(zhǎng)久的歷史,在聯(lián)機(jī)檢索發(fā)展最迅速的時(shí)期有著非常廣泛的使用。在網(wǎng)絡(luò)環(huán)境下,各種檢索系統(tǒng)包括網(wǎng)絡(luò)數(shù)據(jù)庫都開發(fā)出了用戶界面友好的系統(tǒng),對(duì)于用戶檢索技能的要求有所降低,但是這些常用的檢索技術(shù)仍然被廣泛使用。比如各種文獻(xiàn)數(shù)據(jù)庫、常用的搜索引擎基本上都支持布爾邏輯檢索、截詞檢索和限制檢索。所以,掌握這些基本的檢索技術(shù)對(duì)于更好的利用網(wǎng)絡(luò)數(shù)據(jù)庫有著重要的幫助。

 


談到信息檢索就不能不談到檢索的資源問題,在今天的環(huán)境下,信息資源的構(gòu)成發(fā)生了巨大的變化?;ヂ?lián)網(wǎng)絡(luò)的出現(xiàn),改變了印刷版文獻(xiàn)資源的霸主地位。目前,印刷型文獻(xiàn)只占據(jù)信息總量中的一部分,除此之外,大量的電子資源和免費(fèi)網(wǎng)絡(luò)資源日益發(fā)展壯大,成為信息資源建設(shè)中非常重要的組成部分。互聯(lián)網(wǎng)的出現(xiàn),也改變了人們查找信息的方式和途徑。越來越多的人通過在線的方式工作、學(xué)習(xí)和獲取信息。談到信息資源利用的途徑時(shí),我們不禁要問,用戶到底是如何獲取信息的呢?中科院文獻(xiàn)情報(bào)中心針對(duì)科研人員的信息需求調(diào)查表明,使用搜索引擎的用戶占17.73%,通過各類學(xué)術(shù)網(wǎng)站查詢信息的用戶為15.46%,同時(shí)仍有13.35%的用戶利用圖書館查閱信息文獻(xiàn),通過相應(yīng)數(shù)據(jù)庫來獲取信息的用戶占到了12.72%。研究表明,科研人員在使用電子資源類型時(shí),往往對(duì)一些學(xué)術(shù)質(zhì)量高、獲取方便、更新速度快的資源比較關(guān)注。2004年,中國(guó)互聯(lián)網(wǎng)絡(luò)中心(CNNIC)第十四次中國(guó)互聯(lián)網(wǎng)發(fā)展調(diào)查報(bào)告表明,用戶上網(wǎng)的主要目的中,獲取信息占42.3%位居第一,休閑娛樂占34.5%位居第二,而學(xué)習(xí)則占9.1%,學(xué)術(shù)研究?jī)H占1.1%。 
基于上述內(nèi)容,可以認(rèn)為,圖書館電子資源因其來源可靠、后期有保障、信息組織規(guī)范、服務(wù)優(yōu)秀等優(yōu)點(diǎn)而更受科研學(xué)術(shù)人員青睞,免費(fèi)網(wǎng)絡(luò)資源因其信息更新迅速、內(nèi)容豐富、類型多樣、獲取方便、使用費(fèi)用低廉而更受普通信息用戶喜愛。在利用信息資源的過程中,圖書館電子資源和免費(fèi)網(wǎng)絡(luò)信息資源都占據(jù)重要角色,是人們獲取信息的重要來源。

全文電子化、檢索網(wǎng)絡(luò)化是信息服務(wù)的發(fā)展方向。通過上述內(nèi)容的介紹,幫助大家了解信息檢索的一般知識(shí)和我國(guó)科技文獻(xiàn)資源的布局狀況,期望能對(duì)充分利用這些寶貴資源、提高信息檢索技能有所幫助。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多