摘要
讀文獻(xiàn)自然要讀精品,在面對(duì)一個(gè)陌生領(lǐng)域,如何才能以最快速度定位精品文獻(xiàn)呢?本文將詳細(xì)介紹 HistCite 的使用方法,結(jié)合 Web of Science 和 Endnote ,演示如何在幾個(gè)小時(shí)之內(nèi),對(duì)某個(gè)陌生領(lǐng)域的文獻(xiàn)進(jìn)行宏觀的梳理,并快速定位重要文獻(xiàn)。
前言
作為科研工作者,我們常常需要對(duì)一個(gè)陌生領(lǐng)域進(jìn)行文獻(xiàn)調(diào)研。我們通常使用 Web of Science(WOS) 或者 Google Scholar 進(jìn)行文獻(xiàn)檢索,并認(rèn)為引用頻次較高的文章,就是該領(lǐng)域的重要文章。但是,大多數(shù)情況下,其搜索結(jié)果都不會(huì)太理想。因?yàn)樗y(tǒng)計(jì)的引用既包括同行的,也包括外行的,而我們真正想尋找的是那些被同行引用頻次最高的文獻(xiàn)。同時(shí),進(jìn)入陌生領(lǐng)域最快速的方式無(wú)疑是看最新的綜述,但是最新綜述的引用頻次往往很低,因?yàn)榘l(fā)表年限太短,人們往往還沒(méi)來(lái)得及引用。所以,使用引用頻次排序的方法往往會(huì)把最新的綜述文章漏掉。再次,既然是一個(gè)陌生領(lǐng)域,我們很可能不知道其熱門(mén)研究方向,因此往往連用什么關(guān)鍵詞都不太清楚,在這種情況下該如何進(jìn)行文獻(xiàn)檢索呢?
事實(shí)上,上述問(wèn)題早就有了很好的解決方案——使用 HistCite 軟件,它可以幫助我們?cè)诙潭處讉€(gè)小時(shí)之內(nèi)對(duì)陌生領(lǐng)域大量文獻(xiàn),進(jìn)行引證關(guān)聯(lián)分析,從而快速描繪出陌生領(lǐng)域的發(fā)展脈絡(luò),鎖定重要文獻(xiàn),找出該領(lǐng)域的明星科學(xué)家。
HistCite 簡(jiǎn)介
關(guān)于 HistCite 的介紹參考羅昭鋒老師寫(xiě)的《引文分析軟件 histcite 簡(jiǎn)介》。
HistCite = History of Cite ,意為引文歷史,或者叫引文圖譜分析軟件。該軟件系SCI的發(fā)明人加菲爾德開(kāi)發(fā),能夠用圖示的方式展示某一領(lǐng)域不同文獻(xiàn)之間的關(guān)系。軟件的最新版本可以從http://www. 網(wǎng)站下載。
圖1 HistCite 的界面
從 http://www. 網(wǎng)站下載軟件,安裝之后,點(diǎn)擊 HistCite 圖標(biāo)即可開(kāi)啟軟件,軟件使用IE作為其界面,顯得很簡(jiǎn)陋(圖1)。
圖2 HistCite 給出的文獻(xiàn)引證關(guān)系圖
但是, HistCite 的功能十分強(qiáng)大,最酷炫的功能就是能夠給出引證關(guān)系圖(圖2),有了這個(gè)功能,我們甚至連文章標(biāo)題都不用看,就可以判斷哪些文章值得一讀。
接下來(lái),我們用一個(gè)實(shí)例,演示如何使用 HistCite 對(duì)某個(gè)領(lǐng)域的文獻(xiàn)進(jìn)行分析。例如:我最近在調(diào)研火星的地球化學(xué)研究。
從WOS獲取數(shù)據(jù)
圖3 WOS 檢索關(guān)鍵詞 “Mars”
登錄 http://www. 網(wǎng)站,并檢索關(guān)鍵詞 “Mars”(圖3)。需要注意的是,數(shù)據(jù)庫(kù)必須選擇 “Web of ScienceTM核心合集”。否則,檢索結(jié)果無(wú)法導(dǎo)出全部引文記錄,也就無(wú)法使用 HistCite 進(jìn)行分析。
圖4 關(guān)鍵詞 “Mars” 的檢索結(jié)果
檢索結(jié)果有 34797 條(圖4),文獻(xiàn)有點(diǎn)多,考慮到我只關(guān)心火星的地球化學(xué)特征,所以,我們使用 “GEOCHEMISTRY GEOPHYSICS” 精煉一下,這樣就只剩下 4439 條記錄。此時(shí),我們并不需要找全所有文獻(xiàn),只需要包含大部分文獻(xiàn)即可。后續(xù)通過(guò) HistCite 進(jìn)行分析,重要文獻(xiàn)基本都跑不掉。
圖5 導(dǎo)出檢索結(jié)果
選擇“保存為其他文件格式”(圖5上),在彈出的對(duì)話(huà)框中(圖5下),“記錄內(nèi)容”選擇“全記錄與引用的參考文獻(xiàn)”,“文件格式”選擇“純文本”。由于一次最多只能下載 500 條記錄,所以我們先下載第 1 至 500 條。共 4439 條記錄,共需要下載 9 次。
在 HistCite 導(dǎo)入數(shù)據(jù)
打開(kāi) HistCite 軟件,選擇 File -- Add File ,選擇下載的文件,點(diǎn)擊 Add File 按鈕導(dǎo)入文件(圖6)。
圖6 導(dǎo)入數(shù)據(jù)文件
注意:如果無(wú)法導(dǎo)入,(1)請(qǐng)把下載的 txt 文件用記事本打開(kāi),將第一行的 "FN Thomson Reuters Web of Science?VR" 替換成 "FN ISI Export FormatVR",另存為 txt 文件,編碼選擇 ANSI ;(2)確保文件的路徑中沒(méi)有中文(如圖6)。
圖7 導(dǎo)入成功后的界面
導(dǎo)入數(shù)據(jù)后,可以見(jiàn)到上方的 Records 中已經(jīng)有了 500 條記錄(圖7)。接下來(lái),我們依次導(dǎo)入其它8個(gè)數(shù)據(jù)文件。全部導(dǎo)入成功之后,我們可以用File -- Save As ,把所有數(shù)據(jù)存在一個(gè)(*.hci)文件中(圖8)。這樣下次導(dǎo)入數(shù)據(jù)就不必挨個(gè)打開(kāi) txt 文件了,直接打開(kāi)此 hci 文件即可。
圖8 將所有數(shù)據(jù)另存到一個(gè) hci 文件中
HistCite 參數(shù)介紹
圖9 HistCite 分析界面
從上方的數(shù)據(jù)可知,我們一共導(dǎo)入文獻(xiàn) 4433 條,由 7721 位作者完成,發(fā)表在 107 種雜志上,這些都好理解。需要詳細(xì)說(shuō)明的是右邊的4個(gè)參數(shù):
- GCS = global citation score ,即總引用頻次,它表示這篇文章被整個(gè)WOS數(shù)據(jù)庫(kù)中所有文獻(xiàn)引用的次數(shù)。
- LCS = local citation score ,即本地引用次數(shù),它表示這篇文章在當(dāng)前數(shù)據(jù)集中被引用的次數(shù)。在這個(gè)例子里面就是,被導(dǎo)入的 4433 篇文獻(xiàn)引用的次數(shù)。因?yàn)閷?dǎo)入的文獻(xiàn)是 “Mars” 的搜索結(jié)果,所以如果一篇文章的 LCS 值高,意味著它是 “Mars” 領(lǐng)域內(nèi)的重要文獻(xiàn)。
- LCR = local cited references ,本地參考文獻(xiàn)數(shù),它表示這篇文獻(xiàn)的參考文獻(xiàn)在當(dāng)前數(shù)據(jù)集中的數(shù)量,即這篇文獻(xiàn)引用別人的情況。如果一篇文章的 LCR 值高,意味著它引用了大量的 “Mars” 領(lǐng)域內(nèi)文獻(xiàn),極有可能是綜述文章。
- CR = cited references ,參考文獻(xiàn)數(shù),它表示這篇文章的參考文獻(xiàn)在整個(gè) WOS 數(shù)據(jù)庫(kù)中的數(shù)量。
簡(jiǎn)而言之, LCS 和 LCR 更重要,它們分別代表了與本領(lǐng)域相關(guān)聯(lián)的被引用數(shù)和引用數(shù), LCS 值高的文章一般是重要的新發(fā)現(xiàn)或者新解釋?zhuān)?LCR 值高的一般是綜述類(lèi)文章。
補(bǔ)充漏網(wǎng)文獻(xiàn)
在檢索文獻(xiàn)的時(shí)候,無(wú)論怎樣設(shè)置關(guān)鍵詞,一定會(huì)存在漏網(wǎng)的重要文獻(xiàn)。使用 HistCite ,重要文獻(xiàn)基本上都跑不掉。
通過(guò)界面上方的 “Cited References” (圖10),我們知道有 86924 篇文獻(xiàn)被全部 4433 篇文章所引用。通過(guò)點(diǎn)擊該鏈接,我們可以進(jìn)入這 86924 篇被引文獻(xiàn)的列表。在這個(gè)列表中,我們發(fā)現(xiàn)很多文獻(xiàn)后面都有個(gè)綠色的“+”號(hào),這表明這篇文獻(xiàn)并沒(méi)有被本地?cái)?shù)據(jù)集收錄,也就是說(shuō)通過(guò)關(guān)鍵詞搜索并沒(méi)有檢索到的文獻(xiàn)。每篇文獻(xiàn)最后有個(gè) Recs 值,表示這篇文獻(xiàn)在當(dāng)前數(shù)據(jù)集中被引頻次,通過(guò) Recs 排序,我們很快就可以定位重要的被遺漏的文獻(xiàn)。實(shí)際上,“漏網(wǎng)之魚(yú)”還真不少,排名前9的文獻(xiàn),有 6 篇都沒(méi)有被收錄進(jìn)來(lái)。
圖10 HistCite “Cited References” 界面
接下來(lái),我們需要把這些重要的“漏網(wǎng)之魚(yú)”的數(shù)據(jù)補(bǔ)全。首先,拷貝這篇文獻(xiàn)的 DOI 值,到 WOS 網(wǎng)站搜索(圖11)。
圖11 使用 WOS 檢索漏網(wǎng)文獻(xiàn)
然后勾選搜索到的文獻(xiàn),選擇“添加到標(biāo)記結(jié)果列表”(圖12)。
圖12 將搜索結(jié)果添加到標(biāo)記結(jié)果列表
然后,繼續(xù)搜索下一篇文獻(xiàn),并添加到標(biāo)記結(jié)果列表。等完成所有搜索之后,點(diǎn)擊右上角的“標(biāo)記結(jié)果列表”,一次性把所有結(jié)果導(dǎo)出來(lái)。導(dǎo)出時(shí),與圖5所示一樣,“記錄內(nèi)容”選擇“全記錄與引用的參考文獻(xiàn)”,“文件格式”選擇“純文本”。最后,再將 txt 文件導(dǎo)入到 HistCite 中,導(dǎo)入方法與前面介紹的一樣。
尋找專(zhuān)家大牛
圖13 HistCite “Author” 界面'
通過(guò)點(diǎn)擊界面上方的 “Author” 鏈接(圖13),可以進(jìn)入作者列表,總共有 7736 位作者。 Recs 代表文章數(shù), TLCS = Total LCS , TGCS = Total GCS 。通過(guò)這個(gè)列表很容易找出該領(lǐng)域內(nèi)最高產(chǎn)和最具有學(xué)術(shù)影響力的專(zhuān)家。
收集關(guān)鍵詞
圖14 HistCite “Word” 界面
通過(guò)點(diǎn)擊界面上方的 “Word” 鏈接(圖14),我們可以進(jìn)入關(guān)鍵詞列表,從而了解這個(gè)領(lǐng)域目前的研究焦點(diǎn),記住這些關(guān)鍵詞,在后續(xù)對(duì)某個(gè)特定問(wèn)題進(jìn)行搜索時(shí)會(huì)比較方便。
生成引證關(guān)系圖
圖15 HistCite 開(kāi)啟 “Graph Maker”
選擇Tools -- Graph maker(圖15),軟件開(kāi)啟一個(gè)新窗口(圖16)。
圖16 HistCite “Graph Maker” 界面
作圖界面并不復(fù)雜,關(guān)鍵選擇是參與做圖的文獻(xiàn)數(shù)量,其余參數(shù)都是調(diào)整圖片中方塊、線(xiàn)條和字體的大小。這里選擇的是 LCS 排名前 50 的文獻(xiàn)。如果對(duì)圖中某篇文獻(xiàn)感興趣,可以直接點(diǎn)擊它,軟件會(huì)在一個(gè)新窗口中打開(kāi)該文獻(xiàn)的詳細(xì)信息,我們可以預(yù)覽一下論文的標(biāo)題和摘要(圖17)。
圖17 HistCite 文獻(xiàn)詳細(xì)信息界面
選擇感興趣的文獻(xiàn)導(dǎo)出
圖18 HistCite 開(kāi)啟 “Mark & Tag”
首先,Tools -- Mark & Tag(圖18),然后界面會(huì)有一些變化,出現(xiàn)了一個(gè) Marking and Tagging Tool 工具條,并且每篇文獻(xiàn)前面多了一個(gè)小方框可以勾選(圖19)。
圖19 HistCite “Marking and Tagging Tool”界面
勾選上感興趣的文獻(xiàn),然后點(diǎn)擊右邊的 Mark 按鈕進(jìn)行標(biāo)記。界面上方會(huì)出現(xiàn)一個(gè) “Marks” 鏈接(圖20)。把所有要導(dǎo)入 Endnote 的文獻(xiàn),全部標(biāo)記,然后點(diǎn)擊此 Marks 鏈接,可顯示全部被標(biāo)記的 23 篇文獻(xiàn)的列表(圖20)。
圖20 HistCite 的 Marks 列表
然后,F(xiàn)ile -- Export -- Records (圖21),將標(biāo)記文獻(xiàn)導(dǎo)出至一個(gè) hci 文件。
圖21 從 HistCite 導(dǎo)出被標(biāo)記的文獻(xiàn)
將文獻(xiàn)導(dǎo)入至 Endnote
首先,把導(dǎo)出的 hci 文件的后綴改成 txt,然后打開(kāi) Endnote,F(xiàn)ile -- Import -- File(圖22)。
圖22 Endnote 導(dǎo)入文獻(xiàn)選項(xiàng)
在彈出的對(duì)話(huà)框中,選擇導(dǎo)入的文件,Import Option 選擇 “Multi-Filter (Special)” (圖23),這樣可以保留文獻(xiàn)的 DOI 信息,方便后續(xù)自動(dòng)下載文獻(xiàn)。
圖23 Endnote 導(dǎo)入文獻(xiàn)對(duì)話(huà)框
在 Endnote 界面,可以看到已經(jīng)成功導(dǎo)入全部 23 篇文獻(xiàn),并且 Endnote 立刻開(kāi)始自動(dòng)查找,并下載文獻(xiàn)全文,短短幾分鐘已經(jīng)找到了 17 篇(圖24)。
圖24 Endnote 自動(dòng)下載文獻(xiàn)全文
結(jié)語(yǔ)
HistCite 作為文獻(xiàn)分析工具,其功能非常強(qiáng)大,本文并未全部介紹,比如可以查看文獻(xiàn)的逐年引用率,有些文獻(xiàn)早期被引用很多,但是近期無(wú)人引用,說(shuō)明熱點(diǎn)已經(jīng)過(guò)去,而有些文獻(xiàn)早期無(wú)人引用,但是近期卻很火爆,等等。感興趣可以自行摸索,軟件使用非常簡(jiǎn)單。
我使用 HistCite 已經(jīng)有2-3年,但是使用頻率并不高,因?yàn)槲乙膊唤?jīng)常去調(diào)研陌生的研究領(lǐng)域,而對(duì)于自己熟悉的領(lǐng)域,則不必用 HistCite 。盡管如此,每次使用的時(shí)候,我都非常有收獲。 HistCite 就像是地圖,游覽熟悉的城市,我們不需要地圖。但是游覽陌生的城市,地圖在手無(wú)疑事半功倍。哪些是不容錯(cuò)過(guò)的景點(diǎn)?各個(gè)景點(diǎn)之間的路線(xiàn)如何聯(lián)通?節(jié)省時(shí)間倒還是次要的,重要的是地圖能夠幫助我們從整體上、從全局上去理解一個(gè)陌生城市。
也許很多科研工作者還沒(méi)有聽(tīng)說(shuō)這個(gè)實(shí)用工具,特此分享。