本文來自 ,
R 語言是數(shù)據(jù)科學(xué)的終極武器,其最大的優(yōu)點是入門容易、編程容易,符合人類的思維習(xí)慣,尤其是統(tǒng)計和分析背景的人的習(xí)慣。在 Windows 下安裝非常簡便,直接默認安裝即可。但是有些細節(jié)方面的問題并沒有很清晰的文檔,此外由于系統(tǒng)權(quán)限等原因,有時會遇到一些問題,在這篇文章中,我們會對這些問題進行介紹,確保初學(xué)者在后續(xù)的操作中能順利使用R工具。
作為R的初學(xué)者,一定要分清楚 R 的用戶具備兩種身份:“使用者”和“開發(fā)者”。作為使用者,R實際上只是一種通過命令行進行操作的軟件而已,雖然看上去是在編程,實際上和編程沒有任何關(guān)系,所有的命令實際上只是在調(diào)用函數(shù)。對于這樣的用戶,只需要安裝基礎(chǔ)的環(huán)境即可。只有開發(fā)者才需要使用R語言編寫程序,而寫程序的目地是為了開發(fā)工具給未來的自己或者其他人來使用,對于這樣的用戶,需要安裝額外的開發(fā)環(huán)境,因此本文分成兩部分進行安裝。當然,由于開發(fā)者的工具安裝起來也非常簡單,只要不是太排斥安裝更多的軟件,我們建議初學(xué)者一并安裝。
基礎(chǔ)安裝
下載和安裝
在 Windows 下,基礎(chǔ)環(huán)境就是 R 的安裝程序,在 CRAN主頁 進行下載即可。進入 Window程序下載頁面 可以下載最新版的安裝包,例如 R-3.3.2-win.exe
。如果要下載舊版本的R,可以到 歷史版本下載頁面 中下載。R 的安裝是基于文件管理的,一個操作系統(tǒng)下可以安裝多個不同的版本,不會有任何的沖突,這是很方便的一個特性。
下載成功后,雙擊進行安裝。所有彈出的選擇中全部默認進行下一步即可,因為除了安裝路徑以外,其他的設(shè)置都是隨時可以調(diào)整的。關(guān)于安裝路徑,如果對電腦不大熟悉的話,建議不要安裝在C盤,可以裝在諸如 D:\R
這樣的路徑里。因為在 Win7 的系統(tǒng)下,默認的安全權(quán)限是“僅在程序嘗試對我的計算機進行更改時通知我”,在該權(quán)限下,無法直接對C盤的文件進行修改(可以通過管理員權(quán)限進行操作),這樣對R的使用會造成一定的影響,比如R包的文件夾會跑到另外的地方。為了操作簡單,我們建議把這個權(quán)限調(diào)到最低,即“從不通知”,可以在 控制面板 -> 用戶帳戶 -> 更改用戶帳戶控制設(shè)置
中進行設(shè)置,這樣的話即使安裝在C盤也沒關(guān)系,當然最簡單的辦法是裝在D盤。注意,最好不要把R安裝在包含中文字符的路徑中。
安裝成功后,安裝路徑下會多出一個R的目錄,例如 D:\R\R-3.3.2
(后面都以安裝在該文件夾為例,注意和自己的路徑進行類比),桌面上會出現(xiàn)R的快捷圖標(如果是64位的系統(tǒng),會出現(xiàn)兩個,只保留64位版本那個就行),雙擊打開后會出現(xiàn)R的控制臺。
常用設(shè)置
如果是中文環(huán)境,打開 R 后界面是中文的,建議改成英文,這樣的話出錯提示會是英文,在網(wǎng)上能搜索到更多的信息。修改起來非常容易,用任意文本工具(比如記事本)打開 D:\R\R-3.3.2\etc\Rconsole
文件,找到最后面的 language =
這一行,直接改成 language = en
,保存關(guān)閉即可。重新打開R后就變成了英文。
默認關(guān)閉 R 時總會提示是否保存工作空間,一般都不建議保存,我們可以通過設(shè)置 Windows 下的快捷方式來取消這個提示。在桌面上 R 的快捷圖標上右鍵選擇“屬性”,會發(fā)現(xiàn)“目標(T)”后面有一個編輯框顯示了快捷路徑:D:\R\R-3.3.2\bin\x64\Rgui.exe
,我們將其改成 D:\R\R-3.3.2\bin\x64\Rgui.exe --no-save
然后點擊“確認”即可。再次打開R控制臺后,退出時將不會提示,默認不保存工作空間。
RStudio
RStudio 是目前最受歡迎的R編輯器,已經(jīng)成為了R用戶的標配。當然,如果不安裝 RStudio 對于 R 的使用不會有任何問題,所有的操作都可以在 R 中自帶的控制臺中完成。只是用了 RStudio 后可以更方便地高亮顯示代碼、查看幫助、管理包等。
我們可以在 RStudio下載頁面 下載安裝文件,比如 RStudio 1.0.136.exe
,默認安裝即可,安裝成功后 RStudio 會自動找到當前使用的 R,打開后可以顯示 R 腳本和運行 R 代碼。注意,RStudio不能裝在含有中文的目錄中,否則會出錯。此外,Windows 的登錄用戶名也不能是中文,否則也會出錯。
需要注意的是,默認環(huán)境下顯示腳本中的中文可能會亂碼,需要設(shè)置成 UTF-8,在 Tools -> Global Options -> code -> Saving
界面的最下面有 Default text encoding
選項,通過 “Change” 按鈕改成 UTF-8 即可。重新打開 R 腳本,就會發(fā)現(xiàn)中文能正常顯示了。
開發(fā)環(huán)境安裝
以下內(nèi)容僅供 R 的“開發(fā)者”參考,如果只是使用 R 進行數(shù)據(jù)分析而不需要自己開發(fā) R 包的話可以忽略以下的內(nèi)容。不安裝的話不影響正常的使用。
安裝配置 Rtools
R 的很多工具需要通過 C 來編譯安裝,Windows下并沒有合適的編譯環(huán)境,所以 R 官方提供了 Rtools ,安裝后就得到了全套的開發(fā)環(huán)境。到 Rtools下載頁面 下載合適的版本即可,比如 Rtools33.exe
,修改路徑默認安裝,最好是裝在 C:\Rtools
中。
我們需要修改環(huán)境變量,在 Windows 下,右鍵 “計算機(我的電腦)”,點擊“屬性”,在彈出框中選擇“高級系統(tǒng)設(shè)置”,然后點擊最下方的“環(huán)境變量”,我們可以發(fā)現(xiàn)“用戶變量”和“系統(tǒng)變量”這兩個區(qū)域,用戶變量只對當前登錄用戶有效,系統(tǒng)變量對所有用戶都有效。我們修改系統(tǒng)變量,在列表中找到名為“Path”的變量,然后點擊“編輯”,彈出一個輸入框,“變量值”后面是一段文本,用英文分號分隔了很多個路徑,這就是 Path 環(huán)境變量,我們在最后添加以下路徑:
D:\R\R-3.3.2\bin\x64
C:\Rtools\bin
C:\Rtools\gcc-4.6.3\bin
當然,要以分號隔開復(fù)制到以上變量值文本框的最后面,例如:;D:\R\R-3.3.2\bin\x64;C:\Rtools\bin;C:\Rtools\gcc-4.6.3\bin;
修改后逐層點擊確定即可。為了測試是否設(shè)置成功,可以在“開始”菜單下運行“cmd”,將會彈出命令行界面(Dos黑框框),輸入以下命令:
1 | R --version |
如果能正常顯示 R 和 gcc 的版本,則說明安裝成功。
安裝配置 Java 環(huán)境
Java 環(huán)境并不是R中必備的開發(fā)環(huán)境,但是有很多包會依賴 Java,此外像最常用的分析工具比如 Weka、RapidMinier、Gephi等都需要Java環(huán)境,所以此處也介紹 Java 環(huán)境的安裝。Java環(huán)境通常包括 JDK(開發(fā)環(huán)境)和 JRE(運行環(huán)境),我們只需要安裝運行環(huán)境就行。
一般來說,Windows系統(tǒng)中自帶了JRE環(huán)境,通常裝在 C:\Program Files\Java
文件夾,如果找不到JRE的安裝路徑。我們也可以在 最新版JRE下載頁面下載當前版本的JRE安裝文件,也可以在 歷史版本下載頁面選擇合適的版本,例如我們選擇 JRE 1.7 (也稱 Java SE 7),下載得到 jre-7u80-windows-x64.exe
文件。
雙擊安裝即可,假設(shè)我們裝在 D:\R\Java\jre7
中,需要使用和之前相同的方法添加以下環(huán)境變量:
D:\R\Java\jre7\bin
D:\R\Java\jre7\bin\server
也就是說,在 Path 環(huán)境變量的值的最后添加 ;D:\R\Java\jre7\bin;D:\R\Java\jre7\bin\server
文本,然后確定后退出。
為了驗證安裝成功,打開 cmd 命令框,輸入:
1 | java -version |
如果正常顯示 Java 的版本說明安裝成功。