編譯型語言和解釋型語言的區(qū)別

喜歡喝湯的八戒 2020-12-28

展開全文

我們編寫的源代碼是人類語言，我們自己能夠輕松理解；但是對于計算機硬件（CPU），源代碼就是天書，根本無法執(zhí)行，計算機只能識別某些特定的二進制指令，在程序真正運行之前必須將源代碼轉換成二進制指令。

所謂的二進制指令，也就是機器碼，是 CPU 能夠識別的硬件層面的“代碼”，簡陋的硬件（比如古老的單片機）只能使用幾十個指令，強大的硬件（PC 和智能手機）能使用成百上千個指令。

然而，究竟在什么時候將源代碼轉換成二進制指令呢？不同的編程語言有不同的規(guī)定：

有的編程語言要求必須提前將所有源代碼一次性轉換成二進制指令，也就是生成一個可執(zhí)行程序（Windows 下的 .exe），比如C語言、C++、Golang、Pascal（Delphi）、匯編等，這種編程語言稱為編譯型語言，使用的轉換工具稱為編譯器。
有的編程語言可以一邊執(zhí)行一邊轉換，需要哪些源代碼就轉換哪些源代碼，不會生成可執(zhí)行程序，比如 Python、JavaScript、PHP、Shell、MATLAB 等，這種編程語言稱為解釋型語言，使用的轉換工具稱為解釋器。

簡單理解，編譯器就是一個“翻譯工具”，類似于將中文翻譯成英文、將英文翻譯成俄文。但是，翻譯源代碼是一個復雜的過程，大致包括詞法分析、語法分析、語義分析、性能優(yōu)化、生成可執(zhí)行文件等五個步驟，期間涉及到復雜的算法和硬件架構。解釋器與此類似，有興趣的讀者請參考《編譯原理》一書，本文不再贅述。

Java 和 C# 是一種比較奇葩的存在，它們是半編譯半解釋型的語言，源代碼需要先轉換成一種中間文件（字節(jié)碼文件），然后再將中間文件拿到虛擬機中執(zhí)行。Java 引領了這種風潮，它的初衷是在跨平臺的同時兼顧執(zhí)行效率；C# 是后來的跟隨者，但是 C# 一直止步于 Windows 平臺，在其它平臺鮮有作為。

圖 1 編譯型語言和解釋型語言的執(zhí)行流程

那么，編譯型語言和解釋型語言各有什么特點呢？它們之間有什么區(qū)別？

編譯型語言

對于編譯型語言，開發(fā)完成以后需要將所有的源代碼都轉換成可執(zhí)行程序，比如 Windows 下的.exe文件，可執(zhí)行程序里面包含的就是機器碼。只要我們擁有可執(zhí)行程序，就可以隨時運行，不用再重新編譯了，也就是“一次編譯，無限次運行”。

在運行的時候，我們只需要編譯生成的可執(zhí)行程序，不再需要源代碼和編譯器了，所以說編譯型語言可以脫離開發(fā)環(huán)境運行。

編譯型語言一般是不能跨平臺的，也就是不能在不同的操作系統(tǒng)之間隨意切換。

編譯型語言不能跨平臺表現(xiàn)在兩個方面：

1) 可執(zhí)行程序不能跨平臺

可執(zhí)行程序不能跨平臺很容易理解，因為不同操作系統(tǒng)對可執(zhí)行文件的內部結構有著截然不同的要求，彼此之間也不能兼容。不能跨平臺是天經地義，能跨平臺反而才是奇葩。

比如，不能將 Windows 下的可執(zhí)行程序拿到 Linux 下使用，也不能將 Linux 下的可執(zhí)行程序拿到 Mac OS 下使用（雖然它們都是類 Unix 系統(tǒng)）。

另外，相同操作系統(tǒng)的不同版本之間也不一定兼容，比如不能將 x64 程序（Windows 64 位程序）拿到 x86 平臺（Windows 32 位平臺）下運行。但是反之一般可行，因為 64 位 Windows 對 32 位程序作了很好的兼容性處理。

2) 源代碼不能跨平臺

不同平臺支持的函數(shù)、類型、變量等都可能不同，基于某個平臺編寫的源代碼一般不能拿到另一個平臺下編譯。我們以C語言為例來說明。

【實例1】在C語言中要想讓程序暫?？梢允褂谩八摺焙瘮?shù)，在 Windows 平臺下該函數(shù)是 Sleep()，在 Linux 平臺下該函數(shù)是 sleep()，首字母大小寫不同。其次，Sleep() 的參數(shù)是毫秒，sleep() 的參數(shù)是秒，單位也不一樣。

以上兩個原因導致使用暫停功能的C語言程序不能跨平臺，除非在代碼層面做出兼容性處理，非常麻煩。

【實例2】雖然不同平臺的C語言都支持 long 類型，但是不同平臺的 long 的長度卻不同，例如，Windows 64 位平臺下的 long 占用 4 個字節(jié)，Linux 64 位平臺下的 long 占用 8 個字節(jié)。

我們在 Linux 64 位平臺下編寫代碼時，將 0x2f1e4ad23 賦值給 long 類型的變量是完全沒有問題的，但是這樣的賦值在 Windows 平臺下就會導致數(shù)值溢出，讓程序產生錯誤的運行結果。

讓人苦惱的，這樣的錯誤一般不容易察覺，因為編譯器不會報錯，我們也記不住不同類型的取值范圍。

解釋型語言

對于解釋型語言，每次執(zhí)行程序都需要一邊轉換一邊執(zhí)行，用到哪些源代碼就將哪些源代碼轉換成機器碼，用不到的不進行任何處理。每次執(zhí)行程序時可能使用不同的功能，這個時候需要轉換的源代碼也不一樣。

因為每次執(zhí)行程序都需要重新轉換源代碼，所以解釋型語言的執(zhí)行效率天生就低于編譯型語言，甚至存在數(shù)量級的差距。計算機的一些底層功能，或者關鍵算法，一般都使用 C/C++ 實現(xiàn)，只有在應用層面（比如網(wǎng)站開發(fā)、批處理、小工具等）才會使用解釋型語言。

在運行解釋型語言的時候，我們始終都需要源代碼和解釋器，所以說它無法脫離開發(fā)環(huán)境。

當我們說“下載一個程序（軟件）”時，不同類型的語言有不同的含義：

對于編譯型語言，我們下載到的是可執(zhí)行文件，源代碼被作者保留，所以編譯型語言的程序一般是閉源的。
對于解釋型語言，我們下載到的是所有的源代碼，因為作者不給源代碼就沒法運行，所以解釋型語言的程序一般是開源的。

相比于編譯型語言，解釋型語言幾乎都能跨平臺，“一次編寫，到處運行”是真是存在的，而且比比皆是。那么，為什么解釋型語言就能夠跨平臺呢？

這一切都要歸功于解釋器！

我們所說的跨平臺，是指源代碼跨平臺，而不是解釋器跨平臺。解釋器用來將源代碼轉換成機器碼，它就是一個可執(zhí)行程序，是絕對不能跨平臺的。

官方需要針對不同的平臺開發(fā)不同的解釋器，這些解釋器必須要能夠遵守同樣的語法，識別同樣的函數(shù)，完成同樣的功能，只有這樣，同樣的代碼在不同平臺的執(zhí)行結果才是相同的。

你看，解釋型語言之所以能夠跨平臺，是因為有了解釋器這個中間層。在不同的平臺下，解釋器會將相同的源代碼轉換成不同的機器碼，解釋器幫助我們屏蔽了不同平臺之間的差異。

關于 Python

Python 屬于典型的解釋型語言，所以運行 Python 程序需要解釋器的支持，只要你在不同的平臺安裝了不同的解釋器，你的代碼就可以隨時運行，不用擔心任何兼容性問題，真正的“一次編寫，到處運行”。

Python 幾乎支持所有常見的平臺，比如 Linux、Windows、Mac OS、Android、FreeBSD、Solaris、PocketPC 等，你所寫的 Python 代碼無需修改就能在這些平臺上正確運行。也就是說，Python 的可移植性是很強的。

總結

我們將編譯型語言和解釋型語言的差異總結為下表：

類型	原理	優(yōu)點	缺點
編譯型語言	通過專門的編譯器，將所有源代碼一次性轉換成特定平臺（Windows、Linux 等）執(zhí)行的機器碼（以可執(zhí)行文件的形式存在）。	編譯一次后，脫離了編譯器也可以運行，并且運行效率高。	可移植性差，不夠靈活。
解釋型語言	由專門的解釋器，根據(jù)需要將部分源代碼臨時轉換成特定平臺的機器碼。	跨平臺性好，通過不同的解釋器，將相同的源代碼解釋成不同平臺下的機器碼。	一邊執(zhí)行一邊轉換，效率很低。