1)簡(jiǎn)單快速:客戶向服務(wù)器請(qǐng)求服務(wù)時(shí),只需傳送請(qǐng)求方法和路徑。請(qǐng)求方法常用的有GET、HEAD、POST。每種方法規(guī)定了客戶與服務(wù)器聯(lián)系的類型不同。由于HTTP協(xié)議簡(jiǎn)單,使得HTTP服務(wù)器的程序規(guī)模小,因而通信速度很快。 2)靈活:HTTP允許傳輸任意類型的數(shù)據(jù)對(duì)象。正在傳輸?shù)念愋陀蒀ontent-Type加以標(biāo)記。 3)無(wú)連接:無(wú)連接的含義是限制每次連接只處理一個(gè)請(qǐng)求。服務(wù)器處理完客戶的請(qǐng)求,并收到客戶的應(yīng)答后,即斷開(kāi)連接。采用這種方式可以節(jié)省傳輸時(shí)間。 4)無(wú)狀態(tài):HTTP協(xié)議是無(wú)狀態(tài)協(xié)議。無(wú)狀態(tài)是指協(xié)議對(duì)于事務(wù)處理沒(méi)有記憶能力。缺少狀態(tài)意味著如果后續(xù)處理需要前面的信息,則它必須重傳,這樣可能導(dǎo)致每次連接傳送的數(shù)據(jù)量增大。 另一方面,在服務(wù)器不需要先前信息時(shí)它的應(yīng)答就較快。 二、URL和URI2.1、URL其實(shí)前面已經(jīng)簡(jiǎn)單的知道了什么是URL。 HTTP使用統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifiers, URI)描述一個(gè)網(wǎng)絡(luò)上的資源,來(lái)傳輸數(shù)據(jù)和建立連接。URL是一種特殊類型的URI,包含了用于查找某個(gè)資源的足夠的信息。 URL,全稱是UniformResourceLocator, 中文叫統(tǒng)一資源定位符,是互聯(lián)網(wǎng)上用來(lái)標(biāo)識(shí)某一處資源的地址,它的組成部分是: http://www.:8080/woss/index.html?username=10086&password=123456#name 從上面的URL可以看出,一個(gè)完整的URL包括以下幾部分: 2)域名部分:該URL的域名部分為“www.”。一個(gè)URL中,也可以使用IP地址作為域名使用 3)端口部分:跟在域名后面的是端口,域名和端口之間使用“:”作為分隔符。端口不是一個(gè)URL必須的部分,如果省略端口部分,將采用默認(rèn)端口(80) 4)虛擬目錄部分:從域名后的第一個(gè)“/”開(kāi)始到最后一個(gè)“/”為止,是虛擬目錄部分。虛擬目錄也不是一個(gè)URL必須的部分。本例中的虛擬目錄是“/woss/” 5)文件名部分:從域名后的最后一個(gè)“/”開(kāi)始到“?”為止,是文件名部分,如果沒(méi)有“?”,則是從域名后的最后一個(gè)“/”開(kāi)始到“#”為止,是文件部分,如果沒(méi)有“?”和“#”,那么從域名后的最后一個(gè)“/”開(kāi)始到結(jié)束, 都是文件名部分。本例中的文件名是“index.html”。文件名部分也不是一個(gè)URL必須的部分,如果省略該部分,則使用默認(rèn)的文件名 6)錨部分:從“#”開(kāi)始到最后,都是錨部分。本例中的錨部分是“name”。錨部分也不是一個(gè)URL必須的部分 7)參數(shù)部分:從“?”開(kāi)始到“#”為止之間的部分為參數(shù)部分,又稱搜索部分、查詢部分。本例中的參數(shù)部分為“username=10086&password=123456”。參數(shù)可以允許有多個(gè)參數(shù),參數(shù)與參數(shù)之間用“&”作為分隔符。 2.2、URI和URI的區(qū)別 1)URI,是uniform resource identifier,統(tǒng)一資源標(biāo)識(shí)符,用來(lái)唯一的標(biāo)識(shí)一個(gè)資源。 2)URL是uniform resource locator,統(tǒng)一資源定位器,它是一種具體的URI,即URL可以用來(lái)標(biāo)識(shí)一個(gè)資源,而且還指明了如何locate這個(gè)資源。 三、工作流程一次HTTP操作稱為一個(gè)事務(wù),其工作過(guò)程可分為四步: 我們用圖來(lái)理解一下: 當(dāng)我們打開(kāi)瀏覽器,在地址欄中輸入U(xiǎn)RL,然后我們就看到了網(wǎng)頁(yè)。 實(shí)際上我們輸入U(xiǎn)RL后,我們的瀏覽器給Web服務(wù)器發(fā)送了一個(gè)Request, Web服務(wù)器接到Request后進(jìn)行處理,生成相應(yīng)的Response,然后發(fā)送給瀏覽器, 瀏覽器解析Response中的HTML,這樣我們就看到了網(wǎng)頁(yè),過(guò)程如下圖所示:
我們的Request 有可能是經(jīng)過(guò)了代理服務(wù)器,最后才到達(dá)Web服務(wù)器的。過(guò)程如下圖所示:
代理服務(wù)器就是網(wǎng)絡(luò)信息的中轉(zhuǎn)站,它的功能是: 提高訪問(wèn)速度, 大多數(shù)的代理服務(wù)器都有緩存功能。 突破限制, 也就是FQ了 隱藏身份。 注意: HTTP是基于傳輸層的TCP協(xié)議,而TCP是一個(gè)端到端的面向連接的協(xié)議。所謂的端到端可以理解為進(jìn)程到進(jìn)程之間的通信。所以HTTP在開(kāi)始傳輸之前,首先需要建立TCP連接,而TCP連接的過(guò)程需要所謂的“三次握手”。 下圖所示TCP連接的三次握手。
四、HTTP中請(qǐng)求消息(request)4.1、請(qǐng)求消息格式客戶端發(fā)送一個(gè)HTTP請(qǐng)求到服務(wù)器的請(qǐng)求消息是有一定的格式:
從上面可以看出來(lái),請(qǐng)求消息由四部分組成: 請(qǐng)求行(request line)、請(qǐng)求頭部(header)、空行和請(qǐng)求數(shù)據(jù)四個(gè)部分組成
第一行中的Method表示請(qǐng)求方法,比如"POST","GET", Path-to-resoure表示請(qǐng)求的資源(url), Http/version-number 表示HTTP協(xié)議的版本號(hào) 當(dāng)使用的是"GET" 方法的時(shí)候, body是為空的。 4.2、用GET請(qǐng)求的請(qǐng)求報(bào)文當(dāng)我們?cè)L問(wèn)搜狐的官網(wǎng)的時(shí)候,我使用的是Firebug抓取的請(qǐng)求消息
第一部分:請(qǐng)求行,用來(lái)說(shuō)明請(qǐng)求類型,要訪問(wèn)的資源以及所使用的HTTP版本。 GET /http://www.sohu.com HTTP/1.1 請(qǐng)求行,只不過(guò)這里被分開(kāi)了,請(qǐng)求的方式 URL 版本 第二部分:請(qǐng)求頭部,緊接著請(qǐng)求行(即第一行)之后的部分,用來(lái)說(shuō)明服務(wù)器要使用的附加信息?!?/p> 1)Host:主機(jī)名 www.solu.com 2)User-Agent:使用什么代理服務(wù)器,這里就是FireFox,也就是火狐 3)Accept:能接收的數(shù)據(jù)類型有哪些 4)Accept-Language:表示用戶希望優(yōu)先想得到的版本,一次排列下去,先是中文,再是英文 5)Accept-Encoding:通知服務(wù)端可以發(fā)送的數(shù)據(jù)壓縮格式 6)Cookie:瀏覽器端的一個(gè)技術(shù),在服務(wù)器上記錄用戶信息,但是也會(huì)在瀏覽器中保存一份。 7)Connection:連接的方式,有兩種,非持續(xù)連接和持續(xù)連接,非持續(xù)連接,一次請(qǐng)求/響應(yīng)就對(duì)應(yīng)一個(gè)TCP連接,接到了響應(yīng)該連接就關(guān)閉,然后在發(fā)送請(qǐng)求就在建立TCP連接,持續(xù)連接就相反,這里使用的是持續(xù)連接 8)Upgrade-Insecure-Requests:該指令用于讓瀏覽器自動(dòng)升級(jí)請(qǐng)求從http到https,用于大量包含http資源的http網(wǎng)頁(yè)直接升級(jí)到https而不會(huì)報(bào)錯(cuò).簡(jiǎn)潔的來(lái)講,就相當(dāng)于在http和https之間起的一個(gè)過(guò)渡作用。 第三部分:空行,請(qǐng)求頭部后面的空行是必須的 第四部分:請(qǐng)求數(shù)據(jù)也叫主體,可以添加任意的其他數(shù)據(jù)。 由于一般請(qǐng)求報(bào)文都不會(huì)有請(qǐng)求數(shù)據(jù)的,所以在9后面就沒(méi)有內(nèi)容了,一般如果想要發(fā)送數(shù)據(jù)過(guò)去度會(huì)通過(guò)在域名后面加?然后將數(shù)據(jù)創(chuàng)送過(guò)去 4.3、用POST請(qǐng)求的請(qǐng)求報(bào)文
第一部分:請(qǐng)求行,第一行明了是post請(qǐng)求,以及http1.1版本。 五、HTTP請(qǐng)求詳解5.1、HTTP請(qǐng)求方法 根據(jù)HTTP標(biāo)準(zhǔn),HTTP請(qǐng)求可以使用多種請(qǐng)求方法。 GET:請(qǐng)求指定的頁(yè)面信息,并返回實(shí)體主體。 POST: 向指定資源提交數(shù)據(jù)進(jìn)行處理請(qǐng)求(例如提交表單或者上傳文件)。數(shù)據(jù)被包含在請(qǐng)求體中。POST請(qǐng)求可能會(huì)導(dǎo)致新的資源的建立和/或已有資源的修改。 HEAD: 類似于get請(qǐng)求,只不過(guò)返回的響應(yīng)中沒(méi)有具體的內(nèi)容,用于獲取報(bào)頭 HTTP1.1新增了五種請(qǐng)求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。 PUT:從客戶端向服務(wù)器傳送的數(shù)據(jù)取代指定的文檔的內(nèi)容。
DELETE :請(qǐng)求服務(wù)器刪除指定的頁(yè)面。
CONNECT:HTTP/1.1協(xié)議中預(yù)留給能夠?qū)⑦B接改為管道方式的代理服務(wù)器。
OPTIONS: 允許客戶端查看服務(wù)器的性能。
TRACE:回顯服務(wù)器收到的請(qǐng)求,主要用于測(cè)試或診斷。
5.2、GET和POST請(qǐng)求的區(qū)別Http協(xié)議定義了很多與服務(wù)器交互的方法,最基本的有4種,分別是GET,POST,PUT,DELETE.。一個(gè)URL地址用于描述一個(gè)網(wǎng)絡(luò)上的資源,而HTTP中的GET, POST, PUT, DELETE就對(duì)應(yīng)著對(duì)這個(gè)資源的查,改,增,刪4個(gè)操作。 我們最常見(jiàn)的就是GET和POST了。GET一般用于獲取/查詢資源信息,而POST一般用于更新資源信息。 1)提交數(shù)據(jù)方式:GET提交,請(qǐng)求的數(shù)據(jù)會(huì)附在URL之后(就是把數(shù)據(jù)放置在HTTP協(xié)議頭中),以?分割URL和傳輸數(shù)據(jù),多個(gè)參數(shù)用&連接。 例 如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果數(shù)據(jù)是英文字母/數(shù)字,原樣發(fā)送,如果是空格,轉(zhuǎn)換為+, 如果是中文/其他字符,則直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX為該符號(hào)以16進(jìn)制表示的ASCII。 POST提交:把提交的數(shù)據(jù)放置在是HTTP包的包體中。在前面的例子中提交的數(shù)據(jù)就是在回車換行的下面。 2)傳輸數(shù)據(jù)的大?。菏紫嚷暶鳎?span style="color: rgba(255, 0, 0, 1)">HTTP協(xié)議沒(méi)有對(duì)傳輸?shù)臄?shù)據(jù)大小進(jìn)行限制,HTTP協(xié)議規(guī)范也沒(méi)有對(duì)URL長(zhǎng)度進(jìn)行限制。而在實(shí)際開(kāi)發(fā)中存在的限制主要有: GET:特定瀏覽器和服務(wù)器對(duì)URL長(zhǎng)度有限制,例如 IE對(duì)URL長(zhǎng)度的限制是2083字節(jié)(2K+35)。對(duì)于其他瀏覽器,如Netscape、FireFox等,理論上沒(méi)有長(zhǎng)度限制,其限制取決于操作系 統(tǒng)的支持。 因此對(duì)于GET提交時(shí),傳輸數(shù)據(jù)就會(huì)受到URL長(zhǎng)度的 限制。 POST:由于不是通過(guò)URL傳值,理論上數(shù)據(jù)不受 限。但實(shí)際各個(gè)WEB服務(wù)器會(huì)規(guī)定對(duì)post提交數(shù)據(jù)大小進(jìn)行限制,Apache、IIS6都有各自的配置。 3)安全性:POST的安全性要比GET的安全性高。比如:通過(guò)GET提交數(shù)據(jù),用戶名和密碼將明文出現(xiàn)在URL上,因?yàn)?1)登錄頁(yè)面有可能被瀏覽器緩存;(2)其他人查看瀏覽器的歷史紀(jì)錄,那么別人就可以拿到你的賬號(hào)和密碼了, 除此之外,使用GET提交數(shù)據(jù)還可能會(huì)造成Cross-site request forgery攻擊。 4)Http get,post,soap協(xié)議都是在http上運(yùn)行的 get:請(qǐng)求參數(shù)是作為一個(gè)key/value對(duì)的序列(查詢字符串)附加到URL上的 post:請(qǐng)求參數(shù)是在http標(biāo)題的一個(gè)不同部分(名為entity body)傳輸?shù)?,這一部分用來(lái)傳輸表單信息,因此必須將Content-type設(shè)置為:application/x-www-form- urlencoded。 post設(shè)計(jì)用來(lái)支持web窗體上的用戶字段,其參數(shù)也是作為key/value對(duì)傳輸。但是:它不支持復(fù)雜數(shù)據(jù)類型,因?yàn)閜ost沒(méi)有定義傳輸數(shù)據(jù)結(jié)構(gòu)的語(yǔ)義和規(guī)則。 soap:是http post的一個(gè)專用版本,遵循一種特殊的xml消息格式,Content-type設(shè)置為: text/xml 任何數(shù)據(jù)都可以xml化。 GET提交的數(shù)據(jù)會(huì)放在URL之后,以?分割URL和傳輸數(shù)據(jù),參數(shù)之間以&相連,如login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。POST方法是把提交的數(shù)據(jù)放在HTTP包的Body中. GET提交的數(shù)據(jù)大小有限制(因?yàn)闉g覽器對(duì)URL的長(zhǎng)度有限制),而POST方法提交的數(shù)據(jù)沒(méi)有限制. GET方式需要使用Request.QueryString來(lái)取得變量的值,而POST方式通過(guò)Request.Form來(lái)獲取變量的值。 GET方式提交數(shù)據(jù),會(huì)帶來(lái)安全問(wèn)題,比如一個(gè)登錄頁(yè)面,通過(guò)GET方式提交數(shù)據(jù)時(shí),用戶名和密碼將出現(xiàn)在URL上,如果頁(yè)面可以被緩存或者其他人可以訪問(wèn)這臺(tái)機(jī)器,就可以從歷史記錄獲得該用戶的賬號(hào)和密碼. 5.3、打開(kāi)一個(gè)網(wǎng)頁(yè)需要瀏覽器發(fā)送多次Request請(qǐng)求 1) 當(dāng)你在瀏覽器輸入U(xiǎn)RL http://www.cnblogs.com 的時(shí)候,瀏覽器發(fā)送一個(gè)Request去獲取 http://www.cnblogs.com 的html. 服務(wù)器把Response發(fā)送回給瀏覽器. 六、HTTP中響應(yīng)消息(response)6.1、響應(yīng)消息格式一般情況下,服務(wù)器接收并處理客戶端發(fā)過(guò)來(lái)的請(qǐng)求后會(huì)返回一個(gè)HTTP的響應(yīng)消息。格式如下:
HTTP響應(yīng)也由四個(gè)部分組成,分別是:狀態(tài)行、消息報(bào)頭、空行和響應(yīng)正文。 6.2、響應(yīng)消息
第一部分:狀態(tài)行,由HTTP協(xié)議版本號(hào), 狀態(tài)碼, 狀態(tài)消息 三部分組成。 第一行為狀態(tài)行,(HTTP/1.1)表明HTTP版本為1.1版本,狀態(tài)碼為200,狀態(tài)消息為(ok) 第二部分:消息報(bào)頭,用來(lái)說(shuō)明客戶端要使用的一些附加信息 第二行和第三行為消息報(bào)頭。Date:生成響應(yīng)的日期和時(shí)間;Content-Type:指定了MIME類型的HTML(text/html),編碼類型是UTF-8 第三部分:空行,消息報(bào)頭后面的空行是必須的 第四部分:響應(yīng)正文,服務(wù)器返回給客戶端的文本信息。 空行后面的html部分為響應(yīng)正文。 6.3、響應(yīng)狀態(tài)碼 狀態(tài)代碼有三位數(shù)字組成,第一個(gè)數(shù)字定義了響應(yīng)的類別,共分五種類別: 常見(jiàn)的狀態(tài)碼有: 200 OK //客戶端請(qǐng)求成功 400 Bad Request //客戶端請(qǐng)求有語(yǔ)法錯(cuò)誤,不能被服務(wù)器所理解 401 Unauthorized //請(qǐng)求未經(jīng)授權(quán),這個(gè)狀態(tài)代碼必須和WWW-Authenticate報(bào)頭域一起使用 403 Forbidden //服務(wù)器收到請(qǐng)求,但是拒絕提供服務(wù) 404 Not Found //請(qǐng)求資源不存在,eg:輸入了錯(cuò)誤的URL 500 Internal Server Error //服務(wù)器發(fā)生不可預(yù)期的錯(cuò)誤 503 Server Unavailable //服務(wù)器當(dāng)前不能處理客戶端的請(qǐng)求,一段時(shí)間后可能恢復(fù)正常 七、HTTP工作原理前面把HTTP的內(nèi)容講的非常的細(xì)致,那我們來(lái)總體的看一下它的工作原理吧! HTTP協(xié)議定義Web客戶端如何從Web服務(wù)器請(qǐng)求Web頁(yè)面,以及服務(wù)器如何把Web頁(yè)面?zhèn)魉徒o客戶端。HTTP協(xié)議采用了請(qǐng)求/響應(yīng)模型??蛻舳讼蚍?wù)器發(fā)送一個(gè)請(qǐng)求報(bào)文, 請(qǐng)求報(bào)文包含請(qǐng)求的方法、URL、協(xié)議版本、請(qǐng)求頭部和請(qǐng)求數(shù)據(jù)。服務(wù)器以一個(gè)狀態(tài)行作為響應(yīng),響應(yīng)的內(nèi)容包括協(xié)議的版本、成功或者錯(cuò)誤代碼、服務(wù)器信息、響應(yīng)頭部和響應(yīng)數(shù)據(jù)。 HTTP 請(qǐng)求/響應(yīng)的步驟: 1)客戶端連接到Web服務(wù)器 一個(gè)HTTP客戶端,通常是瀏覽器,與Web服務(wù)器的HTTP端口(默認(rèn)為80)建立一個(gè)TCP套接字連接。例如,http://www.。 2)發(fā)送HTTP請(qǐng)求 通過(guò)TCP套接字,客戶端向Web服務(wù)器發(fā)送一個(gè)文本的請(qǐng)求報(bào)文,一個(gè)請(qǐng)求報(bào)文由請(qǐng)求行、請(qǐng)求頭部、空行和請(qǐng)求數(shù)據(jù)4部分組成。 3)服務(wù)器接受請(qǐng)求并返回HTTP響應(yīng) Web服務(wù)器解析請(qǐng)求,定位請(qǐng)求資源。服務(wù)器將資源復(fù)本寫到TCP套接字,由客戶端讀取。一個(gè)響應(yīng)由狀態(tài)行、響應(yīng)頭部、空行和響應(yīng)數(shù)據(jù)4部分組成。 4)釋放連接TCP連接 若connection 模式為close,則服務(wù)器主動(dòng)關(guān)閉TCP連接,客戶端被動(dòng)關(guān)閉連接,釋放TCP連接;若connection 模式為keepalive,則該連接會(huì)保持一段時(shí)間,在該時(shí)間內(nèi)可以繼續(xù)接收請(qǐng)求; 5)客戶端瀏覽器解析HTML內(nèi)容 客戶端瀏覽器首先解析狀態(tài)行,查看表明請(qǐng)求是否成功的狀態(tài)代碼。然后解析每一個(gè)響應(yīng)頭,響應(yīng)頭告知以下為若干字節(jié)的HTML文檔和文檔的字符集。 客戶端瀏覽器讀取響應(yīng)數(shù)據(jù)HTML,根據(jù)HTML的語(yǔ)法對(duì)其進(jìn)行格式化,并在瀏覽器窗口中顯示。 例如:在瀏覽器地址欄鍵入U(xiǎn)RL,按下回車之后會(huì)經(jīng)歷以下流程: 瀏覽器向 DNS 服務(wù)器請(qǐng)求解析該 URL 中的域名所對(duì)應(yīng)的 IP 地址; 解析出 IP 地址后,根據(jù)該 IP 地址和默認(rèn)端口 80,和服務(wù)器建立TCP連接; 瀏覽器發(fā)出讀取文件(URL 中域名后面部分對(duì)應(yīng)的文件)的HTTP 請(qǐng)求,該請(qǐng)求報(bào)文作為 TCP 三次握手的第三個(gè)報(bào)文的數(shù)據(jù)發(fā)送給服務(wù)器; 服務(wù)器對(duì)瀏覽器請(qǐng)求作出響應(yīng),并把對(duì)應(yīng)的 html 文本發(fā)送給瀏覽器; 釋放 TCP連接; 瀏覽器將該 html 文本并顯示內(nèi)容; 到此結(jié)束,真的好多,喜歡就“推薦”哦! |
|