每天一個python模塊之Requests

CodeNutter 2016-08-04

展開全文

動筆前就已經(jīng)想到，這將會是一個很長系列的文章，因為python有用的模塊太多了。那么，就從這個最長用到的Requests模塊開始吧！Requests模塊是一個用于網(wǎng)絡(luò)訪問的模塊，其實類似的模塊有很多，比如urllib，urllib2，httplib，httplib2，他們基本都提供相似的功能，那為什么Requests模塊就能夠脫引而出呢？可以打開它的官網(wǎng)看一下，是一個“人類“用的http模塊。那么，它究竟怎樣的人性化呢？相信如果你之前用過urllib之類的模塊的話，對比下就會發(fā)現(xiàn)它確實很人性化。在這篇文章中，我就不做對比了，直接開講Requests。
一、導(dǎo)入
下載完成后，導(dǎo)入模塊很簡單，代碼如下：

import requests

二、請求url
這里我們列出最常見的發(fā)送get或者post請求的語法。
1.發(fā)送無參數(shù)的get請求：

r=requests.get("https://api.github.com/events")

現(xiàn)在，我們得到了一個響應(yīng)對象r，我們可以利用這個對象得到我們想要的任何信息。
上面的例子中，get請求沒有任何參數(shù)，那如果請求需要參數(shù)怎么辦呢？
2.發(fā)送帶參數(shù)的get請求

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get("http:///get", params=payload)

以上得知，我們的get參數(shù)是以params關(guān)鍵字參數(shù)傳遞的。
我們可以打印請求的具體url來看看到底對不對：

>>>print r.url
http:///get?key2=value2&key1=value1

可以看到確實訪問了正確的url。
還可以傳遞一個list給一個請求參數(shù)：

>>> payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
>>> r = requests.get("http:///get", params=payload)
>>> print r.url
http:///get?key1=value1&key2=value2&key2=value3

以上就是get請求的基本形式。
3.發(fā)送post請求

r = requests.post("http:///post", data = {"key":"value"})

以上得知，post請求參數(shù)是以data關(guān)鍵字參數(shù)來傳遞的。
現(xiàn)在的data參數(shù)傳遞的是字典，我們也可以傳遞一個json格式的數(shù)據(jù)，如下：

>>> import json
>>> import requests
>>> payload = {"key":"value"}
>>> r = requests.post("http:///post", data = json.dumps(payload))

由于發(fā)送json格式數(shù)據(jù)太常見了，所以在Requests模塊的高版本中，又加入了json這個關(guān)鍵字參數(shù)，可以直接發(fā)送json數(shù)據(jù)給post請求而不用再使用json模塊了，見下：

>>> payload = {"key":"value"}
>>> r = requests.post("http:///post", json=payload)

如果我們想post一個文件怎么辦呢？這個時候就需要用到files參數(shù)了：

>>> url = 'http:///post'
>>> files = {'file': open('report.xls', 'rb')}
>>> r = requests.post(url, files=files)
>>> r.text

我們還可以在post文件時指定文件名等額外的信息：

>>> url = 'http:///post'
>>> files = {'file': ('report.xls', open('report.xls', 'rb'), 'application/vnd.ms-excel', {'Expires': '0'})}
>>> r = requests.post(url, files=files)

tips：強(qiáng)烈建議使用二進(jìn)制模式打開文件，因為如果以文本文件格式打開時，可能會因為“Content-Length”這個header而出錯。

可以看到，使用Requests發(fā)送請求簡單吧！

三、獲取返回信息
下面我們來看下發(fā)送請求后如何獲取返回信息。我們繼續(xù)使用最上面的例子：

>>> import requests
>>> r=requests.get('https://api.github.com/events')
>>> r.text

r.text是以什么編碼格式輸出的呢？

>>> r.encoding
'utf-8'

原來是以utf-8格式輸出的。那如果我想改一下r.text的輸出格式呢？

>>> r.encoding = 'ISO-8859-1'

這樣就把輸出格式改為“ISO-8859-1”了。
還有一個輸出語句，叫r.content，那么這個和r.text有什么區(qū)別呢？r.content返回的是字節(jié)流，如果我們請求一個圖片地址并且要保存圖片的話，就可以用到，這里舉個代碼片段如下：

def saveImage( imgUrl,imgName ="default.jpg" ):
    r = requests.get(imgUrl, stream=True)
    image = r.content
    destDir="D:\"
    print("保存圖片"+destDir+imgName+"\n")
    try:
        with open(destDir+imgName ,"wb") as jpg:
            jpg.write(image)     
            return
    except IOError:
        print("IO Error")
        return
    finally:
        jpg.close

剛才介紹的r.text返回的是字符串，那么，如果請求對應(yīng)的響應(yīng)是一個json，那我可不可以直接拿到j(luò)son格式的數(shù)據(jù)呢？r.json()就是為這個準(zhǔn)備的。
我們還可以拿到服務(wù)器返回的原始數(shù)據(jù)，使用r.raw.read()就可以了。不過，如果你確實要拿到原始返回數(shù)據(jù)的話，記得在請求時加上“stream=True”的選項，如：r = requests.get('https://api.github.com/events', stream=True)。
我們也可以得到響應(yīng)狀態(tài)碼：

>>> r = requests.get('http:///get')
>>> r.status_code
200

也可以用requests.codes.ok來指代200這個返回值：

>>> r.status_code == requests.codes.ok
True

四、關(guān)于headers
我們可以打印出響應(yīng)頭：

>>> r= requests.get("https://api.github.com/events")
>>> r.headers

｀r.headers｀返回的是一個字典，例如：

{
    'content-encoding': 'gzip',
    'transfer-encoding': 'chunked',
    'connection': 'close',
    'server': 'nginx/1.0.4',
    'x-runtime': '148ms',
    'etag': '"e1ca502697e5c9317743dc078f67693f"',
    'content-type': 'application/json'
}

我們可以使用如下方法來取得部分響應(yīng)頭以做判斷：

r.headers['Content-Type']

或者

r.headers.get('Content-Type')

如果我們想獲得請求頭（也就是我們向服務(wù)器發(fā)送的頭信息）該怎么辦呢？可以使用r.request.headers直接獲得。
同時，我們在請求數(shù)據(jù)時也可以加上自定義的headers（通過headers關(guān)鍵字參數(shù)傳遞）：

>>> headers = {'user-agent': 'myagent'}
>>> r= requests.get("https://api.github.com/events",headers=headers)

五、關(guān)于Cookies
如果一個響應(yīng)包含cookies的話，我們可以使用下面方法來得到它們：

>>> url = 'http:///some/cookie/setting/url'
>>> r = requests.get(url)
>>> r.cookies['example_cookie_name']
'example_cookie_value'

我們也可以發(fā)送自己的cookie(使用cookies關(guān)鍵字參數(shù))：

>>> url = 'http:///cookies'
>>> cookies={'cookies_are':'working'}
>>> r = requests.get(url, cookies=cookies)

六、關(guān)于重定向
有時候我們在請求url時，服務(wù)器會自動把我們的請求重定向，比如github會把我們的http請求重定向為https請求。我們可以使用r.history來查看重定向：

>>> r = requests.get('http://github.com')
>>> r.url
'https://github.com/'
>>> r.history
[<Response [301]>]

從上面的例子中可以看到，我們使用http協(xié)議訪問，結(jié)果在r.url中，打印的卻是https協(xié)議。那如果我非要服務(wù)器使用http協(xié)議，也就是禁止服務(wù)器自動重定向，該怎么辦呢？使用allow_redirects 參數(shù)：

r = requests.get('http://github.com', allow_redirects=False)

七、關(guān)于請求時間
我們可以使用timeout參數(shù)來設(shè)定url的請求超時時間（時間單位為秒）：

requests.get('http://github.com', timeout=1)

八、關(guān)于代理
我們也可以在程序中指定代理來進(jìn)行http或https訪問（使用proxies關(guān)鍵字參數(shù)），如下：

proxies = {
  "http": "http://10.10.1.10:3128",
  "https": "http://10.10.1.10:1080",
}
requests.get("http://", proxies=proxies)

九、關(guān)于session
我們有時候會有這樣的情況，我們需要登錄某個網(wǎng)站，然后才能請求相關(guān)url，這時就可以用到session了，我們可以先使用網(wǎng)站的登錄api進(jìn)行登錄，然后得到session，最后就可以用這個session來請求其他url了：

s=requests.Session()
login_data={'form_email':'youremail@','form_password':'yourpassword'}
s.post("https://www.douban.com/accounts/login",login_data)
r = s.get('http://www.douban.com/notification/')
print r.text

其中，form_email和form_password是豆瓣登錄框的相應(yīng)元素的name值。

十、下載頁面
使用Requests模塊也可以下載網(wǎng)頁，代碼如下：

r=requests.get("http://www.baidu.com")
with open("haha.html","wb") as html:
    html.write(r.content)
html.close()

后續(xù)還會更新Requests模塊關(guān)于auth等相關(guān)知識。
注：該文章部分為Requests官網(wǎng)翻譯所得。

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： CodeNutter > 《Python》

舉報/認(rèn)領(lǐng)

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

CodeNutter

關(guān)注對話

TA的最新館藏

awk引用外部變量
pycharm 皮膚主題及個性化設(shè)置
centos7安裝eclipse
（總結(jié)）CentOS Linux下VNC Server遠(yuǎn)程桌面配置詳解
C++中關(guān)于位域的概念
C++空類中的默認(rèn)函數(shù)

喜歡該文的人也喜歡更多

熱門閱讀換一換

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

每天一個python模塊之Requests