第一次接觸Selenium 的WebDriver,是在一個Web項(xiàng)目中。該項(xiàng)目使用它來進(jìn)行功能性測試。當(dāng)我看到Firefox中的頁面內(nèi)容被一個個自動填充并且自動跳轉(zhuǎn)的時候,感覺真的很神奇。通過這段時間的學(xué)習(xí)覺得可以將我學(xué)的關(guān)于WebDriver的知識進(jìn)行一個總結(jié)。
什么是Selenium 和WebDriver? Selenium是一個瀏覽器自動化操作框架。Selenium主要由三種工具組成。第一個工具SeleniumIDE,是Firefox的擴(kuò)展插件,支持用戶錄制和回訪測試。錄制/回訪模式存在局限性,對許多用戶來說并不適合,因此第二個工具——Selenium WebDriver提供了各種語言環(huán)境的API來支持更多控制權(quán)和編寫符合標(biāo)準(zhǔn)軟件開發(fā)實(shí)踐的應(yīng)用程序。最后一個工具——SeleniumGrid幫助工程師使用Selenium API控制分布在一系列機(jī)器上的瀏覽器實(shí)例,支持并發(fā)運(yùn)行更多測試。在項(xiàng)目內(nèi)部,它們分別被稱為“IDE”、“WebDriver”和“Grid”。 這里主要介紹它的第二個工具:WebDriver。 官網(wǎng)上是這么介紹它的:WebDriver is a clean, fast framework for automated testing of webapps. 但是我覺得它并不局限與進(jìn)行自動化測試,完全可以用作其它用途。 WebDriver針對各個瀏覽器而開發(fā),取代了嵌入到被測Web應(yīng)用中的JavaScript。與瀏覽器的緊密集成支持創(chuàng)建更高級的測試,避免了JavaScript安全模型導(dǎo)致的限制。除了來自瀏覽器廠商的支持,WebDriver還利用操作系統(tǒng)級的調(diào)用模擬用戶輸入。WebDriver支持Firefox(FirefoxDriver)、IE (InternetExplorerDriver)、Opera (OperaDriver)和Chrome (ChromeDriver)。 它還支持Android (AndroidDriver)和iPhone (IPhoneDriver)的移動應(yīng)用測試。它還包括一個基于HtmlUnit的無界面實(shí)現(xiàn),稱為HtmlUnitDriver。WebDriver API可以通過Python、Ruby、Java和C#訪問,支持開發(fā)人員使用他們偏愛的編程語言來創(chuàng)建測試。
如何使用? 首先,你需要將WebDriver的JAR包加入到你項(xiàng)目中CLASSPATH中。你可以Download它通過http://code.google.com/p/selenium/downloads/list。 如果你使用的是maven構(gòu)建你的項(xiàng)目,只需要在pom.xml文件中加入下面的依賴項(xiàng)即可。 <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>2.25.0</version> </dependency> <dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-server</artifactId> <version>2.25.0</version> </dependency> 然后,你就可以使用它了。WebDriver的API遵從”Best Fit”原則,在保持良好的用戶體驗(yàn)性和靈活性之間找到一個最佳的平衡點(diǎn)。 下面的例子是使用HtmlUnitDriver。HtmlUnitDriver只會在內(nèi)存中執(zhí)行這段代碼,不會彈出一個真實(shí)的頁面。 packageorg.openqa.selenium.example; 如果你想使用Firefox瀏覽器。你只需要將WebDriver driver = new FirefoxDriver()。前提是你的Firefox被安裝在默認(rèn)的位置。
如果你的FireFox沒有被安裝在指定的位置,你可以設(shè)置“webdriver.firefox.bin” 環(huán)境變量的值來指定它的位置。在Java中可以使用如下代碼: System.setProperty("webdriver.firefox.bin","thelocation of Firefox"); 如果要使用Chrome瀏覽器的話相對麻煩些。你需要首先下載一個ChromeDriver(下載地址:http://code.google.com/p/chromedriver/downloads/list)。這個程序是由Chrome團(tuán)隊(duì)提供的,你可以看做它是鏈接WebDriver和Chrome瀏覽器的橋梁。然后啟動ChromeDriver,你會得到一個Url及監(jiān)聽端口。然后使用webDriver = newRemoteWebDriver(url, DesiredCapabilities.chrome())創(chuàng)建一個ChromeWebDriver進(jìn)行操作。當(dāng)然你可以在一個子線程中啟動ChromeDriver,并設(shè)置給WebDriver。 File file = new File(your chromedriverfile path); ChromeDriverService service = newChromeDriverService.Builder().usingChromeDriverExecutable(file).usingAnyFreePort().build(); service.start(); WebDriver webDriver = new ChromeDriver(service); ….. ….. …. service.stop();
WebDriver如何工作 WebDriver是W3C的一個標(biāo)準(zhǔn),由Selenium主持。 具體的協(xié)議標(biāo)準(zhǔn)可以從http://code.google.com/p/selenium/wiki/JsonWireProtocol#Command_Reference 查看。 從這個協(xié)議中我們可以看到,WebDriver之所以能夠?qū)崿F(xiàn)與瀏覽器進(jìn)行交互,是因?yàn)闉g覽器實(shí)現(xiàn)了這些協(xié)議。這個協(xié)議是使用JOSN通過HTTP進(jìn)行傳輸。 它的實(shí)現(xiàn)使用了經(jīng)典的Client-Server模式。客戶端發(fā)送一個requset,服務(wù)器端返回一個response。 我們明確幾個概念。 Client 調(diào)用 WebDriverAPI的機(jī)器。 Server 運(yùn)行瀏覽器的機(jī)器。Firefox瀏覽器直接實(shí)現(xiàn)了WebDriver的通訊協(xié)議,而Chrome和IE則是通過ChromeDriver和InternetExplorerDriver實(shí)現(xiàn)的。 Session 服務(wù)器端需要維護(hù)瀏覽器的Session,從客戶端發(fā)過來的請求頭中包含了Session信息,服務(wù)器端將會執(zhí)行對應(yīng)的瀏覽器頁面。 WebElement 這是WebDriverAPI中的對象,代表頁面上的一個DOM元素。 舉個實(shí)際的例子,下面代碼的作用是”命令”firefox轉(zhuǎn)跳到google主頁:
WebDriver driver = new FirefoxDriver();
在執(zhí)行driver.get("http://www.google.com")這句代碼時,client,也就是我們的測試代碼向remote server發(fā)送了如下的請求: POSTsession/285b12e4-2b8a-4fe6-90e1-c35cba245956/url post_data{"url":"http://google.com"} 通過post的方式請求localhost:port/hub/session/session_id/url地址,請求瀏覽器完成跳轉(zhuǎn)url的操作。 如果上述請求是可接受的,或者說remote server是實(shí)現(xiàn)了這個接口,那么remote server會跳轉(zhuǎn)到該post data包含的url,并返回如下的response {"name":"get","sessionId":"285b12e4-2b8a-4fe6-90e1-c35cba245956","status":0,"value":""} 該response中包含如下信息 name:remote server端的實(shí)現(xiàn)的方法的名稱,這里是get,表示跳轉(zhuǎn)到指定url; sessionId:當(dāng)前session的id; status:請求執(zhí)行的狀態(tài)碼,非0表示未正確執(zhí)行,這里是0,表示一切ok不許擔(dān)心; value:請求的返回值,這里返回值為空,如果client調(diào)用title接口,則該值應(yīng)該是當(dāng)前頁面的title; 如果client發(fā)送的請求是定位某個特定的頁面元素,則response的返回值可能是這樣的: {"name":"findElement","sessionId":"285b12e4-2b8a-4fe6-90e1-c35cba245956","status":0,"value":{"ELEMENT":"{2192893e-f260-44c4-bdf6-7aad3c919739}"}} name,sessionId,status跟上面的例子是差不多的,區(qū)別是該請求的返回值是ELEMENT:{2192893e-f260-44c4-bdf6-7aad3c919739},表示定位到元素的id,通過該id,client可以發(fā)送如click之類的請求與 server端進(jìn)行交互。 |
|