來自雷鋒網(wǎng)(leiphone-sz)的報(bào)道 相比國內(nèi)外的科技巨頭,微軟在這場號稱“百箱大戰(zhàn)”熱潮里,姍姍來遲。一般來說,遲到的原因無非兩個,一個是動作太慢沒趕上,另一個是在伺機(jī)而動等待后發(fā)。如果說此前還無從判斷微軟的“遲”是哪種情況,那么現(xiàn)在則比較清晰了。 兩周前,微軟聯(lián)合音箱制造商哈曼卡頓推出智能音箱 Invoke,Cortana 作為語音智能助手內(nèi)置其中,可供喚醒,執(zhí)行操作。更早前,微軟與亞馬遜同時宣布,打通 Cortana 與 Alexa,在 Windows 10 設(shè)備上對 Cortana 說“call Alexa”,就能夠喚醒后者。 在AI競爭加劇,智能語音助手混戰(zhàn)的背景下,在薩提亞·納德拉“云+端”的戰(zhàn)略下,從這兩件事其實(shí)可以看出微軟對 Cortana 的定位,越來越明晰了:一方面為硬件合作伙伴提供 AI 技術(shù),另一方面和同行業(yè)伙伴結(jié)盟。 這個判斷雷鋒網(wǎng)編輯在微軟(亞洲)互聯(lián)網(wǎng)工程院常務(wù)副院長、Cortana 負(fù)責(zé)人幺寶剛處也得到了確證:
從應(yīng)用角度來看,Cortana 進(jìn)入了 Windows、iOS、Android 等不同的系統(tǒng),連通微軟生態(tài)中的 Office、Skype 等一同成為效率工具。從平臺角度而言,PC、手機(jī)之后,Cortana 相繼也將其 AI 能力應(yīng)用在了家居、音箱、電視、車載、lOT 等場景中,未來將會隨著微軟的業(yè)務(wù)繼續(xù)進(jìn)行擴(kuò)張。 整體來說,智能語音助手這條賽道似乎出現(xiàn)了“奇怪”的盤面,一方面是競爭的加劇,無論是巨頭之間還是創(chuàng)業(yè)公司的涌進(jìn)都能說明;另一方面則是“結(jié)盟開放”的趨勢越來越明朗。 以下為專訪幺寶剛的Q&A部分,雷鋒網(wǎng)在不改變原意的基礎(chǔ)上做了增刪: ◆ ◆ ◆ 關(guān)于產(chǎn)品 雷鋒網(wǎng):微軟和哈曼卡頓合作的音箱 Invoke 有什么亮點(diǎn)? 幺寶剛:產(chǎn)品的亮點(diǎn)包括幾個。 第一個是優(yōu)秀的產(chǎn)品自然會吸引最優(yōu)秀的合作者,哈曼卡頓這樣的高端音箱品牌與我們合作,我們也一直希望 Cortana 對外傳達(dá)一種高端調(diào)性,因此最突出的一點(diǎn)就是聲音,包括兩部分,一部分是音質(zhì)非常好,另一部分是 Cortana 的聲音——計(jì)算機(jī)自動生成聲音的自然度也是最好的,這個是第一個亮點(diǎn)。 第二個亮點(diǎn)是,用戶可以通過音箱,直接跟 Skype 連通接打電話,也有一些智能音響可以打電話,但 Skype 除了能夠打電話之外,還跟你的 Skype 聯(lián)系人直接做對話。 第三是跨平臺。用戶不光可以在音箱上呼喚小娜,也可以跨平臺通過 PC,手機(jī)等任何操作平臺上聯(lián)動使用Cortana。 作為人工智能助理, Cortana 對用戶提出的知識性問題給予準(zhǔn)確的回答,這主要依托了 Bing 的后臺,除了語音識別、自然語言理解,對知識圖譜的建立,都是智能音箱的亮點(diǎn)。其實(shí)我們非常高興,雖然我們正式進(jìn)入這個市場,來的慢一點(diǎn),但是我們有明晰的定位,并且獲得非常正面的用戶反饋。 Cortana現(xiàn)在定位變的更清晰,現(xiàn)在更多專注在效率方面,高效生活高效工作。 在音箱設(shè)置的時候,如果用戶擁有 Office365 的賬號,就可以直接連接Cortana,并且使用 Cortana 進(jìn)行管理會議、日程和提醒,因?yàn)樾∧鹊目缙脚_屬性,用戶可以輕松同步手機(jī)和 電腦 ,這樣專注于高效的例子,未來將會在我們產(chǎn)品的特性、功能上不斷加強(qiáng)、優(yōu)化和展現(xiàn)。 小娜的技術(shù)正在不斷的迭代過程中,現(xiàn)在可能越來越多的人工智能同行也都了解到,這需要很大的投入和基礎(chǔ)力量,微軟深耕人工智能領(lǐng)域,其技術(shù)投入和研發(fā)力量不言而喻,例如就在今年8月,我們的對話語音識別技術(shù)達(dá)到了人類專業(yè)水平,錯誤率由5.9%進(jìn)一步降低到5.1%。雖然數(shù)字感覺很小,但到后面的提高也會越來越困難,這個就是技術(shù)的進(jìn)步。 雷鋒網(wǎng):除了賦能硬件廠商外,內(nèi)容上也很重要,微軟在這方面有什么進(jìn)展? 幺寶剛:想要成為無處不在的人工智能助理,小娜還有很長的路要走,我們現(xiàn)在所專注的是以下幾點(diǎn): 第一點(diǎn),打鐵自身要硬,我個人對于微軟自身的技術(shù)非常自信,特別在基礎(chǔ)的科學(xué)研究和技術(shù),例如語音識別,語意理解,微軟多年的積累和沉淀帶來相當(dāng)大的優(yōu)勢。 第二點(diǎn),除了技術(shù)之外,還要帶給用戶足夠好的體驗(yàn)。我認(rèn)為,用戶體驗(yàn)分為兩部分:一個是加入微軟生態(tài),與微軟的生產(chǎn)力工具 Office、Skype 等結(jié)合;另外一個,是小娜的IQ方面的發(fā)力,她需要非常聰明,具備足夠的知識儲備,從 Cortana 上可以看到,當(dāng)時微軟在 Bing 上面做投入是有道理的,如果我們不做搜索引擎,那么現(xiàn)在搭建一個完備的知識圖譜是很困難的事情,而幸運(yùn)的是,微軟目前既有高效的生產(chǎn)力工具,又有搜索引擎,搭建知識圖譜,讓人工智能擁有足夠的知識。。 第三點(diǎn),就是技能的開發(fā)平臺。我們希望開發(fā)者、第三方用戶、廠商,都可以利用這個技能平臺進(jìn)行開發(fā),提供內(nèi)容,加到 Cortana 里,網(wǎng)易云音樂就是個例子。這個平臺已經(jīng)在美國推出了,晚一點(diǎn)時間,會在中國繼續(xù)大力推廣,這也是我們希望與合作方構(gòu)建科技生態(tài)的一部分。 雷鋒網(wǎng):讓用戶覺得體驗(yàn)好的標(biāo)準(zhǔn)是什么? 幺寶剛:最基本的層面,是語音的識別率,我剛才也提到,目前我們的我們的對話語音識別技術(shù)達(dá)到了人類專業(yè)水平;再往上升一層,是我們希望用戶的問題能獲得最直接有效的幫助。對于同一個問題,有很多智能助理,哪個回答的最接近于用戶希望得到的,我們是請專業(yè)的人來評測的。但我覺得最關(guān)鍵的,更多用戶使用所產(chǎn)生的大數(shù)據(jù)有足夠多的用戶,使用黏性、使用頻度實(shí)際上證明了這個事情對他有多重要。如果他每天都會來用幾次,說明這個有用,不然的話自然而然就不用了,就會選擇別的了。所以我覺得我們既有技術(shù)層面的,也有應(yīng)用層面的,還有用戶層面的一些度量。 雷鋒網(wǎng):未來微軟有沒有可能推出自己的智能音箱? 幺寶剛:小娜未來的發(fā)展自然會跟隨公司戰(zhàn)略,作為微軟生態(tài)的一部分,像微軟內(nèi)部已有硬件,例如Xbox,小娜已經(jīng)在進(jìn)行整合,所以我們也將會配合公司的戰(zhàn)略發(fā)展。 雷鋒網(wǎng):目前對 Cortana 在營收上有什么期待嗎?或者KPI。 幺寶剛:像剛才我也提到,在商業(yè)模式方面,我們第一年的專著點(diǎn)會是先專著于用戶數(shù)量和用戶體驗(yàn)上,所以至少在我們這個財(cái)年這不是一個目標(biāo)。 ◆ ◆ ◆ 關(guān)于競爭 雷鋒網(wǎng):你覺得智能語音助手,在未來競爭中可能會勝出的因素有什么? 幺寶剛:我們也在思考這樣的事情。我覺得有幾點(diǎn): 第一,一定要有自己專業(yè)核心的投入,人工智能這個概念已經(jīng)不陌生了,歷史上也經(jīng)歷過遇冷,因?yàn)楸旧砭秃茈y,核心的東西,需要長期不懈的努力,才可能有突破。我認(rèn)為關(guān)鍵點(diǎn)在于公司是否愿意在基礎(chǔ)研究方面做持續(xù)不斷的投入。不然,你的核心技術(shù)將來會依賴于別人。而微軟在這方面,擁有多年積累的技術(shù)、同樣在人才方面,我們也投入很多。 第二,要有基礎(chǔ)應(yīng)用。人工智能助理必須有自己的內(nèi)容,需要足夠聰明,并且擁有足夠的知識,那這個從哪里來?微軟之所以有知識圖譜,是因?yàn)槲覀兺顿Y了多年的 Bing 。同樣,我們之所以能夠?qū)W⒃谛史矫?,也是因?yàn)橛?Office 多年的積累,以及對用戶需求的了解。 第三,足夠多的數(shù)據(jù)。目前有兩種人工智能的應(yīng)用場景,一種是比較通用的,還有一種是在垂直領(lǐng)域的應(yīng)用。我認(rèn)為,要獲得足夠的數(shù)據(jù)首先要有多年的技術(shù)積累,其次要對行業(yè)非常了解,微軟認(rèn)知服務(wù)集合多種智能API以及知識API,目前我們已發(fā)布包括視覺,語音,還有翻譯語言,語義理解等29款工具,我們也希望能和更多合作伙伴一同探索人工智能的更多應(yīng)用和可能。 雷鋒網(wǎng):微軟整體的戰(zhàn)略,是云為先移動為先,Cortana 在這個戰(zhàn)略里扮演著什么樣的角色? 幺寶剛:微軟 CEO 薩提亞提出智能云+智能邊緣計(jì)算的概念,也就是Cloud+AI的模式,我們認(rèn)為,未來的世界是由智能云和智能端,用人工智能將所有東西連接在一起。我覺得的 Cortana 是一個非常典型的體現(xiàn),原因在于,首先我們對 Cortana 的定位,是一個無處不在的智能助理,所謂無處不在是指, Cortana 既可以獨(dú)立作為一個應(yīng)用存在,也可以存在在微軟的應(yīng)用或者合作伙伴的應(yīng)用、甚至存在于定制的設(shè)備里,當(dāng)然做到這一點(diǎn)的前提是,小娜必須生活在云端,只有這樣的話,才能夠同時為這么多的終端服務(wù)。 另外,Cortana 后臺的很多技術(shù),其實(shí)應(yīng)用的都是云服務(wù),Cortana 可以通過智能助理的使用,把語音做的更好,做更好的語音,我們還通過微軟的認(rèn)知服務(wù)提供給那些暫時不需要 Cortana,但是需要微軟語音服務(wù)的開發(fā)者使用。 雷鋒網(wǎng):小冰那邊會講一些數(shù)據(jù),比如說對話輪次達(dá)到多少輪,小娜好像不太強(qiáng)調(diào)這些數(shù)據(jù)。 幺寶剛:對,因?yàn)樾”且粋€情感機(jī)器人,那她陪伴用戶的時間長,對她來說是一個很重要的指標(biāo)。我先不說小娜先說搜索引擎,那搜索引擎最理想的對話次數(shù)是多少? 雷鋒網(wǎng):一輪。 幺寶剛:就是我馬上就告訴你答案。但是對于智能助理,理想狀態(tài)到底應(yīng)該是多少?這個其實(shí)說實(shí)在的,我們也沒有把這個問題規(guī)定下來,是一輪或者多輪。我覺得可能最后還是要看客戶的問題是什么?比如用戶提出一個問題,是對智能助理說,幫我定一班去上海的火車,我下午有個會,那這個智能助理就應(yīng)該很聰明的知道,用戶下午幾點(diǎn)開會,用戶的火車應(yīng)該在下午兩點(diǎn)就要出發(fā),那他就給你定好了兩點(diǎn)的火車。但如果你的問題是你給我講一個笑話吧,或者給我唱首歌。那你是只唱一首歌就完了嗎?所以這個其實(shí)還是要看場景來定的。所以我覺得根據(jù)場景會有不同測量的指標(biāo),可以分享的是,從小娜推出之后到現(xiàn)在,用戶問過的問題已經(jīng)超過了一百億。 雷鋒網(wǎng):在和其他硬件系統(tǒng)整合的時候,會不會出現(xiàn)權(quán)限上的差異?比如說 iOS 給 Siri 的權(quán)限大一點(diǎn)? 幺寶剛:每個平臺其實(shí)都有限制,即使像 Siri 在 iOS 也不可能所有事情都做,因?yàn)橛袝r候用戶或者APP本身會有授權(quán),關(guān)鍵是說你了解這個限制,然后看怎么樣讓用戶獲得最好的體驗(yàn)。 雷鋒網(wǎng):某種程度上來說 Cortana 也算一個 OS,只是沒有提這樣的概念,微軟如何來面對類似百度這樣的廠商的競爭? 幺寶剛:一方面是微軟對技術(shù)的多年投入;另外一方面就是不可能全面出擊,而要找到專注點(diǎn)。我們的專注點(diǎn)在于生產(chǎn)效率;第三是微軟還是作為一個平臺的公司,我們希望變成一個開放的系統(tǒng),與更多的合作伙伴進(jìn)行合作。此外,因?yàn)楹芏嗳硕枷胱鲩_放平臺,但不是所有的開放平臺大家都去用的,所以我覺得微軟作為一家國際性、擁有全球領(lǐng)先科技和具備信賴感的科技企業(yè)我為此充滿信心。 — 報(bào)告下載 — 雷報(bào)是雷鋒網(wǎng)旗下專門對各個行業(yè)報(bào)告進(jìn)行匯總、解讀的欄目。在這里,你能看到國內(nèi)外知名咨詢公司、投行機(jī)構(gòu)制作的專業(yè)報(bào)告,以及雷鋒網(wǎng)的獨(dú)家業(yè)界白皮書,讓你也能擁有縱覽全局的眼界。 回復(fù)關(guān)鍵詞「薪酬」查看 雷鋒網(wǎng)獨(dú)家針對人工智能行業(yè)的薪酬調(diào)查 回復(fù)關(guān)鍵詞「0629」下載 IBM內(nèi)部關(guān)于云計(jì)算、區(qū)位鏈、物聯(lián)網(wǎng)等領(lǐng)域的趨勢報(bào)告 回復(fù)關(guān)鍵詞「0633」下載 AI領(lǐng)域史上最全研究、應(yīng)用、人物專訪報(bào)告 回復(fù)關(guān)鍵詞「搶飯碗」計(jì)算 你被機(jī)器人搶飯碗的概率 回復(fù)關(guān)鍵詞「高盛無人機(jī)」下載 高盛關(guān)于無人機(jī)未來幾年的市場預(yù)測 回復(fù)關(guān)鍵詞「虛擬貨幣調(diào)查」查看 劍橋?qū)δ壳疤摂M貨幣現(xiàn)狀的調(diào)查分析 雷鋒網(wǎng)招人了! 職位需求: 業(yè)界組編輯、AI學(xué)術(shù)編輯、AI金融采編、新智造采編(均為全職) 職位要求: 對崗位領(lǐng)域有一定程度的了解; 擁有較好的邏輯思維能力,能夠辯證的看待事物; 有學(xué)習(xí)精神和挑戰(zhàn)意識; 英文六級及以上(編輯職位要求) 工作地點(diǎn): 深圳或北京 簡歷投遞: hr@leiphone.com |
|