作者:戴國忠 在信息技術(shù)迅猛發(fā)展的背景下, 人工智能的爆發(fā)及在諸多行業(yè)的成功應(yīng)用再次引發(fā)人們對計算機(jī)全方位為人類服務(wù)的美好想象。 然而, 作為人與計算機(jī)之間信息溝通的橋梁和以人為中心指導(dǎo)系統(tǒng)開發(fā)的方法論, 人機(jī)交互沒有得到應(yīng)有的同步發(fā)展, 其瓶頸效應(yīng)日益彰顯。 究其原因, 可以歸納為以下兩點: 一是沒有吸取好歷史的發(fā)展經(jīng)驗; 二是智能時代下應(yīng)用場景的變化導(dǎo)致新的需求, 對人機(jī)交互提出了巨大的挑戰(zhàn)。發(fā)表在《中國科學(xué):信息科學(xué)》2018年第4期“智能時代的人機(jī)交互??鄙系脑u述“智能時代人機(jī)交互的一些思考”,回顧了人機(jī)交互的發(fā)展歷史, 重點討論了人機(jī)交互的發(fā)展模式、心理學(xué)模型、交互界面、交互設(shè)計原則和研究框架等多個核心問題, 并總結(jié)了當(dāng)前人機(jī)交互出現(xiàn)的重要思想理論, 提出在智能時代下對人機(jī)交互未來發(fā)展必要的討論和思考。 作為人類發(fā)明的一種高級工具,計算機(jī)從誕生發(fā)展到現(xiàn)在, 對人們的工作和生活都產(chǎn)生了深刻的影響。 人機(jī)交互技術(shù)作為人與計算機(jī)之間信息交流的接口和以人為中心指導(dǎo)系統(tǒng)開發(fā)的方法論, 對人和計算機(jī)的發(fā)展都起著非常重要的作用。 對人機(jī)交互的廣泛研究, 提供了人們對人的交互意圖和相應(yīng)的生理、心理限制以及相關(guān)知識的描述, 發(fā)展交互技術(shù), 幫助人們完成以前無法完成的任務(wù)。同時, 人機(jī)交互的另一個主要研究目的是提供以人為中心的系統(tǒng)設(shè)計方法論, 使系統(tǒng)更好滿足用戶功效性和情感性的需求, 提高用戶與計算機(jī)之間的交互質(zhì)量和用戶體驗。 在智能時代背景下,隨著計算機(jī)技術(shù)日益廣泛地融入人類生活各個領(lǐng)域, 人機(jī)交互也越來越無處不在、無時不在。移動互聯(lián)網(wǎng)的普及使得人們可以時刻在線; 觸屏交互技術(shù)使各個年齡段的人都可以無障礙使用計算機(jī); 虛擬現(xiàn)實的興起使人們可以隨時沉浸到數(shù)字世界; 而人工智能的突破則使機(jī)器能更好地理解人的意圖, 滿足人的需求。然而, 人機(jī)交互技術(shù)并沒有因為信息技術(shù)所取得的成就而得到同步發(fā)展, 目前人與計算機(jī)的主流交互方式仍然是基于“單手單眼” 的傳統(tǒng)模式, 這使得人機(jī)交互成為了人類和計算機(jī)共同發(fā)展的瓶頸。究其原因, 主要可以歸納為兩個方面: 一是沒有充分總結(jié)吸取人機(jī)交互歷史的發(fā)展經(jīng)驗, 從歷史中尋找發(fā)展規(guī)律; 二是智能時代下應(yīng)用場景的變化帶來新的問題, 傳統(tǒng)的人機(jī)交互思想理論無法很好地適應(yīng)新的需求, 對人機(jī)交互提出了巨大的挑戰(zhàn)。 人機(jī)交互發(fā)展歷史 在1960年現(xiàn)代人機(jī)交互學(xué)科的開創(chuàng)者Licklider提出人機(jī)共生 (man-computer symbiosis) 的概念, 認(rèn)為人應(yīng)該和計算機(jī)進(jìn)行交互。1992年, 國際計算機(jī)學(xué)會 (ACM) 下的人機(jī)交互興趣小組(SIGCHI)把人機(jī)交互定義為一門對人類使用的交互式計算機(jī)系統(tǒng)進(jìn)行設(shè)計、評估和實現(xiàn), 并對其所涉及的主要現(xiàn)象進(jìn)行研究的學(xué)科。1999年美國總統(tǒng)顧問委員會報告中將 “人機(jī)交互和信息處理” 列為21世紀(jì)信息技術(shù)基礎(chǔ)研究的4個主要方向之一。2007年美國國家科學(xué)基金在其信息和智能系統(tǒng)分支中把以人為本的計算列為3個核心技術(shù)領(lǐng)域之一, 其具體主題包含多媒體和多通道界面、智能界面和用戶建模、信息可視化以及高效的以計算機(jī)為媒介的人人交互模型等。同年, 歐盟第7 框架計劃中也包含了自然人機(jī)交互的內(nèi)容。從2012年開始, ACM 在計算機(jī)學(xué)科領(lǐng)域分類系統(tǒng)中把人機(jī)交互列為計算機(jī)學(xué)科重要分支領(lǐng)域, 標(biāo)志著人機(jī)交互在計算機(jī)學(xué)科中開始占據(jù)重要位置。2016年中國國家自然科學(xué)基金在《國家自然科學(xué)基金“十三五”發(fā)展規(guī)劃》中把人機(jī)交互列為重點支持的課題。 從人機(jī)交互相關(guān)的文章數(shù)量來看,從1980年的74篇增長到了2014年的11165篇。 其中專注于人機(jī)交互的會議有100個, 期刊有25個. 參與研究的單位包括了國內(nèi)外的許多知名大學(xué)和研究機(jī)構(gòu), 例如Massachusetts Institute of Technology、Carnegie Mellon University、Stanford University、北京大學(xué)、清華大學(xué)、Microsoft 研究院、Google 研究院、中國科學(xué)院軟件研究所等。 計算機(jī)發(fā)展的過程,也是人機(jī)交互發(fā)展的過程。 計算機(jī)與人的交互方式從無交互到命令語言交互, 再發(fā)展到現(xiàn)在占據(jù)主流的圖形交互, 已經(jīng)具有直接操作和 “ 所見即所得” 的特點。圖形用戶界面的產(chǎn)生使得計算機(jī)成為人人可以操作的工具, 使Bill Gates “每個人有一臺電腦” 的理想成為現(xiàn)實。因此, 可以說是圖形用戶界面造就了個人計算機(jī)時代的輝煌。 在圖形用戶界面時代,人機(jī)交互系統(tǒng)的研究可以簡約看作是模型、范式和開發(fā)平臺的研究, 在近三十年的發(fā)展中取得了不菲的成就。但是這些技術(shù)的核心思想和方法大都是在20世紀(jì)六七十年代提出和發(fā)展的。在多媒體、多通道、虛擬現(xiàn)實、移動計算和人工智能迅速發(fā)展的智能時代, 計算機(jī)的處理速度和性能仍然在迅猛地提升。雖然計算機(jī)硬件技術(shù)已經(jīng)不是障礙, 但是用戶使用計算機(jī)的交互能力并沒有得到相應(yīng)的提高, 其中一個重要原因就是缺少與新交互需求相適應(yīng)的、高效自然的人機(jī)交互界面, 缺少成熟統(tǒng)一的能滿足當(dāng)代人機(jī)交互需求的交互技術(shù)。同時, 要完成智能時代對人機(jī)交互提出的要求和挑戰(zhàn), 一些阻礙當(dāng)代人機(jī)交互發(fā)展的理論問題和技術(shù)問題需要得到根本性的解決。其中理論問題包括認(rèn)知模型、分布式認(rèn)知理論、基于場景上下文的知識表示、人機(jī)交互中新的理論模型研究、全球知識經(jīng)濟(jì)中的人機(jī)交互等, 技術(shù)問題包括用戶界面工具、無處不在的交互式計算、社會半透明的人機(jī)交互、人機(jī)協(xié)同設(shè)計的交互技術(shù)、支持創(chuàng)新工程的交互技術(shù)等。 人機(jī)交互核心問題 對一個領(lǐng)域中知識的掌握蘊含著對該領(lǐng)域中歷史的理解和認(rèn)同。 通過對人機(jī)交互發(fā)展歷史和研究成果的總結(jié), 歸納出人機(jī)交互發(fā)展的若干核心問題, 包括: 發(fā)展模式、心理學(xué)模型、交互界面和研究框架。 心理學(xué)模型 研究框架 發(fā)展模式 人機(jī)交互的新思想理論 人機(jī)交互是一個不斷變化的領(lǐng)域,這種變化是為了響應(yīng)技術(shù)革新以及滿足隨之而來的、新用戶的需求。從應(yīng)用場景來看, 人機(jī)交互從圖形用戶界面過渡到自然用戶界面, 發(fā)展更人性化的交互界面成為人機(jī)交互進(jìn)一步發(fā)展迫在眉睫的任務(wù); 從研究層面來看, 人機(jī)交互從微觀上升到宏觀, 使用計算機(jī)技術(shù)使個人參與到社會管理活動中的方法成為人機(jī)交互關(guān)注的重點; 從研究重心來看, 人機(jī)交互從交互導(dǎo)向轉(zhuǎn)移到實踐導(dǎo)向, 其分析單元由個體交互行為上升到日常的社會實踐活動; 從研究范圍來看, 人機(jī)交互由人類、計算機(jī)的二元空間擴(kuò)展到人類、計算機(jī)和環(huán)境組成的三元空間, 人類自身所在的環(huán)境也成為了人機(jī)交互研究重點關(guān)注的一部分。 (1)自然用戶界面。它是人機(jī)交互界面的新興范式轉(zhuǎn)變。通過研究現(xiàn)實世界環(huán)境和情況, 利用新興的技術(shù)能力和感知解決方案實現(xiàn)物理和數(shù)字對象之間更準(zhǔn)確和最優(yōu)化的交互, 從而達(dá)到用戶界面不可見或者交互的學(xué)習(xí)過程不可見的目的, 其重點關(guān)注是傳統(tǒng)的人類能力(如觸摸、視覺、言語、手寫、動作)和更重要、更高層次的過程 (如認(rèn)知、創(chuàng)造力和探索)。 (2)基于現(xiàn)實的交互。它是對新一代人機(jī)交互方式的概括, 如自然用戶界面、虛擬現(xiàn)實技術(shù)、增強(qiáng)現(xiàn)實技術(shù)、上下文感知計算、手持或移動交互、感知和情感計算、語音交互及多模態(tài)界面等。 (3)技術(shù)媒介的社會參與。隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展以及互聯(lián)網(wǎng)在全球范圍內(nèi)快速普及, 越來越多的公眾開始接觸、熟悉和運用網(wǎng)絡(luò)平臺這一高效溝通工具。他們通過各種表達(dá)方式在網(wǎng)絡(luò)平臺上發(fā)表對于公共事務(wù)及公共話題的意見和建議, 從而促使網(wǎng)絡(luò)成為一種重要的民意表達(dá)方式。 (4)實踐導(dǎo)向的方法。相比于傳統(tǒng)的面向交互的方法, 面向?qū)嵺`的方法 (practice-oriented approaches, POA) 把視角從交互轉(zhuǎn)移到實踐活動上, 其分析單元由個體行動轉(zhuǎn)變?yōu)槿说娜粘嵺`, 關(guān)注點從個人行為或者社會規(guī)范上升到日?;顒拥慕M織和重組。 (5)人機(jī)共生系統(tǒng)。計算機(jī)在我們生活的各個方面都發(fā)揮越來越大的作用, 社會和信息技術(shù)在復(fù)雜的過程中不斷相互滲透和相互影響。在這種情況下, 人機(jī)共生系統(tǒng)(CHS) 由人機(jī)交互、以人為中心的計算、通用接入、數(shù)字社會與技術(shù)等發(fā)展而來, 并進(jìn)一步擴(kuò)展到數(shù)字政府、信息隱私、人與機(jī)器人交流等概念, 其目的是探索潛在的變革和顛覆性的思想, 以及基本理論和技術(shù)的創(chuàng)新, 研究人與計算機(jī)之間日益增加的關(guān)系, 并提出增進(jìn)人類能力的廣泛目標(biāo)。 智能時代人機(jī)交互的思考 1997年, 電腦 “深藍(lán)” 戰(zhàn)勝國際象棋冠軍。這場 “人機(jī)大戰(zhàn)” 是人機(jī)競爭的序幕, 展現(xiàn)了一個新時代的來臨, 一個我們稱之為 “智能時代” 的時代。隨著深度學(xué)習(xí)方法成功應(yīng)用于多個領(lǐng)域, 人工智能迎來了第3個發(fā)展高潮。在最新的一場的 “人機(jī)大戰(zhàn)” 中, Google的人工智能AlphaGo打敗了曾獲得多項世界冠軍的圍棋高手李世石, 再次揭開人們對“智能革命”的關(guān)注。另一方面, 可穿戴設(shè)備等新的交互設(shè)備的出現(xiàn)使得人機(jī)交互空間發(fā)生了極大變化, 與此同時, 語音分析、手勢識別、運動跟蹤、凝視控制等技術(shù)不斷進(jìn)步, 使用心電圖、聲音、面部特征等獨特個人特征的安全認(rèn)證技術(shù)的發(fā)展, 都在引導(dǎo)著人機(jī)交互技術(shù)的發(fā)展軌跡和范圍。在計算機(jī)技術(shù)迅速發(fā)展之際, 人機(jī)交互卻沒有取得應(yīng)有的成果, 因此需要從計算機(jī)科學(xué)角度, 探討人機(jī)交互的發(fā)展。 人機(jī)交互的新定義 在智能時代背景下,人工智能和傳感器技術(shù)迅猛發(fā)展。新技術(shù)的發(fā)展對人機(jī)交互提出了新的要求, 人機(jī)交互研究內(nèi)容從微觀到宏觀、從交互轉(zhuǎn)向?qū)嵺`、從虛擬轉(zhuǎn)向現(xiàn)實、從心理學(xué)層面轉(zhuǎn)到社會學(xué)層面。傳統(tǒng)的交互定義已經(jīng)無法滿足人機(jī)交互發(fā)展的需求。因此, 從定義上對人機(jī)交互進(jìn)行重新審視顯得十分必要。 未來的人機(jī)交互, 將會演變成 “交互人” 和 “智能機(jī)” 在物理空間、數(shù)字空間及社會空間等不同空間上的交互。這里的“交互人” 指的是能和計算機(jī)自然交互的人類, “智能機(jī)” 指的是具有人的意圖表達(dá)和感知能力的智能計算機(jī)。未來人機(jī)交互技術(shù)的發(fā)展, 除從各類不同角度上對人機(jī)交互的各類因素進(jìn)行研究外, 人作為人機(jī)交互的核心, 也將隨著技術(shù)的發(fā)展與交互設(shè)備融為一體。因此, 未來的人機(jī)交互將趨同于 “感知”, 計算機(jī)的主要交互行為將變成感知行為、感知自然現(xiàn)象、感知人的現(xiàn)象、感知人類行為, 從而實現(xiàn)為人類服務(wù)。 從人機(jī)交互到人機(jī)共生 如果說電腦改變了人們的工作方式,那么目前正以前所未有的方式快速發(fā)展的智能手機(jī)、可穿戴設(shè)備等正在改變?nèi)藗兊纳罘绞?。由于對這些移動設(shè)備的依賴, 某種程度上人與計算機(jī)已經(jīng)在一定程度上形成了一種 “共生” 關(guān)系。 人機(jī)交互發(fā)展的總體趨勢是持續(xù)向著以用戶為中心、交互方式更加直觀的方向發(fā)展。在發(fā)展過程中, 首先是側(cè)重于交互的人機(jī)交互(HCI), 然后到以人為中心的計算(HCC), 最終走向去中心化的人機(jī)共生系統(tǒng)(CHS)。 人機(jī)交互與人工智能 隨著人工智能的突破性發(fā)展,體現(xiàn)出超越人類智力、帶動產(chǎn)業(yè)變革和深入社會生活的趨勢。人工智能迅猛發(fā)展的勢頭給人類社會的進(jìn)步帶來了美好的憧憬, 同時也帶來了關(guān)于人類未來的隱憂, 甚至不少著名的專家學(xué)者發(fā)出人工智能有可能威脅人類自身生存的警告。有些專家則認(rèn)為, 人工智能發(fā)展的未來是人機(jī)合作。智能時代下的社會是人的智能和人工智能共同創(chuàng)造的, 智能社會是人機(jī)共生的社會。人工智能能放大人的智能, 使人的智能不依賴于自然的進(jìn)化而得到迅速的發(fā)展; 人的智能發(fā)展人工智能, 人工智能的進(jìn)步依賴于人的智能進(jìn)步。人的智能和人工智能是彼此互補(bǔ)、相互促進(jìn)的。 Lighthill 報告標(biāo)志著人工智能的第1次低潮;20世紀(jì)80年代末, 隨著各國政府停止對人工智能的經(jīng)費資助, 人工智能進(jìn)入第2次低潮?;厥讱v史, 人工智能歷史發(fā)展中的兩次低潮, 卻伴隨著人機(jī)交互的高速發(fā)展。在這一時期出現(xiàn)了包括WIMP范式、圖形用戶界面 在內(nèi)的很多人機(jī)交互的基礎(chǔ)理論與實踐成果。然而, 人機(jī)交互與人工智能并非是此消彼長的。人機(jī)交互是人工智能的一個研究途徑, 在人工智能發(fā)展遇到瓶頸之時人機(jī)交互往往能夠提供新的研究思路。而人工智能則給人機(jī)交互帶來突破, 驅(qū)動人機(jī)交互的發(fā)展, 并把人機(jī)交互提升到一個新的發(fā)展空間。 從人工智能的角度看,人機(jī)交互是人工智能的一個研究途徑。機(jī)器學(xué)習(xí)先驅(qū)Michael Jordan 提出人工智能最先獲得突破的領(lǐng)域是人機(jī)對話, 更進(jìn)一步的成果則是能幫人類處理日常事務(wù)甚至做出決策的家庭機(jī)器人。正是由于人機(jī)對話的需求推動了人工智能的發(fā)展。 從人機(jī)交互的角度看,人工智能為人機(jī)交互帶來突破。鼠標(biāo)鍵盤、觸屏等傳統(tǒng)的人機(jī)交互技術(shù)難以使人與計算機(jī)實現(xiàn)如同人與人之間那樣高效自然的交互, 而語音識別、圖像分析、手勢識別、語義理解、大數(shù)據(jù)分析等人工智能技術(shù)能幫助計算機(jī)更好地感知人類意圖, 完成人類無法完成的任務(wù), 驅(qū)動著人機(jī)交互的發(fā)展。 從人類的角度看,人工智能的發(fā)展是計算機(jī)技術(shù)的發(fā)展, 而計算機(jī)技術(shù)發(fā)展的最終目的是為人類服務(wù)。 人工智能要為人類服務(wù), 就不可避免需要研究人工智能的特性, 研究人的特性, 以及研究人和人工智能交互過程中遇到的問題, 這也正是人機(jī)交互所研究的問題。 因此, 人工智能和人機(jī)交互是相輔相成,相互促進(jìn)的關(guān)系。理性認(rèn)識人機(jī)交互與人工智能的關(guān)系, 在未來人機(jī)交互的發(fā)展中將具有指導(dǎo)性意義。 來源:《中國科學(xué):信息科學(xué)》 |
|