EMC創(chuàng)新日:基于行為關(guān)聯(lián)的桌面搜索責(zé)任編輯:李雋作者:IT168 李雋
2008-12-18
【IT168 專稿】11月27日至28日,EMC在其成立不久的上海研發(fā)中心舉辦了主題為“創(chuàng)新無極限”2008年度創(chuàng)新日大會。作為EMC一年一度展示最新技術(shù)與產(chǎn)品的主要平臺,每年的創(chuàng)新日活動都有大量EMC核心重要的行業(yè)客戶參與,走進(jìn)其研發(fā)中心,了解存儲業(yè)界引領(lǐng)最新趨勢的技術(shù)研發(fā)項(xiàng)目和存儲系統(tǒng)產(chǎn)品。 本 次的創(chuàng)新日主題圍繞EMC 最新一代中端存儲系統(tǒng)產(chǎn)品CLARiiON CX4,在為期兩天的創(chuàng)新日日程中,我們不僅全面了解了EMC CLARiiON CX4各項(xiàng)增強(qiáng)功能和創(chuàng)新設(shè)計(jì),還有幸近距離走入EMC研發(fā)試驗(yàn)室,觀摩了許多還處于研發(fā)階段的項(xiàng)目展示。這些目前還處于實(shí)驗(yàn)室階段的技術(shù)都針對行業(yè)最為 熱點(diǎn)和前沿的存儲應(yīng)用,其中的一些研發(fā)項(xiàng)目非常有趣,不僅僅展示了EMC領(lǐng)先市場份額背后的強(qiáng)大技術(shù)實(shí)力,還體現(xiàn)了EMC研發(fā)中心創(chuàng)新與開放的思維個性。 本次創(chuàng)新日之旅的精彩內(nèi)容我們將在下面一一呈現(xiàn)給大家。 桌面關(guān)聯(lián)搜索解決方案 一些尚處于實(shí)驗(yàn)室的技術(shù)的確非常有趣,在本次創(chuàng)新日活動上,我們見到了一項(xiàng)用于桌面搜索的研發(fā)項(xiàng)目。和傳統(tǒng)的搜索方式不一樣,這項(xiàng)尚處于研究階段的項(xiàng)目能夠讓桌面電腦自動學(xué)習(xí)主人的使用習(xí)慣,通過關(guān)聯(lián)的行為、動作等習(xí)慣來進(jìn)行搜索。 由 于個人信息越來越多,如何管理海量的個人信息成為目前的一個難題,當(dāng)我們本地的文件越來越多的時(shí)候,我們很多時(shí)候都很難找到我們希望找到的文檔或者網(wǎng)頁。 而個人搜索的特點(diǎn)在于,個人的信息都是自己存放進(jìn)去的,存放的過程中其實(shí)包括了一部分的用戶個人使用習(xí)慣。而這個研究項(xiàng)目則能夠讓電腦自動的“記憶”個人 在瀏覽網(wǎng)頁、保存文檔中的一些習(xí)慣,從而進(jìn)行基于行為特征的關(guān)聯(lián)搜索,從而讓電腦仿佛擁有人工智能一般。 必須說明的是,傳統(tǒng)的搜索通常都使用關(guān)鍵詞進(jìn)行搜索,該項(xiàng)搜索功能則是對關(guān)鍵詞搜索的一個補(bǔ)充,用于搜索那些關(guān)鍵詞搜索無法獲得的文檔。 我 們發(fā)現(xiàn)人們在進(jìn)行某項(xiàng)活動的時(shí)候,通常都會殘留一些記憶的碎片,然后把這些記憶的碎片關(guān)聯(lián)起來。例如,我偶爾記得我在撰寫某篇文章的時(shí)候察看了某些網(wǎng)頁, 也許我還發(fā)了一封郵件,所以我們試圖建立起這些行為的關(guān)聯(lián),然后再查找的時(shí)候使用這些關(guān)系反映出人腦中的關(guān)聯(lián),然后一步步導(dǎo)航,直至最終找到所需要的文 檔。 我們使用計(jì)算機(jī)的行為實(shí)際上在某種程度上反映了以后我們需要查找文檔的過程,我們會記錄下用戶在計(jì)算機(jī)上的一些行為一些動作,然后作一些數(shù)據(jù)挖掘。分析包括三部分的內(nèi)容: 1. 基于資源內(nèi)容的分析,例如某兩個資源可能內(nèi)容上較為相似或者包含一些相似的內(nèi)容。 2. 做一些訪問模式的分析,我們會發(fā)現(xiàn)用戶在訪問某一資源的時(shí)候通常是要完成某一項(xiàng)任務(wù),例如完成某項(xiàng)技術(shù)報(bào)告等等,我們需要搜索一些文檔,在網(wǎng)頁上搜索一些資料,或者查看一些E-mail,查看這些E-mail的附件。我們能夠把這些資源通過任務(wù)來關(guān)聯(lián)起來。 3. 關(guān)于來源的分析,例如某些文檔通常都是通過電子郵件附件保存到本地上,或者是來自外部的某一站點(diǎn)save as保存到本地上的。 當(dāng)對這些文檔或者資源進(jìn)行過三種分析后,我們就能夠?qū)@些資源建立起一些隱含的關(guān)系,在搜索的時(shí)候利用這些關(guān)系進(jìn)行搜索。 根據(jù)EMC工程師的介紹,這種搜索的方式有自我學(xué)習(xí)的能力,使用者對某一臺電腦使用時(shí)間越長,電腦對使用者使用習(xí)慣學(xué)習(xí)的越多,這種關(guān)聯(lián)搜索的優(yōu)勢能夠更好的發(fā)揮出來。 現(xiàn)在有很多公司在進(jìn)行“語義分析”等等方面的電腦人工智能方面的研發(fā),EMC認(rèn)為對行為關(guān)聯(lián)的研究是電腦人工智能方面的另外一個研究方向,并且能夠更加簡單的實(shí)現(xiàn)一定程度上的人工智能。 |
|