隨著人工智能的進(jìn)一步演進(jìn),其重要分支智能語音逐漸成熟化,場景落地也在加速中。但這僅限于人與智能設(shè)備,人與動物是否可以溝通呢?百度EasyDL定制化聲音識別告訴你,當(dāng)然可以。該平臺不僅可以聽懂動物聲音、判斷西瓜是否熟透,而且該平臺采取開放式發(fā)展,無需深度學(xué)習(xí)人人都可以定制聲音模型。 其實,百度EasyDL早在2018百度AI開發(fā)者大會上便已經(jīng)亮相,如今其落地更進(jìn)一步。比如,隨著人們對飼養(yǎng)小動物的熱衷,如何與動物進(jìn)行溝通,不同的貓叫、狗吠聲代表著什么意思?百度EasyDL定制化聲音識別可以簡單快速的定制模型識別出不同種類的聲音,無論是您的愛寵是開心、難過、想進(jìn)食,百度EasyDL都可以快速識別,并且可以及時提醒主人。 不僅可以識別動物,在于靜態(tài)物體層面也可以產(chǎn)生關(guān)聯(lián)。比如,在生活中挑選西瓜往往是一個頭頭疼的事情,用戶只需要建立一個模型,記錄一定數(shù)量的敲擊西瓜的聲音,依照其熟度進(jìn)行標(biāo)注,并把音頻數(shù)據(jù)打包上傳至百度EasyDL,經(jīng)過多次訓(xùn)練,即可獲得“挑西瓜”模型,這是一個不斷學(xué)習(xí)的平臺,用戶在訓(xùn)練校正完畢之后,可以上傳至API,與更多的人分享。 從2016年起,人工智能進(jìn)入快速發(fā)展期,但其落地門檻太高,出現(xiàn)三大痛點:一、通用的AI模型不能滿足業(yè)務(wù)需求,需要基于自身業(yè)務(wù)數(shù)據(jù)訓(xùn)練;二、大部分客戶不了解深度學(xué)習(xí)理論和模型訓(xùn)練方法,也對繁瑣的服務(wù)部署和運維缺乏興趣;三、開發(fā)者希望跳過冗長的開發(fā)周期,直接獲得可集成的定制化服務(wù)API 及可私有化部署的定制模型。值得注意的是,百度EasyDL降低了AI準(zhǔn)入門檻,即使是技術(shù)小白通過該平臺5分鐘便可以建立一個模型。 據(jù)了解百度EasyDL 具有四大特性,即“可即用、更輕快、高精度、強安全”。以精準(zhǔn)度為例,1000個音頻可在1個小時左右訓(xùn)練完成,超過三分之二的模型準(zhǔn)確率高于90%。截止到2018年7月,已經(jīng)有超過6000個合作伙伴和開發(fā)者使用百度EasyDL,累計創(chuàng)建模型超過1萬個。EasyDL已在互聯(lián)網(wǎng)、零售、醫(yī)藥、制造業(yè)、交通、倉儲物流、安防監(jiān)控等多個行業(yè)實現(xiàn)落地應(yīng)用。 通過無門檻的人工智能技術(shù),實現(xiàn)人與物的“溝通”,無疑具有劃時代的意義。 |
|
來自: 昵稱59020197 > 《待分類》