里查德·克拉布(Richard Craib)是一名29歲的南非人,在舊金山運營一家對沖基金。不過,真正運營的人不是他,而是數(shù)千名他不認識的數(shù)據(jù)科學家,以及他們建立起來的人工智能(AI)系統(tǒng)。 在初創(chuàng)企業(yè)Numerai的旗幟下,克拉布和他的團隊建立起一種技術(shù):將基金的交易數(shù)據(jù)掩蓋起來,然后分享給一大群匿名的數(shù)據(jù)科學家。 這是一種類似于同態(tài)加密的方法——既確保數(shù)據(jù)科學家看不到公司自營交易的細節(jié);同時又整理出數(shù)據(jù),便于數(shù)據(jù)科學家建立機器學習模型及做出分析。 從理論上講,他們還可以通過機器學習,找到交易證券的更優(yōu)方式。 “我們把所有的數(shù)據(jù)都分享出去了。”克拉布說,“但我們把它轉(zhuǎn)換成抽象形式,拿到數(shù)據(jù)的人并不知道這些數(shù)據(jù)的具體含義,但是又能為這些數(shù)據(jù)構(gòu)建機器學習模型?!笨死荚诳的螤柎髮W學習數(shù)學,后赴南非,在那里的一家資產(chǎn)管理公司工作。 他不知道這些數(shù)據(jù)科學家是誰,因為他們都是在網(wǎng)上招募的,報酬形式是一種數(shù)字貨幣,可以全程保持匿名?!叭魏稳硕伎梢韵蛭覀兲峤活A測,如果管用,我們就用比特幣支付報酬。”他說。 總結(jié)來說,數(shù)據(jù)科學家不清楚手里是什么數(shù)據(jù),克拉布也不清楚這些數(shù)據(jù)科學家都是誰。 由于大家到手的是加密數(shù)據(jù),因此不能將機器學習模型套用到其他數(shù)據(jù)上——即便是克拉布也不能。但他相信,通過這種“盲人引路,盲人跟從”的方式,他能創(chuàng)造出一種更加優(yōu)秀的基金。 Numerai的基金從事股票交易已有一年。至于有多成功,他不愿透露具體細節(jié),但他表示,這些交易是賺錢的。 越來越多的大型投資者向該公司投入了資金,包括“量化”對沖基金Renaissance Technologies的創(chuàng)始人——該公司就是由數(shù)據(jù)分析驅(qū)動的,并大獲成功。 對沖基金很早就開始探索算法交易了,其中包括Renaissance、Bridgewater Associates等華爾街老牌企業(yè),以及Sentient Technologies和Aidyia等科技初創(chuàng)企業(yè)。 但克拉布創(chuàng)造出了一種將算法“眾包”出去的新模式。其他機構(gòu)也在開展類似項目,包括Two Sigma——另一家紐約的數(shù)據(jù)驅(qū)動型對沖基金。但是,Numerai正在嘗試的東西則要極端得多。 走在最前沿 這聽起來很像硅谷的套路:一家小型初創(chuàng)公司,旨在通過人工智能、加密、眾包和比特幣等當前熱門的技術(shù)概念重塑金融行業(yè),就差一個虛擬現(xiàn)實了。 毫無疑問,Numerai才剛剛起步,就連它的投資者之一、Union Square的合伙人安迪·韋斯曼(Andy Weissman)都稱之為“一場實驗”。 其他企業(yè)也在開發(fā)類似的技術(shù)。從加密數(shù)據(jù)著手,構(gòu)建更為通用的機器學習模型。 這其中就包括微軟。通過這種模型,微軟等公司可以更好地保護它們所收集的客戶個人信息。 蘋果也在挺進機器學習領(lǐng)域。艾倫人工智能研究所(Allen Institute for AI)首席執(zhí)行官奧倫·艾茨奧尼(Oren Etzioni)表示,這種方法對蘋果尤其適用。蘋果在保護數(shù)據(jù)隱私方面的態(tài)度很堅決。 追隨這種技術(shù),我們也可以走向克拉布所支持的那種AI眾包。 在為南非的金融公司工作時,克拉布產(chǎn)生了這個想法。他拒絕透露那家公司的名字,但表示,它運營的基金管理著150億美元資產(chǎn)。 在那家公司,他參與構(gòu)建了一些用于基金運營但并不復雜的機器學習算法。有一次,他的朋友在用神經(jīng)網(wǎng)絡(luò)運行比較復雜的機器學習算法,他想跟朋友分享公司的數(shù)據(jù),但公司不允許。 克拉布說:“從那次起,我就開始研究新的數(shù)據(jù)加密方式,設(shè)法和他共享數(shù)據(jù),又要防止他竊取數(shù)據(jù),拿去創(chuàng)辦自己的對沖基金。” Numerai由此誕生。克拉布從自己賬上劃出100萬美元,投入該基金。4月,該公司宣布,一個投資人團體向其投資150萬美元,其中包括Renaissance Technologies創(chuàng)始人之一霍華德·摩根(Howard Morgan)。后來,摩根又與Union Square以及First Round Capital一起,參加了Numerai的A輪融資。 當然,Numerai有些非正統(tǒng)??纯此木W(wǎng)站你就明白了:在一則簡短的視頻中,克拉布描述了公司的使命。他戴著黑框眼鏡,身穿銀色的賽車夾克,背景帶著濃濃的《黑客帝國》風格。 韋斯曼說:“看到這些視頻,我們想到的是,‘這家伙想法與眾不同?!?/span> 韋斯曼坦言,這種方式的問題在于,它能否奏效。同態(tài)加密的麻煩在于,它會顯著拖慢數(shù)據(jù)分析速度。 Baffle公司正在建立類似于克拉布所描述的那種加密技術(shù),該公司CEO阿米什·迪瓦蒂亞(Ameesh Divatia)說:“同態(tài)加密需要大量的計算時間。 “怎么才能在業(yè)務(wù)決策期內(nèi)運行完畢?”克拉布說,通過一種特殊的加密形式,Numerai已經(jīng)解決了速度問題,但迪瓦蒂亞警告說,這可能會犧牲數(shù)據(jù)隱私。 拉斐爾·博斯(Raphael Bost)是麻省理工學院計算機科學與人工智能實驗室的訪問科學家,曾探索將機器學習應(yīng)用于加密數(shù)據(jù)。 據(jù)他所述,Numerai使用的可能是類似于微軟提到的一種方法:數(shù)據(jù)是加密的,但并非密不透風。對于這種方法的使用者,他提醒說,“你得提防算法受到邊信道攻擊?!?/span> “將派對設(shè)置成靜音模式” 無論如何,Numerai正在加緊努力。三個月前,約4500名數(shù)據(jù)科學家建立了約25萬個機器學習模型,為該基金作出了大約70億項預測。 現(xiàn)在,約有7500名數(shù)據(jù)科學家參與其中,建立了50萬個模型,作出了約280億項預測。就像在數(shù)據(jù)科學眾包市場Kaggle一樣,數(shù)據(jù)科學家競相構(gòu)建最好的模型,以獲取報酬。 Numerai的訣竅之一是以量取勝。通過一種名為“堆疊”或“集成”的統(tǒng)計學和機器學習技術(shù),Numerai將大量算法的精華結(jié)合起來,建立起更加強大的整體。 雖然這些數(shù)據(jù)科學家大多匿名,但也有一小部分實名參與者,包括紐約州布法羅的菲利普·卡利頓(Phillip Culliton)。除了Numerai,他還供職于一家名為Multimodel Research的數(shù)據(jù)分析公司,該公司接受美國國家科學基金會的資助。 對于Kaggle上的數(shù)據(jù)科學競賽,他已經(jīng)有多年的參賽經(jīng)驗,他認為,相對而言,Numerai更具吸引力?!癒aggle很好,我也喜歡競賽,但通常只有排名靠前的幾名選手才能獲得報酬,而且,只有某些比賽才提供報酬?!彼f,“在Numerai,排名前100左右的選手都有獎金,這個范圍是比較大的,而且Numerai的獎金也很豐厚?!?/span> 每周都有100名科學家能獲得比特幣,迄今為止,該公司發(fā)放的比特幣價值已超過15萬美元??死颊f,如果Numerai管理的資金額突破10億美元,它將每月向數(shù)據(jù)科學家支付100萬美元以上的獎金。 卡利頓說,比起非加密數(shù)據(jù),加密數(shù)據(jù)的處理和分析都更加困難,Numerai的另一位??图贰じトR明(Jim Fleming)所見略同,他參與運營著一家名為Fomoro Group的數(shù)據(jù)科學咨詢公司。但這可能不成問題。畢竟在機器學習中,分析并得出結(jié)論的,是機器,而不是人。 很多時候,即使涉及的是未加密數(shù)據(jù),卡利頓也不清楚它們究竟代表什么,但這并不妨礙他構(gòu)建相應(yīng)的機器學習模型?!凹用軘?shù)據(jù)就好比將派對設(shè)置成靜音模式?!笨ɡD說,“你聽不到人們私底下的交談,但對大家彼此間的親密程度,你還是能一目了然?!?/span> 若如克拉布所愿,這種方式能在龐大的Numerai數(shù)據(jù)科學家群體中成功推廣,那么,華爾街也將不得不洗耳恭聽。 翻譯:雁行 來源:Wired |
|