原創(chuàng)文章第290篇,專注“個人成長與財富自由、世界運作的邏輯與投資"。 文章更新暫停了幾天,但思考沒有停下。 星球這幾天還是持續(xù)加入同學(xué),我們是把AI量化當(dāng)成事業(yè)來做的,要停下來思考一下,下一步怎么走,如何給星友們提供最大化的價值。 AI量化投資的目的是什么? ——量化是手段,AI也是手段,讓我們可以更科學(xué),更安全,更輕松地獲得投資收益。 一是風(fēng)控,二是收益,安全性永遠是投資世界里第一位的。 投資無外乎買什么,何時買,買多少,何時賣,賣多少的問題,再精簡就是——“低買高賣”,但如何做好,非常不容易。 擇時之難,預(yù)測市場是不可能的事情。 那么,輪動其實是一個更優(yōu)的邏輯,多因子排序輪動,與市場共舞。 量化系統(tǒng)要收集盡可能多的數(shù)據(jù),有效數(shù)據(jù),另類數(shù)據(jù),從數(shù)據(jù)中提取出因子。然后測試因子的性能,把因子組合起來,對股票進行排序,定期重復(fù)上述過程,這就是一個典型的系統(tǒng)做的事情。我們可以通過監(jiān)控全市場數(shù)據(jù),這是量化的優(yōu)勢,我們可以借用前沿人工智能的非線性“統(tǒng)計”能力得出綜合排名。 一、數(shù)據(jù)及其預(yù)處理:是全A股市場的量價數(shù)據(jù)、財務(wù)數(shù)據(jù),資金面數(shù)據(jù)等。每日收盤后更新,后端數(shù)據(jù)庫是mongodb,夠簡單,然后“聚合到”hdf5庫中。做好基本面這樣的季度數(shù)據(jù)換成日頻數(shù)據(jù)等,數(shù)據(jù)清洗,預(yù)處理。 二、數(shù)據(jù)挖掘,比如“每日選股”。就是通過一些條件給合,去看歷史上這樣股票及其表現(xiàn),獲得直觀感覺。 ——這一步有“工程上”的難度,因子是需要現(xiàn)計算(無法都進行預(yù)計算,因為子邏輯上講無窮多)的,比如一些rank,需要全市場,比如3000支股票的歷史數(shù)據(jù)都加載上來,然后計算相應(yīng)的指標(biāo),而后對期進行排序。qlib為此做了自己的“數(shù)據(jù)存儲”格式,就是希望加速這個過程,但個人感覺太重了,不方便更新。 另外預(yù)計算完成之后,要進行緩存,但這個緩存何時進行更新,這個qlib也做了不少努力。比如aplha158, alpha360,這里計算量都非常大。在gui界面里,很難做到即時響應(yīng)的。 有一部分工作會放在服務(wù)器完成,涉及定時任務(wù),機器學(xué)習(xí)調(diào)度等。大計算量的,預(yù)處理的,需要定時計算的等等。需要更多人工干預(yù)的,輸入的,隱私的,擱到pc端。 三、因子分析,多空分析等 這一步是比較確定的,IC/IR,分組分析等。不過這里的計算量不大,因為是單個因子的計算。 四、上述組合起來(規(guī)則或AI量化模型),就可以做量化回測。 自動化的機器學(xué)習(xí)技術(shù)棧,從數(shù)據(jù)更新到特征工程到模型訓(xùn)練,參數(shù)保存等等,這一塊可以關(guān)注一下。 年化29.3%,大類資產(chǎn)ETF動量輪動,添加商品與貨幣ETF,實盤跟進中(代碼+數(shù)據(jù)下載) 年化41.4%的指數(shù)多因子輪動與年化26.5%大類資產(chǎn)動量輪動,準(zhǔn)備實盤跟蹤。(代碼下載)
|
|