投資有道 量化分析 樣本 數據 歷史 交易 頻率 恒生指數 國企指數

做量化分析不一定要增交易頻率 輕易增加樣本數據竅門|投資有道

投資

廣告

投資有道】做量化分析時,樣本數據量非常重要,對統計有效性影響極大,因此上期本欄提出了兩個解決方案:一,向歷史延伸,以得取更多數據;二,增加交易頻率,以更精細時間間段的數據作分析。兩者皆可提高統計有效性,可惜都面臨不少潛在問題。

撰文:蔡嘉民|圖片:unsplash、新傳媒資料室

向歷史延伸,有機會令策略回報大打折扣,但表現大幅變差,未必一定是因爲發生過度優化(Over-optimization)的情況,亦有可能是因為在太過久遠的日子內,市場本質有所不同。

因此,同一策略在10年前與現時的表現截然不同;此時向歷史延長測試範圍,並非屬於一個可行方案。

增加交易頻率方面,即使先撇除極端的高頻交易,也非每個投機者投資者能輕易達到。

實際執行上,若人手落盤,耗時相當;而回報上,增加交易頻率變相增加交易成本。

千萬別小看交易成本,如佣金、印花稅、買賣差價、滑價等,都有能力令一個非常賺錢的策略展示一條一直向下瀉的資產曲線(Equity curve)。

橫向延伸增交易產品

此時便出現一個矛盾非常的情況,表面看像是沒其他方法增加樣本數據;其實,除了在時間線上花功夫外,我們可考慮以另一角度出發:橫向發展,增加交易的產品。

回溯測試無非是想以足夠的數據,去證明一個策略是否有效;而增加同類型產品的數目,也變相能提高樣本數據量,以不同產品一起證明策略有效與否。

測試策略時,分析師皆相信一個可行策略不應只於某產品上獲利,策略如果合理可行,亦應在其他類近產品上賺錢,分析師稱之為「Universality」。

例如一個在銀行股A可行的策略,在銀行股B身上亦應可獲利;又例如一個在恒生指數可行的策略,亦應在國企指數可行。

因此,增加回測中的同類產品數目是一個不錯選擇,因為極力向歷史延伸,可能最多也只是多拿幾年數據。

充其量只增加樣本數據1倍左右;但增加產品數目就能輕易以數倍幅度增加樣本數據。

避免市場本質改變問題

相信投資者有機會留意到,不少大型量化基金經常使用因子模型(Factor model)應用於股票上。

這樣做當然一來可以減低執行時的市場沖擊(Market impact),享受更深的市場深度(Market depth),以便放大策略;二來股票市場產品數量充足,毫無困難地便能為測試帶來大量樣本數據。

舉例說,五年的日數據,一隻股票樣本數據約為1,250個,若有10隻股票一起回測,便有12,500個資料點。

所以,若在回測時懷疑自己的數據量不足,可以考慮橫向推衍,例如做指數的,可把策略應用到不同地方的指數;例如做商品的,亦能把測試延展到其他高相關性的商品。

這個方法一來避免了市場本質有變的問題,而在毋須改變交易頻率下,自動增加了交易次數。

編按:作者蔡嘉民為香港程式交易研究中心(HKPTRC) 聯合創辦人,擅長發掘金融市場數據,尋找有利的交易機會。

免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。