量化分析進階教學!樣本數據的重要性|蔡嘉民

量化分析進階教學!樣本數據的重要性|蔡嘉民

量化分析、程式交易愈來愈普及,兩者都是建基於統計學,透過大量歷史數據,找出市場規律,並建構成一個系統化的策略;不過很多量化分析炒家,都忽略了樣本數據(Sample size)的重要性。

撰文:蔡嘉民 | 圖片:unsplash

樣本數據愈多愈好

統計學中,非常注重的一點就是樣本數據的量。樣本數據愈多,該統計愈有效。 舉例說,有些炒家會作季節性統計,例如計算恒生指數於每年10月下跌的機率有多高,畢竟坊間普遍認為,10月是一個常有股災的月份。 不過,若分別以3年數據、10年數據或30年數據作測試,結果將截然不同。 有些統計學家會提出一個概念— 「n至少也應該大於30」。 但金融市場中,並沒規範說樣本數據多少才算有效,沒一個既定標準,因為30年前的市況與現時市場環境實是天壤之別。

不過,可以肯定的是,樣本數據愈多愈好。 提高取樣頻率 若想增加樣本數據,除了像上述延長歷史數據的方法外,也可以增加數據精度,例如由每月數據轉成使用每日數據,甚至加密至每小時、每分鐘,甚至每秒。 這個方法也能有效增加樣本數據,不過一個偏高頻交易策略,也會加添交易成本,這一點炒家們必須小心衡量,以找出平衡點。

看市盈率的撈底策略

其次,可透過增加測試的產品以提升樣本數據。 例如基本分析中,不少人愛看市盈率作估值參考,這一類廣泛應用性的策略,可以用於不同產品上測試。 若這個看市盈率的撈底策略真的有效,理論上不同股票也應顯示相近的成效。 因此,分析者可以嘗試把此策略擴展應用於不同股票作測試。 假如發現某策略只能於個別股票上獲利,便不能確認該策略能有效獲利。一個好策略,該顯示出統一應用性,即在相近產品也應有類近的表現。

延伸閱讀:【阿里巴巴香港】阿里巴巴首日上市股價高見189.5元!上市後新部署一文睇晒

多個策略合組指標

很多大型基金很喜歡運用這一點作量化交易,即把一個策略應用到不同產品上。 舉個例子,如技術分析中的RSI;若RSI數值極低,接近10或20左右水平,暗示股價嚴重超賣,理應撈底。 若只把此策略應用於單隻股票上,未必能保證盈利;因為投機炒賣總有機會遇上運氣較差的情況。 但若把此策略同時使用於50隻、甚至100隻股票上,整個組合虧損的機會便大大降低。 所以,即使一個策略有效,也要有足夠空間或足夠樣本,讓其發揮。

對於一般投資者來說,把單一策略同時用於大量股票上可能會有點吃力,畢竟始終需要一定的成本。那是否沒有其他方法,增加統計的顯著性嗎? 非也,投資者亦可考慮把多個策略應用於一個標的物上。例如投機者可以同時參考十個量化訊號或策略,繼而綜合一個分數或自訂指標,決定該看好或看淡該市場。 這個做法,一來可以減低單一策略不幸虧損的情況;二來因為不同策略的虧損時間不盡相同,因此能形成一個穩定的回報,令組合表現大大提升。

延伸閱讀:港股兩手準備 逢高減倉 靠近26,000點反手低吸|溫鋼城

量化分析進階教學!樣本數據的重要性|蔡嘉民

免責聲明:本專頁刊載的所有投資分析技巧,只可作參考用途。市場瞬息萬變,讀者在作出投資決定前理應審慎,並主動掌握市場最新狀況。若不幸招致任何損失,概與本刊及相關作者無關。而本集團旗下網站或社交平台的網誌內容及觀點,僅屬筆者個人意見,與新傳媒立場無關。本集團旗下網站對因上述人士張貼之資訊內容所帶來之損失或損害概不負責。