不能盡知資料之害者,不能得資料之利(少數派投資)

語言: CN / TW / HK

語言描述是很主觀的,只有資料才客觀,這是多數人的共識。

該層思維批判瞭如下情景:無視資料,只憑主觀感覺下判斷。此類問題,只要查一下資料就能明辨是非。

上述共識適用於對最淺層快思維直覺的否定,但還存在更慢的思維:

現實中,資料往往披著婆娑的外衣,有著更多的迂迴和扭曲,並不是有了“資料支撐”就可以妄下結論,也不是有了資料就可以迷之自信、一路坦途。

本文借用《孫子兵法》的表述: 不能盡知資料之害者,不能得資料之利。

注:原文為“不能盡知用兵之害者,不能得用兵之利”

我們先看一組案例:

例1: 一則新聞:1924級耶魯畢業生平均年收入為25111美元。(1949年統計)

例2: 某感冒藥廣告:實驗室資料顯示,僅半盎司該藥劑量在11秒鐘內就殺死了試管中31108個細菌。

例3: 2018年,某知名財經媒體發文《在自己先祖的土地上流浪》,其中引用規模以上民企資料,將調出規模以上口徑的民企視為已死掉。

例4 :某牙膏廣告:“使用者反映使用Doakes牌牙膏將使蛀牙減少23%”,該結論出自一家信譽良好的“獨立實驗室”,且通過了註冊會計師的證實。

例5: 智力測試中,小明101分,小亮99分,小明是否比小亮更聰明?

例6: 某香菸品牌宣傳:一家國家級雜誌主持的實驗證明該香菸在尼古丁含量方面“排名最後”,因此對人體傷害最小。

例7 :觀察資料:公雞打鳴時間在天亮之前,得出結論:雞叫是天亮的原因。

例8: 亞里士多德統計了羽毛和石頭的落地時間,前者用時更長,由此得出結論:重的物體比輕的物體落地更快。

例9: 觀察某股票價格變化,發現其一旦上漲會持續一段時間、下跌也有持續性,體現出某種股市中存在的可重複模式。

例10: 一個50年的回測,無論是1968-1998年的樣本內測試,還是1989-2015年的樣本外測試收益都非常出色,且與其他主流因子,如市值、估值、動量等相關係數很低,年換手率僅10%。

本文圍繞上述10個案例展開,我們不去探討如何改進統計方法、多數情況下並不具備條件可以再統計一遍,而是 從資料接受者的視角出發,思考如何減少有偏資料的誤導,避免掉入“似是而非”的陷阱,從而看到資料背後更多的可能:

例1:耶魯畢業生收入(資料的隱含假設)

1924級(此時已畢業25年)25111美元的人均收入,即便是真實的,也只是代表了“能夠聯絡上的,並願意站出來說出收入的一個特殊群體”,還要保證聯絡人能說真話。

通過 還原隱含假設 ,我們看到了資料本身的“代表性”:這樣的假設下的統計物件顯然與我們內心預設的不是一回事。

想一想這些資料會是怎麼統計的?有哪些隱含的假設?所反映的物件真的是我們普遍共識的樣本嗎?由此你會避免接受很多似是而非的資料。

《統計數字會撒謊》進一步提醒我們:

“即使你找不到任何破壞性的誤差來源,但只要有產生誤差的可能性,你就有必要對結果保留一定的懷疑。”

例2、3:感冒藥廣告與規模以上民企(偷換概念)

消費者心中的有效藥物是能治好感冒,而藥商宣傳的卻是能殺死試管中的細菌。

問題在於,到底是什麼引起了感冒?試管中的細菌和感冒有沒有關係?是不是同一種細菌?還是病毒?另外,試管中有效的、稀釋後在人體內是否還有作用?對此,正在流鼻涕的患者們不會深究。

例3中,規模以上企業的定義是年主營業務收入為2000萬及以上企業,當年不再滿足的企業很可能是收入下降到了2000萬以下,而不是倒閉死掉了。

正如《統計數字會撒謊》所言:

如果你想證明某事,卻發現沒有能力辦到,那麼就試著解釋其他相關事情,並假裝它們是一回事。

反觀股票市場研究,目前主流的“反應不足”、“反應過度”的代理變數設定類似於此,從 事前 來看,原本就沒有“反映適中”的合理定義,何來“不足”與“過度”?混淆事前與事後,強行用市值、換手率等指標來代理,打著旗號卻根本沒有解決問題本身。

例4:牙膏廣告(選擇性小樣本資料拷問)

蛀牙減少23%的資料,即便有權威機構背書,也不可信。

關鍵在於資料的獲取過程:多克斯公司 讓規模不大 的一組人連續記錄6個月的蛀牙數,接著使用多克斯牙膏。此後必然會出現如下三種結果中的一種:

①蛀牙增多;②蛀牙減少;③蛀牙不變

如果結果是①或③,多克斯公司會將之藏起、重新實驗,由於機遇的作用, 遲早有一組測試者將證明有很好的效果 ,“足以好到作為標題直至引發一場廣告戰”。

這是一個典型的故意拷問不充分小樣本以誤導消費者的案例。

現實中,別人展示給我們的資料,背後都有各種利益訴求,或多或少存在類似的問題,要關注常識、不應簡單相信。

例5、6:智力測試與香菸廣告(過分關注不必要誤差)

智力測試只是一種測量工具,測量人們處理事先準備好的抽象問題的能力,但對這些能力我們甚至無法給出確切定義。

同時,該測試只是智力水平的一個抽樣,具有統計誤差, 正常的智商並不是一個數值而是一個範圍,處於這個範圍、相差不大的比較則毫無意義

至於香菸公司所引用的雜誌資料,則是《讀者文摘》某編輯發起的一項實驗,其結論是“所有品牌的香菸是一樣的,無論你吸的是什麼牌子的香菸,不會有任何差異。”

但問題在於, 在一長串具有相同有害物質的品牌名單上,總會有一個排在最後 ,就是這家香菸品牌,但它在宣傳時對於危害差異並不大的關鍵資訊卻省略掉了。

股票市場上,對歷史資料的回測統計更應該警惕該問題。 歷史的股價中可能有必然的東西,但也有更大程度的偶然成分, 正如《機器學習發展》一書所言“已有的演繹路徑只是隨機過程的可能結果之一,且未必是最有可能的未來”。

在此基礎上 反覆拷問出的回測更優很可能只是誤差而已 ,不能簡單作為評判標準,更不足以“恃”,由此帶來的自以為的可把握感與迷之自信反而會導致預留的安全墊不足。

相比之下, 各維度統計所反映的共性成分反而更有價值, 適度抽象地理解資料結論會有更好的適用性。

例7:日出與公雞打鳴(因先後發生而因果倒置)

日出與雞叫有明顯的相關性,該案有意思的一點在於,雞叫一般發生在日出前,先發生的一定就是原因嗎?中國古人就有“雄雞一唱天下白”的詩句。

現代人瞭解更多的科學知識,從更高的框架下俯視,自然容易明辨是非。

但是,諸如此類有明確先後的相關現象,背後的因果解釋真的就那麼篤定嗎?有沒有其他的可能?該案至少是一個警示。

例8:亞里士多德(資料的真正用途是驗證)

亞里士多德基於石頭比羽毛更快落地的資料,得出了重的物體更快落地的結論,是一個典型的 “有資料支撐”的誤判。

並不是基於資料能夠歸納出的規律就是對的,資料的真正用途是:驗證。

基於亞里士多德的解釋,伽利略做了一個簡單推論:既然重的更快落地,那麼10斤鐵球應該比5斤鐵球更快落地。

資料驗證(證偽)了該推論:兩個球同時落地,從而徹底推翻了亞里士多德的理論。

該案指出了大多數人使用資料的誤區:資料導向,邏輯附和。

即先有統計結果,再倒過來想解釋、拼湊理論,是當前經管類學術文獻的通病,不要低估人自圓其說的能力,約束自身非理性就是行為金融學的應用。

恰當的姿勢應當是:邏輯導向,資料驗證。

觀察到現象,先有理論的推導、得出合情假設,再用資料去驗證,如此才可能是有意義的研究。

關鍵在於邏輯的推演,並提出可以用資料驗證的預測(假說)。資料是死的,它任人擺佈、沒有可推演性、不具有證明能力,但邏輯不是這樣, 資料的價值只在於對嚴密邏輯的驗證。

例9:看似規律性的股價圖(隨機資料也會給人規律性的錯覺)

圖1是《漫步華爾街》的一張圖,它顯示的是一隻初始價格為50美元,隨後每天的收盤價由拋硬幣決定:如果是正面則漲0.5個百分點,反之則下跌0.5個百分點。

換言之,從概率視角看,這隻假想股票的走勢圖由隨機的拋硬幣決定,它本身也是隨機、無規律可言的。

多數人眼中的“規律性”可能只是“統計幻覺”的結果,這是對人性弱點的揭示。

對歷史的覆盤,尤其是 低頻 的歷史事件,我們要警惕“頻率”倒推“概率”。

例10:樣本內外均有效的策略(多數人低估了歷史回測產生偶然高收益的可能)

僅僅基於圖2中的回測資料,不少人或許已經迫不及待想要投資了。

事實上,該策略是資料探勘的結果,就是簡單買入美股程式碼前三個字母中帶有S的股票,並做空前三個字母含有U的股票,這是機器學習方法,在成千上萬個策略中選擇出來的表現最好的策略。

瞭解了這些大家可能不再願意接受它,這只是因為其原理已經荒誕到了足夠的程度,至於其他能扯上一點所謂合理解釋的反覆拷問結果,就本質而言,又有什麼區別?“似是而非”的危害遠大於明顯荒誕,因為前者還有“似是”的成分,更具迷惑性,結果卻是一樣的。

多數人其實低估了回測中產生偶然高收益的可能性,事後迎合著給出合理解釋,並不能降低預判未來的不確定性。

綜上所述,我們通過10個案例介紹了常見的資料誤用,並提出了“ 邏輯導向,資料驗證 ”的研究思路。需要注意的是,指出資料應用的誤區,並不是要否定資料本身,而是站在資料接受者的角度,探討如何更加客觀地用好可得的資料。

資料不會說話,資料不可論證,資料是死的,但人是活的。

往期文章回顧:

少數派投資招聘應屆畢業生

下一個熱點會是什麼呢?

理性投資第一步:認識你自己

尋找灰天鵝

外資流入終現曙光,市場信心提升迅速

最火當下科創板

市場重回3200點,基民投資的正確姿勢是什麼?