金融工程基础实战之贝叶斯股票投资决策
金融工程中會使用到很多經典公式,貝葉斯在金融工程中的應用非常廣泛。今天我們就從經典故事入手,使用較為通俗的語言,來和大家分享貝葉斯在金融工程中的基礎應用。
先從一個經典的故事講起。
一座別墅在過去的 20 年里一共發生過 2 次被盜,別墅的主人有一條狗,狗平均每周晚上叫 3 次,在盜賊入侵時狗叫的概率被估計為 0.9,問題是:在狗叫的時候發生入侵的概率是多少?
這個其實就是通過概率來判斷可能性。所謂概率其實就是描述不確定事件發生可能性的數值。假如你有1000萬,投資兩個項目,一個項目贏利的概率是80%,另一個項目贏利的概率是10%。你愿意投資哪個?正常的大多數人應該都會選擇贏利概率是80%的項目。
為了解答經典故事中“在狗叫的時候發生入侵的概率是多少?”這個問題,我們先從基礎的概率與概率分布講起。
我們認為,在隨機事件里,某一結果發生的次數占全部各種結果發生的次數的比率即為該結果發生的概率。
如果我們以A表示隨機事件中的某一個結果,那么A發生的概率為:
P(A)=A發生的次數/全部各種結果發生的次數
這個大家好理解吧,假如我們投硬幣,一共投了10次,硬幣正面出現了6次,就是A,那么P(A)=6/10=0.6
而概率根據不同的計算方法,又分為古典概率、主觀概率以及相對頻數概率。各種概率類型,涉及內容也比較多,大家有興趣的可以著重了解,這里就不細講了。
我們再說一下條件概率(Conditional Probability)。條件概率,就是指在另一個事件已經發生的情況下某一事件發生的概率。如果用公式表示給定B的情況下,A發生的條件概率為:
P(A|B)=P(AB)/P(B) 公式一
P(AB),是A和B同時發生的聯合概率。
那么,P(B|A)=P(BA)/P(A) 公式二
這個公式大家應該容易理解吧?就是把上面公式換了一下,變成了給定A的情況下,B發生的條件概率。
根據公式一有:P(AB)=P(A|B)*P(B) 公式三
而我們知道,P(AB)、P(BA),都表示的是A和B同時發生的聯合概率。
所以:P(AB)=P(BA) 公式四
把公式四代入到公式三中,得出:P(BA)= P(A|B)*P(B) 公式五。
那么,把公式五代入到公式二中有:
P(B|A)= P(A|B)*P(B)/ P(A) 公式六
公式六這個公式是什么呢?這個公式就是大名鼎鼎的貝葉斯公式。
公式中的元素代表的意思,文中已經講過了,那么現在我們開始分析文章中“在狗叫的時候發生入侵的概率是多少?”的問題。
在這個問題中,我們可以提煉出兩個事件,一個是“狗叫”,一個是“盜賊入侵”。
事件 |
故事中的信息點 |
概率 |
狗叫(A) |
狗平均每周晚上叫 3 次 |
P(A) = 3/7 |
盜賊入侵(B) |
20 年里一共發生過 2 次被盜 |
P(B) =2/(20*365) 即: 2/7300 |
那么,當狗叫,發生入侵,就可以表示為: P(盜賊入侵|狗叫) 即 P(B|A)。
而故事中,“盜賊入侵時狗叫的概率被估計為 0.9”,可以表示為: P(狗叫|盜賊入侵) 即 P(A|B)=0.9。
所以:
P(B|A)= 0.9*(2/7300)/(3/7)= 0.000575
我們得出,在狗叫的時候發生入侵的概率是0.000575。
基礎講完,我們進入實戰環節,也就是我們文章的主題,金融工作基礎實戰之使用貝葉斯進行股票投資決策。
既然實戰,就使用現實中真實的數據。
我們選取“祥源文化(股票代碼:600576)“來進行分析。
作者發布這篇文章的時間是星期天凌晨(2018年1月14日),來判斷周一(也就是2018年1月15日)。在周一(2018年1月15日)上證指數上漲的情況下,祥源文化這支股票上漲的概率。
表示為:P(祥源文化上漲|上證指數上漲)
我們先收集一下近半年內,祥源文化和上證指數在每周一的情況:
祥源文化
序號 |
時間 |
星期 |
是否上漲 |
1 |
2017/6/5 |
星期一 |
1 |
2 |
2017/6/12 |
星期一 |
0 |
3 |
2017/6/19 |
星期一 |
1 |
4 |
2017/6/26 |
星期一 |
1 |
5 |
2017/7/3 |
星期一 |
1 |
6 |
2017/7/10 |
星期一 |
0 |
7 |
2017/7/17 |
星期一 |
0 |
8 |
2017/7/24 |
星期一 |
0 |
9 |
2017/7/31 |
星期一 |
0 |
10 |
2017/8/7 |
星期一 |
1 |
11 |
2017/8/14 |
星期一 |
1 |
12 |
2017/8/21 |
星期一 |
1 |
13 |
2017/8/28 |
星期一 |
1 |
14 |
2017/9/4 |
星期一 |
0 |
15 |
2017/9/11 |
星期一 |
1 |
16 |
2017/9/18 |
星期一 |
1 |
17 |
2017/9/25 |
星期一 |
1 |
18 |
2017/10/9 |
星期一 |
1 |
19 |
2017/10/16 |
星期一 |
0 |
20 |
2017/10/23 |
星期一 |
0 |
21 |
2017/10/30 |
星期一 |
0 |
22 |
2017/11/6 |
星期一 |
1 |
23 |
2017/11/13 |
星期一 |
0 |
24 |
2017/11/20 |
星期一 |
0 |
25 |
2017/11/27 |
星期一 |
0 |
26 |
2017/12/4 |
星期一 |
0 |
27 |
2017/12/11 |
星期一 |
1 |
28 |
2017/12/18 |
星期一 |
0 |
29 |
2017/12/25 |
星期一 |
0 |
30 |
2018/1/8 |
星期一 |
0 |
14 |
上證指數
序號 |
時間 |
星期 |
是否上漲 |
1 |
2017/6/5 |
星期一 |
0 |
2 |
2017/6/12 |
星期一 |
0 |
3 |
2017/6/19 |
星期一 |
1 |
4 |
2017/6/26 |
星期一 |
1 |
5 |
2017/7/3 |
星期一 |
1 |
6 |
2017/7/10 |
星期一 |
0 |
7 |
2017/7/17 |
星期一 |
0 |
8 |
2017/7/24 |
星期一 |
1 |
9 |
2017/7/31 |
星期一 |
1 |
10 |
2017/8/7 |
星期一 |
1 |
11 |
2017/8/14 |
星期一 |
1 |
12 |
2017/8/21 |
星期一 |
1 |
13 |
2017/8/28 |
星期一 |
1 |
14 |
2017/9/4 |
星期一 |
1 |
15 |
2017/9/11 |
星期一 |
1 |
16 |
2017/9/18 |
星期一 |
1 |
17 |
2017/9/25 |
星期一 |
0 |
18 |
2017/10/9 |
星期一 |
1 |
19 |
2017/10/16 |
星期一 |
0 |
20 |
2017/10/23 |
星期一 |
1 |
21 |
2017/10/30 |
星期一 |
0 |
22 |
2017/11/6 |
星期一 |
1 |
23 |
2017/11/13 |
星期一 |
1 |
24 |
2017/11/20 |
星期一 |
1 |
25 |
2017/11/27 |
星期一 |
0 |
26 |
2017/12/4 |
星期一 |
0 |
27 |
2017/12/11 |
星期一 |
1 |
28 |
2017/12/18 |
星期一 |
1 |
29 |
2017/12/25 |
星期一 |
0 |
30 |
2018/1/8 |
星期一 |
1 |
20 |
由兩個表的數據,我們可以得出以下數據:
事件 |
概率 |
祥源文化上漲 (A) |
P(A) =14/30 即:7/15 |
上證指數上漲 (B) |
P(B) =20/30 即: 2/3 |
而P (上證指數上漲|祥源文化上漲) ,我們根據歷史數據,預估為0.9:即 P(B|A) =0.9
所以,我們得出:
P(A|B)= 0.9*(7/15)/(2/3)= 0.63
所以結論就是,在周一(2018年1月15日)上證指數上漲的情況下,祥源文化這支股票上漲的概率是0.63。也就是說,周一(2018年1月15日)只要上證指數是上漲的,祥源文化大可能也是會上漲的。
大家發現沒有,概率最大的作用是將商業和日常生活中遇到的各種不確定性量化了。
其實,本文這個模型非常非常基礎,分享出來,也就是給大家一個參考。文中還有很多不足之處,例如,數據樣本量太少,精度上會存在瑕疵。另外,某支股票的趨勢,會受多種因素影響,而文中的方法,太過單一?,F實中的投資模型,要遠遠比文章中描述的要復雜的多的多,維度相對更為全面,權重指標描述更為準確。同時,用到的不僅僅是貝葉斯這一種分析方法,往往還有蒙特卡洛模擬、時間序列、回歸、離散概率分布【如,貝努力(Bernoulli Distribution )、二項(Binomial Distribution)、超幾何(Hyper-geometric Distribution)、普哇松(Poisson Distribution)】、連續概率分布【如,均勻分布(Uniform Distribution)、正態分布(Normal Distribution)】等。現實的中金融工程,往往是一個非常復雜的組合模型。
不積跬步無以至千里。而本文的價值在于給大家一個啟示。如果我們平時養成習慣,把生活中的一些數據記錄下來,或許會對你某些時候的決策提供一定的幫助。如果我們在日常股票投資過程中,對數據加以利用,加上每次上漲幅度這個維度,來判斷某種操作習慣的贏利概率,再不斷進行修正,相信大家堅持積累下來,一定是有所收獲的。
今天就到這里,感謝大家,希望本文能給大家帶來幫助。