大數法則


大數法則指的是當樣本數量越大時,樣本的平均數會越接近期望值,那什麼又是期望值呢?期望值是每次試驗可能出現的結果乘上這個結果出現的機率的總和,看起來好像有點抽象,所以我們以實際的例子來進一步瞭解期望值。


以六面的骰子為例,如果這是一個公正的骰子,每個面會有1/6的機率被擲到,可能出現的結果及每個結果出現的機率如下:




擲一個公正的六面骰子的期望值計算如下:




也就是說,如果我們重複擲一個骰子很多次,每一面擲到的機率就會越接近1/6,擲出的點數的平均值就會越接近3.5。


但是當我們實際拿一個骰子來丟幾次,會發現六個面各自出現的機率不會剛好等於1/6,有時可能還會跟相差很多!例如我們模擬擲一個骰子十次,擲出來的點數分別是5、3、5、2、4、4、4、1、1、2,每一面擲到的機率計算如下:




擲出的點數的平均值為:




從上面的結果可發現,每一面擲到的機率分別是20%、20%、10%、30%、20%、0%,與理論值1/6(16.67%)有不小的差距,擲出的點數平均值3.1也和期望值3.5有落差,是因為模擬的結果有問題嗎?還是這是一粒不公正的骰子?



其實是因為擲骰子的次數還不夠多,需要模擬擲更多次才能達到大數法則的結果,但是要擲多少次才夠呢?


為了測試擲骰子幾次才算是「大數」,我們分別模擬擲骰子10、100、1000、10000、100000次,然後比較在不同的次數中,每一面被擲到的機率及擲出點數的平均值。



圖一 擲到每一面的次數分布



圖二 擲到每一面的機率分布(紅色虛線為擲到每一面的機率的理論值,即1/6 或16.67%)


從圖一可以看到,每一面被擲出的次數分布隨著重複擲骰子次數的增加而越來越平均,圖二顯示每一面被擲到的機率也隨著次數增加而越接近理論值。



圖三 不同重複次數每一面被擲到機率的平均值分布



圖四 不同重複次數所有擲出點數的平均值分布


圖三進一步比較在不同的擲骰子次數中,每一面被擲到的機率分布,不但平均值越來越接近1/6,每一面被擲到的機率分布發散的程度也越來越小。對應到圖四可發現,隨著每一面擲到機率越往理論值集中,擲出點數的平均值也會往期望值3.5收斂。


雖然沒有明確定義需要多大的數量才能達到大數法則的結果,而且數量可能也會隨著應用的情境而有所不同,但是從擲骰子的模擬中可觀察到,模擬的結果會隨著模擬次數增加而明顯越往期望值收斂。根據我們的模擬,需要擲骰子一萬次以上才會接近大數法則的結果!


發佈留言