到目前為止,我們討論的機率都是「某件事發生」的機率。但現實生活中,我們經常需要處理的問題是:一個隨機過程會產生什麼樣的「數值」結果?這個數值結果的平均表現會是多少?這就是隨機變數與期望值要處理的問題。
想像擲兩枚硬幣,我們關心的不再是「都是正面」這個事件,而是「有幾個正面」。正面數可以是 0、1、2,分別對應「HH」、「HT/TH」、「TT」。
這個「正面數」就是一個隨機變數——它是一個函數,將每一個樣本空間中的結果映射到一個實數值。根據可以取到的值,隨機變數分為離散型(有限或可數多個值)和連續型(區間內任意實數)。
對於離散隨機變數 X,PMF 告訴我們 X 取每個可能值的機率:P(X = x)。例如上例中,P(X=0) = 1/4、P(X=1) = 1/2、P(X=2) = 1/4。注意所有可能值的機率之和必為 1。
期望值 E(X) 是隨機變數所有可能值的加權平均:
期望值不是「最可能發生的值」,而是長期重複實驗的平均結果。例如輪盤遊戲,每次結果是不可預測的,但玩很多次之後,平均每次的結果會趨近期望值。
期望值有幾個非常重要的代數性質:
這些性質在計算複雜隨機變數的期望值時極為有用。
期望值描述的是「平均結果」,但同樣的期望值可以來自截然不同的分布。例如一個收入期望值為 50 萬的職業,可能是每個人都恰好賺 50 萬,也可能是一半人賺 100 萬一半人破產。變異數就是用來衡量這種「分散程度」的指標:
第二個等號有時更容易計算,因為它只需要計算 X² 的期望值和 X 期望值的平方。
二項隨機變數 B(n,p) 代表 n 次獨立試驗中成功的次數,其期望值和變異數有簡潔的公式:
這兩個公式的推導需要用到期望值的線性性質和獨立性,假設有興趣可以自行推導看看。
隨機變數、期望值和變異數是統計學的三大基石。掌握這三個概念之後,你就有了從「描述單一事件機率」升級到「分析隨機系統整體表現」的能力。