隨機變數與期望值：從機率走向統計的橋樑

統計 · 閱讀時間約 10 分鐘

到目前為止，我們討論的機率都是「某件事發生」的機率。但現實生活中，我們經常需要處理的問題是：一個隨機過程會產生什麼樣的「數值」結果？這個數值結果的平均表現會是多少？這就是隨機變數與期望值要處理的問題。

一、隨機變數的引入

想像擲兩枚硬幣，我們關心的不再是「都是正面」這個事件，而是「有幾個正面」。正面數可以是 0、1、2，分別對應「HH」、「HT/TH」、「TT」。

這個「正面數」就是一個隨機變數——它是一個函數，將每一個樣本空間中的結果映射到一個實數值。根據可以取到的值，隨機變數分為離散型（有限或可數多個值）和連續型（區間內任意實數）。

對於離散隨機變數 X，PMF 告訴我們 X 取每個可能值的機率：P(X = x)。例如上例中，P(X=0) = 1/4、P(X=1) = 1/2、P(X=2) = 1/4。注意所有可能值的機率之和必為 1。

期望值 E(X) 是隨機變數所有可能值的加權平均：

E(X) = Σ x_i × P(X = x_i)

期望值不是「最可能發生的值」，而是長期重複實驗的平均結果。例如輪盤遊戲，每次結果是不可預測的，但玩很多次之後，平均每次的結果會趨近期望值。

期望值有幾個非常重要的代數性質：

這些性質在計算複雜隨機變數的期望值時極為有用。

期望值描述的是「平均結果」，但同樣的期望值可以來自截然不同的分布。例如一個收入期望值為 50 萬的職業，可能是每個人都恰好賺 50 萬，也可能是一半人賺 100 萬一半人破產。變異數就是用來衡量這種「分散程度」的指標：

Var(X) = E[(X − E(X))²] = E(X²) − [E(X)]²

第二個等號有時更容易計算，因為它只需要計算 X² 的期望值和 X 期望值的平方。

二項隨機變數 B(n,p) 代表 n 次獨立試驗中成功的次數，其期望值和變異數有簡潔的公式：

E(B) = np　　Var(B) = np(1 − p)

這兩個公式的推導需要用到期望值的線性性質和獨立性，假設有興趣可以自行推導看看。

隨機變數、期望值和變異數是統計學的三大基石。掌握這三個概念之後，你就有了從「描述單一事件機率」升級到「分析隨機系統整體表現」的能力。