ecorange

ecorange

00后经济学在读博士生,分享笔记,偶尔闲话

條件期望函數

基本概念#

假設連續型隨機變量 $(X,Y)$ 的聯合概率密度函數(joint probability density function)為 $p (x,y)$

$X$ 的邊緣概率密度函數(marginal probability density function)為

pX(x)=p(x,y)dyp_{X}(x)=\int_{-\infty}^{\infty}p(x,y)dy

$X$ 的期望(expectation)為

E(X)xxpX(x)dxE(X)\equiv \int_{x}x\cdot p_X(x)dx

$Y$ 關於 $X$ 的條件概率密度函數(conditional probability density function)為

pYX(x,y)=p(x,y)pX(x,y)p_{Y\mid X}(x,y)=\frac{p(x,y)}{p_{X}(x,y)}

貝葉斯定理(Bayes' theorem)

p(x,y)=pYX(x,y)pX(x)=pXY(x,y)pY(y)p(x,y)=p_{{Y\mid X}}(x,y)\cdot p_{X}(x)=p_{X\mid Y}(x,y)\cdot p_{Y}(y)

$Y$ 關於 $X$ 的條件期望(conditional expectation)為

E[YX=x]=yypYX(x,y)dyE[Y\mid X=x]=\int_{y}y\cdot p_{Y\mid X}(x,y)dy

對於任意一個實數 $x$ 都僅存在一個實數 $E [Y\mid X=x]$ 與之對應,因此也可以稱之為條件期望函數(conditional expectation function);若寫為 $E [Y\mid X]$ 則表示隨機變量到隨機變量的映射。

迭代期望法則#

定理

E[E(YX)]=E[Y]E[E(Y\mid X)]=E[Y]

證明

E[E(YX)]=xE(YX)pX(x) dx=xyypYX(x,y)dy pX(x) dx=xyypXY(x,y)pY(y) dy dx=xpXY(x,y) dxyypY(y)dy=yypY(y)dy=E[Y]\begin{align*} E[E(Y\mid X)]&=\int_{x}E(Y\mid X)p_{X}(x)\ dx\\ &=\int_{x}\int_{y}y\cdot p_{Y\mid X}(x,y)dy\ p_{X}(x)\ dx\\ &=\int_{x}\int_{y}y\cdot p_{X\mid Y}(x,y)p_{Y}(y)\ dy\ dx\\ &=\int_{x}p_{X\mid Y}(x,y)\ dx\int_{y}y\cdot p_{Y}(y)dy\\ &=\int_{y}y\cdot p_{Y}(y)dy\\ &=E[Y] \end{align*}

最佳預測器#

統計學的一個基本問題是如何找到一個關於 $X$ 的函數來預測 $Y$ ,下面證明條件期望函數能夠使得預測誤差平方的期望最小。
定理
令 $g (X)$ 為關於 $X$ 的任意函數,則

E[YX]=argmingE[(Yg(X))2]E[Y|X]=\mathop{\arg\min}\limits_g E[(Y-g(X))^2]

證明

E[(Yg(X))2]=E[(YE[YX]+E[YX]g(X))2]=E[(YE[YX])2]+E[(E[YX]g(X))2]++2E[(YE[YX])(E[YX]g(X))]\begin{align*} E[(Y-g(X))^2] &=E[(Y-E[Y\mid X]+E[Y\mid X]-g(X))^2] \\ &=E[(Y-E[Y\mid X])^2]+E[(E[Y\mid X]-g(X))^2]+ \\ &+2E[(Y-E[Y\mid X])(E[Y\mid X]-g(X))] \end{align*}

第一項為

E[(YE[YX])2]=E{(YE[YX])2X}=E{Var[YX]}0E[(Y-E[Y\mid X])^2]=E\{(Y-E[Y\mid X])^2|X\}=E\{Var[Y\mid X]\}\ge0

最後一項為

2E[(YE[YX])(E[YX]g(X))]=2E[E{(YE[YX])(E[YX]g(X))X}]=2E[(E[YX]g(X))E{YE[YX]X}]=2E[(E[YX]g(X)){E[YX]E[YX]}]=0\begin{align*} &2E[(Y-E[Y\mid X])(E[Y\mid X]-g(X))] \\ =&2E[E\{(Y-E[Y\mid X])(E[Y\mid X]-g(X))|X\}] \\ =&2E[(E[Y\mid X]-g(X))E\{Y-E[Y\mid X]|X\}] \\ =&2E[(E[Y\mid X]-g(X))\{E[Y\mid X]-E[Y\mid X]\}] \\ =&0 \end{align*}

因此,取 $g (X)=E [Y\mid X]$ 使得原式取得最小值。

雖然理論上 $E [Y\mid X]$ 就能給出對 $Y$ 的最優預測,但 $E [Y\mid X]$ 的具體函數形式實際上是未知的,因此在實踐中有時需要對條件期望函數的形式作出武斷的假設。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。