べんきのにっき

いろいろと垂れ流します。

きたいちのメモ

前説

定義や、定義を変形して得られる式を区別なく出せるのは、文脈を共有できていることが前提にあるから。*1

ということで、ある勉強会の資料中に「defineされてない作用素があるから、この補足があったら私はサイコーに嬉しいのに!」と思った内容(と質疑)があったのでここに書く。

目的は、 E[X,A]の定義と条件付き期待値との関係を整理すること。

以下、1次元の確率変数Xについて書く。

 1_{A}は指示関数。  \in A なら1で、そうでなければ0。  1_{A}(x)とかで書いた方が親切っぽいけどめんどうなので省略。

1.期待値

まず、期待値は次であると定義する。

 \displaystyle E[ X ] :=  \int_{\Omega} X(\omega) dP(\omega)

ただし、確率・統計の文脈で話をするときに、(測度論的)確率論をひっぱり出すとオーバースペックになることがある。*2

ということで、 \displaystyle \mathbb{R}上の話に直して、さらに密度関数p(x)が存在する前提で書き直すと、見慣れた形になる。

 \displaystyle E[ X ] :=  \int_{- \infty}^{\infty} xp(x)dx

2.どこかの集合上の期待値

ここから集合が出てくるけど、何も書かなければ集合は全て病的でないものを考える。(数学的に扱いやすいもの、くらいの意味で)

適当な集合Aを考える。

わかりにくい場合は「Aは事象」と考えればOK。

ある集合Aの上で計算した期待値 \displaystyle  E[ X,A ]を、次のように定義する*3

(Aは、 \mathbb{R}上の区間だと考えよう。)

 \displaystyle  E[ X,A ] :=  \int_{A} xp(x)dx = \int_{-\infty}^{\infty} x 1_{A} p(x) dx =E[X 1_{A} ]

ここで、 \displaystyle  E[ X,A ]そのものは条件付き期待値ではない。*4

では、いくつかの集合 A_{i} \displaystyle  (-\infty,\infty) を分割するような状況を考えてみよう。

分割というのは、 A_{i}どうしは排反かつ、 \displaystyle  \bigcup_{i} A_{i}=(-\infty ,\infty) となる意味*5。例えば正と負に分けるとかをイメージすればOK。
このとき、和集合を \displaystyle \bigcup_{i} A_{i}の代わりに \displaystyle \sum_{i} A_{i}と書くことがある。ただし書籍によってまちまちだから、確認が必要

この状況下で \sum _{i} E[ X, A_{i} ]を確かめよう。

\displaystyle  \sum _{i} E[ X, A_{i} ] = \sum _{i} \int_{A_{i}} xp(x)dx = \int_{\sum_{i} A_{i}} xp(x)dx  = \int_{-\infty}^{\infty} xp(x)dx=E[X]

最初の等号は E[X,A]の定義から
二番目の等号は高校で習う積分の性質
三番目の等号は A_{i} (-\infty,\infty)の分割であること
最後の等号は期待値の定義から

というわけで、 \sum _{i} E[ X, A_{i} ]  E[ X ]の関係が整理できた。

3.条件付き期待値とある集合上における期待値

ある集合Aで限定して計算した期待値を考えることがある。

言葉が怪しくなったけど、ある集合A上で確率分布を考え直して、A上で期待値を計算する、という意味。先の内容とは確率分布を考え直している点が異なることに注意が必要。

これを条件付き期待値といい、次で定義する。

 \displaystyle  E[X|A] :=\int_{-\infty}^{\infty} x\frac{p(x)1_{A}}{P(A)}dx

で、条件付き期待値を式変形すると、2.の E[X,A]との関係が次のようになることがわかる。

 \displaystyle \int_{-\infty}^{\infty} x\frac{p(x)1_{A}}{P(A)}dx  =\frac{1}{P(A)} \int_{-\infty}^{\infty}xp(x)1_{A}dx =\frac{E[X,A]}{P(A)}

ここの、 \displaystyle  \frac{p(x)1_{A}}{P(A)} が、 x \in A上の確率分布になっていて、これを条件付き分布と呼ぶ*6。 (例えば、A上で積分すると1になっていることがわかるよね。)

両者の関係性

 \displaystyle E[ X, A ] =E[ X| A ]P(A) であることが分かったので、次の変形が成立することがわかった。

\displaystyle  E[X] = \sum _{i} E[ X, A_{i} ] =  \sum _{i} E[ X| A_{i} ]P(A_{i})

うん、すっきり。

ちなみに1変数で考えたけど、2変数以上で、集合Aの代わりにある変数を周辺化する形でも上記は考えられる。

 \displaystyle  E[ X,A ]の記法って、馴染みないよね。

*1:個人のブログ記事ならしらん顔できるのでメモ帳としては便利

*2:だから伊藤とか舟木とかを引用しようとして数学的な理解度の前提が違うから大変なことになる場合がある

*3:この記法は、『確率論』(舟木)のp.53で見つけた。他の測度論的確率論の本を数冊パラパラめくった感じ、多分みつからなかった

*4:ただし、条件付き期待値とは関係がある量

*5:これは正確な表現ではなく、全体である集合 (-\infty,\infty) A_{i}の族 \mathscr{A}を明示して、「 \mathscr{A} (-\infty,\infty)の分割」と表現する方が正しいはず

*6:数学的に厳密ではないけど