べんきのにっき

いろいろと垂れ流します。

層で標準化した平均

概要

周辺構造モデルで出てくる逆確率の最も簡単なパターンの計算練習

今回は特にcounter factualな話は出てこない。確率と期待値の機械的な計算に慣れる。

treatmentをA、共変量をLと読めばこれが何に通じるかがイメージできそう。 I(\cdot)は指示関数。

基本的に p(\cdot)は十分性質の良いものとする。(counter factual関係ないとは言ったけど、positivityが微妙に絡んでいる気はする。)

ゴール

多分次を導けること

 \displaystyle \tag{1.1} E \left( \frac{I_{A=a}Y}{p(A|L)} \right)=E _{L} \left\{ E_{Y|(A=a,L)} \left( Y| A=a,L \right) \right\}

変形

積分についている{S(\cdot)}はその台を示す。

(1.1)の左辺を積分に直す。

 \displaystyle \tag{1.2} E \left( \frac{I_{A=a}Y}{p(A|L)} \right)=\int _{L \in S(L)}dL \int _{A \in S(A)}dA \int _{Y \in S(Y)}    \frac{I_{A=a}Y}{p(A|L)}p(Y,A,L) dY

ここで、同時分布は次のように修正できることを思い出す。

 p(A|L)ipwとして扱われる量になっている。

 \displaystyle p(Y,A,L) = p(Y|A,L)p(A|L)p(L)

すると、(1.2)の右辺は

 \displaystyle(1.2)=\int _{L \in S(L)}dL \int _{A \in S(A)}dA \int _{Y \in S(Y)}    \frac{I_{A=a}Y}{p(A|L)}p(Y|A,L)p(A|L)p(L)dY

で、p(A|L)が消えるから↓のようになって

 \displaystyle=\int _{L \in S(L)}dL \int _{A \in S(A)}dA \int _{Y \in S(Y)}   I_{A=a}Yp(Y|A,L)p(L)dY

p(L)とIはいったん考えないように追い出して

 \displaystyle=\int _{L \in S(L)}p(L)dL \int _{A \in S(A)} I_{A=a}dA \underbrace{\int _{Y \in S(Y)}   Yp(Y|A,L)dY}_{E_{Y|(A,L)}(Y|A,L)}

条件付き期待値E_{Y|(A,L)}(Y|A,L)が出てきた。

E_{Y|(A,L)}の下付きの部分は、何の上で計算しているから自明じゃないから残しておく。

ということで、(1.2)はここまで計算できた

 \displaystyle \tag{1.3} E \left( \frac{I_{A=a}Y}{p(A|L)} \right)=\int _{L \in S(L)}p(L)dL \int _{A \in S(A)} I_{A=a}E_{Y|(A,L)}(Y|A,L)dA

でAに関する積分だけど、 \int_{A}f=\int_{S(A)}I_{A}f的な計算を多分することになって、A=aの上でだけ残るから、次のように変形して良いはず。

 \displaystyle (1.3)=\int _{L \in S(L)} E_{Y|(A=a,L)}(Y|A=a,L)p(L)dL

あとは普通に期待値として計算できるから

 \displaystyle =E_{L} \left\{ E_{Y|(A=a,L)}(Y|A=a,L) \right\}

参考

Naimi, A. I., Cole, S. R., & Kennedy, E. H. (2017). An introduction to g methods. International journal of epidemiology, 46(2), 756–762. https://doi.org/10.1093/ije/dyw323 オンラインで読める

これのsupplementaryで周辺構造モデルのIPWを導いている。

第二部

で、結局何に使えるの?みたいなやつ
(ここからはまだうまく消化できていない)

supplementaryの derivation of g-formulaの行間を埋める作業

time varyingなやつで、とりあえず2点のtreatmentがあるとする。exchangeabilityとかconsistencyは都合のいい感じに成立していると仮定する。

また、law of iterative expectationは勝手に用いる

ゴール

 E(Y^{a_{0},a_{1}})がなんかいい感じに変形できて、IPWの計算が役に立ちそうな雰囲気を出していることを確認する。

計算

まず、繰り返し期待値の性質から次のように変形できる

 \tag{2.1} E(Y^{a_{0},a_{1}})= E(\underbrace{E(Y^{a_{0},a_{1}}|A_{0})}_{\because =Y^{a_{0},a_{1}}})

次に、繰り返し期待値の部分が交換可能であることを利用し、 A_{0}に具体的な割り当てを考えてもよい

 \tag{2.2}  (2.1)=E(E(Y^{a_{0},a_{1}}|A_{0}))=E(\underbrace{E(Y^{a_{0},a_{1}}|A_{0}=a_{0})}_{\because exchangeability})

さらに、繰り返し期待値の性質から、Yをさらに条件付き期待値にする

 \tag{2.3}  (2.2)=E(E(Y^{a_{0},a_{1}}|A_{0}=a_{0}))=E(E(  \underbrace{E(Y^{a_{0},a_{1}}|A_{0}=a_{0},X,A_{1})}_{\because =Y^{a_{0},a_{1}}}|A_{0}=a_{0}))

もう一度交換可能であることを利用し、 A_{1}に具体的な割り当てを考えてもよい

 \tag{2.4}  (2.3)=E(E(  E(Y^{a_{0},a_{1}}|A_{0}=a_{0},X,A_{1})|A_{0}=a_{0})) \\
=E(E( \underbrace{E(Y^{a_{0},a_{1}}|A_{0}=a_{0},X,A_{1}=a_{1})}_{\because exchangeability}|A_{0}=a_{0}))

 A_{0}=a_{0} A_{1}=a_{0}となっているので、Y^{a_{0},a_{1}}にconsistencyを考えることができる

 \tag{2.5} (2.4)=E(E(E(Y^{a_{0},a_{1}}|A_{0}=a_{0},X,A_{1}=a_{1})|A_{0}=a_{0})) \\
=E(E(\underbrace{E(Y|A_{0}=a_{0},X,A_{1}=a_{1})}_{\because consistency}|A_{0}=a_{0}))

まとめると、次のように整理できたことになる。

 \tag{2.6} E(Y^{a_{0},a_{1}})=E(E(E(Y|A_{0}=a_{0},X,A_{1}=a_{1})|A_{0}=a_{0}))

残念ながら、ここの条件付き期待値がなんの分布の上で計算しているのかきちんと整理できていないのだけど、 E(E(Y|A_{0}=a_{0},X,A_{1}=a_{1})|A_{0}=a_{0})が第一部で計算した層で標準化した量に対応するはず。

というので、第一部で求めたのはなんだか色々役に立ちそうだ、と言うところらしい。

第三部

第一部で計算した量に対して、適当な条件が仮定できるときに潜在反応の期待値に変形できることを確認する。

ゴール

consistency

conditional exchangeability  p(Y^{a},A|L)=p(Y^{a}|L)p(A|L)

positivity

のもとで次の関係になること

 \displaystyle \tag{3.1} E \left( \frac{I_{A=a}Y}{p(A|L)} \right)=E  \left\{ Y^{a} \right\}

計算

まず、consistencyが成立するなら(3-1)式左辺は、潜在反応に置き換えられる。

 \displaystyle E \left( \frac{I_{A=a}Y}{p(A|L)} \right)=E \left( \frac{I_{A=a}Y^{a}}{p(A|L)} \right)

ついでに積分に戻す。

 \displaystyle =\int _{L \in S(L)}dL \int _{A \in S(A)}dA \int _{Y^{a} \in S(Y^{a})}    \frac{I_{A=a}Y^{a}}{p(A|L)}p(Y,A,L)dY^{a}

同時分布と条件付き分布の関係 p(Y^{a},A,L)=p(Y^{a},A|L)p(L)を用いて次のように変形できる*1

 \displaystyle =\int _{L \in S(L)}p(L)dL \int _{A \in S(A)}dA \int _{Y^{a} \in S(Y^{a})}    \frac{I_{A=a}Y^{a}}{p(A|L)}p(Y^{a},A|L)dY^{a}

続けて、conditional exchangeabilityから p(Y^{a},A|L)=p(Y^{a}|L)p(A|L)と変形できて

 \displaystyle =\int _{L \in S(L)}p(L)dL \int _{A \in S(A)}dA \int _{Y^{a} \in S(Y^{a})}    \frac{I_{A=a}Y^{a}}{p(A|L)}p(Y^{a}|L)p(A|L)dY^{a}

Y^{a}とAのそれぞれの積分に直すことができて

 \displaystyle =\int _{L \in S(L)}p(L)dL \underbrace{\int _{A \in S(A)} \frac{I_{A=a}}{p(A|L)}  p(A|L) dA}_{=E (\frac{I_{A=a}}{p(a|L)} |L )} \underbrace{ \int _{Y^{a} \in S(Y^{a})}  Y^{a}  p(Y^{a}|L) dY^{a} }_{=E(Y^{a}|L)}

で、難しそうな方の条件付き期待値が1になるから*2

 \displaystyle =\int _{L \in S(L)}  \int _{Y^{a} \in S(Y^{a})}  Y^{a}  p(Y^{a}|L)p(L) dY^{a}dL

あとは同時分布に直したら、これが E[Y^{a}]になる。

 \displaystyle =\int _{L \in S(L)}  \int _{Y^{a} \in S(Y^{a})}  Y^{a}  p(Y^{a},L) dY^{a}dL =E[Y^{a}]

ということで(3.1)式が証明できた。

追記

スティルチェスでもなんでもない記法で展開しているから、 Aがdiscreteだったらそもそも記法的にアウトなのである。(そこだけΣで書き直せば解決するのだけど。)

で、 A=a \in \mathbb{R}の状況下(一点)では \int _{A \in S(A)} \frac{I_{A=a}}{p(A|L)}  p(A|L) dA =0となる。

もしaが適当な長さをもつ区間であったなら、 \int _{A \in a=(x,y)} \frac{I_{A=a}}{p(A|L)}  p(A|L) dA=\int _{A \in a=(x,y)} I_{A=a} =y-xとなり、1にならない。

となると、上記の式変形はAがdiscreteでないと成立しないのだろうか。困った。

*1:ついでにp(L)を左側に追いやっておく

*2:a={0,1}しかなく、しかも0か1かの1点なら確かに1なんだけど、 A \subset \mathbb{R}で適当な部分集合をaにとると成立しない気がする