層で標準化した平均
概要
周辺構造モデルで出てくる逆確率の最も簡単なパターンの計算練習
今回は特にcounter factualな話は出てこない。確率と期待値の機械的な計算に慣れる。
treatmentをA、共変量をLと読めばこれが何に通じるかがイメージできそう。は指示関数。
基本的には十分性質の良いものとする。(counter factual関係ないとは言ったけど、positivityが微妙に絡んでいる気はする。)
ゴール
多分次を導けること
変形
積分についているはその台を示す。
(1.1)の左辺を積分に直す。
ここで、同時分布は次のように修正できることを思い出す。
がipwとして扱われる量になっている。
すると、(1.2)の右辺は
で、p(A|L)が消えるから↓のようになって
p(L)とIはいったん考えないように追い出して
条件付き期待値が出てきた。
の下付きの部分は、何の上で計算しているから自明じゃないから残しておく。
ということで、(1.2)はここまで計算できた
でAに関する積分だけど、的な計算を多分することになって、A=aの上でだけ残るから、次のように変形して良いはず。
あとは普通に期待値として計算できるから
参考
Naimi, A. I., Cole, S. R., & Kennedy, E. H. (2017). An introduction to g methods. International journal of epidemiology, 46(2), 756–762. https://doi.org/10.1093/ije/dyw323 オンラインで読める
これのsupplementaryで周辺構造モデルのIPWを導いている。
第二部
で、結局何に使えるの?みたいなやつ
(ここからはまだうまく消化できていない)
supplementaryの derivation of g-formulaの行間を埋める作業
time varyingなやつで、とりあえず2点のtreatmentがあるとする。exchangeabilityとかconsistencyは都合のいい感じに成立していると仮定する。
また、law of iterative expectationは勝手に用いる
ゴール
がなんかいい感じに変形できて、IPWの計算が役に立ちそうな雰囲気を出していることを確認する。
計算
まず、繰り返し期待値の性質から次のように変形できる
次に、繰り返し期待値の部分が交換可能であることを利用し、に具体的な割り当てを考えてもよい
さらに、繰り返し期待値の性質から、Yをさらに条件付き期待値にする
もう一度交換可能であることを利用し、に具体的な割り当てを考えてもよい
ととなっているので、にconsistencyを考えることができる
まとめると、次のように整理できたことになる。
残念ながら、ここの条件付き期待値がなんの分布の上で計算しているのかきちんと整理できていないのだけど、が第一部で計算した層で標準化した量に対応するはず。
というので、第一部で求めたのはなんだか色々役に立ちそうだ、と言うところらしい。
第三部
第一部で計算した量に対して、適当な条件が仮定できるときに潜在反応の期待値に変形できることを確認する。
ゴール
consistency
conditional exchangeability
positivity
のもとで次の関係になること
計算
まず、consistencyが成立するなら(3-1)式左辺は、潜在反応に置き換えられる。
ついでに積分に戻す。
同時分布と条件付き分布の関係を用いて次のように変形できる*1。
続けて、conditional exchangeabilityからと変形できて
とAのそれぞれの積分に直すことができて
で、難しそうな方の条件付き期待値が1になるから*2
あとは同時分布に直したら、これがになる。
ということで(3.1)式が証明できた。
追記
スティルチェスでもなんでもない記法で展開しているから、 Aがdiscreteだったらそもそも記法的にアウトなのである。(そこだけΣで書き直せば解決するのだけど。)
で、の状況下(一点)ではとなる。
もしaが適当な長さをもつ区間であったなら、となり、1にならない。
となると、上記の式変形はAがdiscreteでないと成立しないのだろうか。困った。