同時介入を書く練習
part3で出てくる同時効果の練習
ただしipwによる表記ではない。
前半では同時介入の定義や効果の定義を紹介し、後半では簡単な例で同時介入効果を確認する。
1. 同時因果効果
因果ダイアグラムGにおける頂点集合をとする。 次を同時因果効果という。
2. 許容性基準
非巡回で有向なグラフGにおいて、の各頂点がYの非子孫であり、はの非子孫となるように並べられているとする。
このとき、次の2条件を満たす変数集合はについて許容性基準を満たすという。
条件1
任意のについて、はの非子孫からなる頂点集合である。
条件2
任意のについて、Gからに向かう全ての矢線とから出る全ての矢線を取り除いたグラフにおいてはとを有向分離する。
3. 識別可能な時の効果の式
許容性基準を議論できるようなグラフGにおいて、許容性基準を満たす頂点集合が観測されていれば、同時因果効果は識別可能であり、次の式で計算することができる。
4. 例
次の図のようなcausal-DAGについて、同時因果効果を求めてみよう。
手順としては、許容性基準を満たす変数集合Zを特定し、そこから式(2)に当てはめればよい。
今回二つの介入を考えるから、とを二つのステップで特定する。
Z1の特定
について、次の操作を行う。
- から出るパスを全部切断する
- に向かうパスを全部切断する
これを実行すると次のグラフになる。
上のグラフにおいて、次の2条件を満たすようなを探す。
- はの子孫ではない
- がとを有向分離する
ここから、となることがわかる。
無事Z1を特定できた。
Z2の特定
Z1と同様に特定する。
について、次の操作を行う。
- から出るパスを全部切断する
- に向かうパスを全部切断する
これを実行すると次のグラフになる。
上のグラフにおいて、次の2条件を満たすようなを探す。
- はの子孫ではない
- がとを有向分離する
の候補は複数あり、 または または が挙げられる。
とくに意味はないけどを選ぶ。
Z2も特定できた。
同時因果効果
特定したZと式(2)から、を求める。 とりあえず書き下してみよう。
に当たる部分を特定したものに書き換えると以下。
これが同時因果効果になる。
5. 確認
(3)は、式(2)から計算した同時効果になっている。 元々の定義(1)から計算したものと一致していることを確認しよう。
まず、式(1)の同時効果を書き下そう。 同時分布は、グラフのマルコフ性を利用して分解する。 は、グラフの構造から考える。
で、は周辺化してしまうと
6. 式(3)と(4)の比較
両方が同じかどうか比較してみよう
下線部の部分が違う。
ところで、グラフの構造をよく眺めると、が成立しているから、
の関係がある。
これを利用すると、は次のように変形できる。
ということで、「 」が成立する。
以上をまとめると、同時因果効果の定義通りの値と、許容性基準から求めた同時因果効果が一致することが確認できた。
7. おまけ1:許容性基準の確認方法について
許容性基準を確認する際、介入の個数分だけを特定するステップを繰り返すことになるんだけど、これがなかなかわかりづらい。 まとめると以下。
手順1 を切断したグラフを作成する
1-1: i番目の介入 から出る パスを全て切断する
1-2:i+1番目 以降の 介入 に向かう パスを全て切断する
手順2 変数集合を特定する
次の条件に合うものを探す。
条件2-1: i番目以降の介入の子孫ではない
条件2-2:においてがとを有向分離する
特に、2-2がわかりにくく、「i番目より前の許容性基準を満たす集合と介入の和集合」と「自分自身」の和集合がとを有向分離する、という感じなのがややこしいと感じた。
8. おまけ2:IPWとの関連
ここはちょっと自信ないので信用できない。
式(3)から、同時介入時の条件付き分布は以下。
これの分母と分子にをかけると、次のようになる。
良い感じに同時分布に直せるから、
何となくipwらしい感じになってきた。
ということは、期待値E(y)は多分こう
同時分布をかつのところでのみ積分する感じになるから、指示関数をつけて書き直す気がする。