べんきのにっき

いろいろと垂れ流します。

悲しみのメモ

sharp causal null hypothesisの話

sharp causal null hypothesisってなんなのという話。

A definition of causal effect for epidemiological research | Journal of Epidemiology & Community Health

これを見ると、例えば2値の割付A (=\{0,1\})において、populationのどのような個人にも効果がない状態を

 ^{\forall} \omega  \in  \Omega ,Y^{a=1}(\omega)-Y^{a=0}(\omega)=0

とし、sharp causal null hypothesisがtrueだと書いてあった。

好みで記法ちょっと変えていて、individualを \omega で、populationを \Omegaで書いた。こっちの方が X(\omega)みたいで確率変数っぽくみえるよね。

ちなみに、命題「sharp null .... が真→ATE=0」は正しい。

というのも、 ^{\forall} \omega  \in  \Omega ,Y^{a=1}(\omega)-Y^{a=0}(\omega)=0 なんだから、ATEも \sum _{\omega \in \Omega} Y^{a=1}(\omega)-Y^{a=0}(\omega)=0になるよね。

nondeterministic potential outcomeの話

以下では、TP1.2*1の計算の気持ちが掴めなかったので、雑に考えてみる。

それっぽい変形を考えてはみたけど、確率1で間違っている。

期待値の変形が何度かされていたんだけど、それぞれが一体なんの分布の上で積分してるのか全く直感的でなかったので、なんとかこれを補いたいのがモチベーション。

量子とかそういうのは興味がないので、以下、そう言った視点は全て捨てる。

non deterministicな状況をどう考えるか*2は余地がありそう。反応を規定する要素を完全に取り込み切れていない状態と考えられるならば、それっぽい感じがある。

もし、potential outcomeがdeterministicではなかったとし、A=aにおけるpotential outcomeの分布がパラメータtに依存し、tはなんらかの分布を持つとする。

潜在反応のpdfを \theta _{Y^{a}_{i}}(y,t)と書く。さらにtの分布をp(t)とおく。

ここから、potential outcomeの平均的なpdfを f_{Y^{a}}(y)としたら、次のように計算できる?*3S(t)はオレオレ記法でtの台の意味。

 f_{Y^{a}}(y)=\displaystyle \int _{S(t)}\theta _{Y^{a}_{i}}(y,t)p(t)dt

このとき、the average potential outcome in the populaition E[Y^{a}]は、おそらくこういう量を計算しようとしているんじゃないかな?と思う。

 \displaystyle \int_{S(y)} y f_{Y^{a}}(y) dy = \int_{S(y)} y \int _{S(t)} \theta _{Y^{a}_{i}}(y,t) p(t)dt dy= \int_{S(t)}  \underbrace{\int _{S(y)}y \theta _{Y^{a}_{i}}(y,t) dy}_{=\int y d\Theta_{Y^{a}}(y)?}  p(t)dt

もしこれが正しいなら、朧げに何を計算しているかをなんとなくイメージできた気がする。

参考にしようと思ったけど、結局読まなかった。

Stochastic counterfactuals and stochastic sufficient causes

*1:stochastic potential outcomeの方が検索でひっかかりが良さそうな

*2:正当化するか

*3:簡単な例を計算したら一応確率分布っぽくなっていた