Chapter 8 Selection Bias
2024-10-10 17:51:33
目录
上一章讲了confounding, 这种bias来源于treatment和outcome受同一个未观测的cause影响, 但是这种bias在随机实验中可以避免.
这一章要讲的试selection bias, 即便是在随机试验中, 也无法避免.
8.1 The structure of selection bias
这里, 作者给出了一个非常好的例子, 如上图所示:
\(A \in \{0, 1\}\) 表示是否注射叶酸, 而\(Y \in \{0, 1\}\) 表示胎儿是否心脏畸形, 而\(C \in \{0, 1\}\)则表示是否死亡.
这里, 虽然是否注射叶酸, 我们是随机选择的, 但是在实际调查中, 只有顺利出生(\(C=0\))的才会被记录是否心脏畸形.
所以, 我们必须在\(C=0\)的条件下估计causal effect.
但是注意到, \(A\)存在指向\(C\)的箭头(即\(A=1\)会降低死亡的风险).
此时, \(Y^a\)和\(A\)在给定\(C=1\)的条件下并不独立.
这就是本章讲的selection bias.
8.2 Examples of selection bias
8.3 Selection bias and confounding
8.4 Selection bias and censoring
虽然我们只有\(C=0\)的情况, 我们可以把\(C\)也看出一个treatment, 则我们只需要关注
\[Y^{a, c=0},
\]
\]
即可.
8.5 How to adjust for selection bias
如何计算\(\mathbb{E}[Y^{a, c=0}]\), 这一节给出的是一种特殊的IP weighting的方法, 说实话没怎么看懂, 这里以上图为例给出我自己的理解.
\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C|A,L)}] \\
=
\sum_l \sum_y \frac{I(A=a, C=0)Y}{f(C=0|A=a,L=l)} \mathrm{Pr}[Y|a,c,l] \mathrm{Pr}[C=0|a,l] \mathrm{Pr}[A=a, L=l] \\
=
\sum_l \sum_y I(A=a, C=0)Y^{a,0} \mathrm{Pr}[Y^{a,0}|l] \mathrm{Pr}[A=a, L=l] \\
=
\mathbb{E} [Y^{a, c=0}] \mathrm{Pr}[A=a].
\]
=
\sum_l \sum_y \frac{I(A=a, C=0)Y}{f(C=0|A=a,L=l)} \mathrm{Pr}[Y|a,c,l] \mathrm{Pr}[C=0|a,l] \mathrm{Pr}[A=a, L=l] \\
=
\sum_l \sum_y I(A=a, C=0)Y^{a,0} \mathrm{Pr}[Y^{a,0}|l] \mathrm{Pr}[A=a, L=l] \\
=
\mathbb{E} [Y^{a, c=0}] \mathrm{Pr}[A=a].
\]
其实, 个人感觉如果是
\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C,A|L)}] ,
\]
\]
就直接可以得出结果了.
8.6 Selection without bias
这一节讲了给定\(Y\)的情况下, \(A, E\)产生关联的不同情况.
Fine Point
Selection bias in case-control studies
The strength and direction of selection bias
Technical Point
THe built-in selection bias of hazard bias
Multiplicative survival model
\[\mathrm{Pr}[Y=0|E=e, A=a] = g(e)h(a), \\
\mathrm{Pr}[Y=1|E=e, A=a] = 1 - g(e)h(a). \\
\]
\mathrm{Pr}[Y=1|E=e, A=a] = 1 - g(e)h(a). \\
\]
最新文章
- NLog 通过http保存日志
- xadmin 自定义视图在uwsgi部署时的一坑
- 这些年我们一起搞过的持续集成~Jenkins+Perl and Shell script
- Cocos2dx lua 3D实例代码
- DataGrid2
- QT for android 比较完美解决 全屏问题
- WINDOWS HYPER-V加新网卡,设置网络出错
- IOS 成员变量,全局变量,局部变量定义,static与extern的区别
- VBS 读取文本文件特殊字符前如逗号的值并赋值给变量
- PHP与Nginx之间的运行机制以及原理
- 关于关键字 volatile
- streaming简介
- Maximum Product Subarray LT152
- mysql 备份脚本
- form表单post请求保护 隐藏秘钥
- 160503、onunload、onbeforeunload事件详解
- p4688 [Ynoi2016]掉进兔子洞
- 实体类的状态与Hibernate缓存
- C++笔记009:C++对C的扩展——“实用性”增加
- python处理dict转json,字符串中存在空格问题,导致url编码时,存在多余字符
热门文章
- 漏洞检测方法如何选?详解源代码与二进制SCA检测原理
- 基于python win32setpixel api 实现计算机图形学相关操作
- 静态库动态库的编译、链接, binutils工具集, 代码段\数据段\bss段解释
- Scala和Java的List集合互相转换
- 大数据学习day28-----hive03------1. null值处理,子串,拼接,类型转换 2.行转列,列转行 3. 窗口函数(over,lead,lag等函数) 4.rank(行号函数)5. json解析函数 6.jdbc连接hive,企业级调优
- C++ 成绩排名
- spring注解-web
- 【编程思想】【设计模式】【结构模式Structural】代理模式Proxy
- 【Github】如何下载csv文件/win10如何修改txt文件为csv文件
- 莫烦python教程学习笔记——线性回归模型的属性