因果机器学习的本质:从“相关”追问到“如果干预会怎样”
普通机器学习擅长预测相关性,比如谁更可能流失、谁更可能患病。因果机器学习进一步追问:如果给某个用户优惠券、给某个病人治疗、给某个学生辅导,结果是否真的会改变。
学生做这个方向时,最重要的不是堆模型,而是把因果问题说清楚:处理变量是什么,结果变量是什么,混杂因素有哪些,识别假设是否合理,结论在敏感性分析下是否仍然成立。
- 输入通常是观测数据、处理变量、结果变量、混杂因素和因果图假设。
- 输出可以是平均处理效应、个体异质效应、反事实结果、因果图或策略建议。
- 难点在于隐藏混杂、样本选择偏差、识别假设和结论稳健性。