【学习笔记】因果推理导论第2课

因果推理导论第2课 因果推断假设

  • 前言
  • 一、假设
    • 1、 Ignorability / Exchangeability
    • 2、条件可交换
  • 二、估计

前言

第一节课通过一些例子说明了为什么要做因果推断,以及通过控制混杂因素计算因果效应;这一节课将围绕为何控制混杂因素计算因果效应这一方法成立,讲述其涉及到的一些假设,与基于假设后因果公式上的推导.

注:小写字符代表单个目标,大写字符代表变量

一、假设

案例说明:定义 Υ ( 1 ) \Upsilon (1) Υ(1)为接受治疗T=1的潜在效果, Υ ( 0 ) \Upsilon (0) Υ(0)为不接受治疗T=0的潜在效果.
先回忆一下计算因果效应其公式 E [ Υ ( 1 ) − Υ ( 0 ) ] = E [ Υ ( 1 ) ] − E [ Υ ( 0 ) ] , 线性期望展开 E[\Upsilon (1)-\Upsilon (0)]=E[\Upsilon (1)]-E[\Upsilon (0)],线性期望展开 E[Υ(1)Υ(0)]=E[Υ(1)]E[Υ(0)],线性期望展开,我们知道无法直接计算的原因是我们无法得知单个个体同时接受不同治疗方法T(除非时间回溯,否则前后接受其初始条件已变化),得到其潜在效果.而机器学习没有这个问题是因为其目标是预测观察到的结果.

1、 Ignorability / Exchangeability

因此我们从能获取的信息入手,首先观测里我们知道具体的治疗方法T与其效果,那么能不能把治疗方法作为条件引入?若治疗方法是随机分配的,那么这个治疗条件是不是就不影响其潜在效果的计算了,对的,因此给出忽略性假设,当该假设成立时,下面等式成立.
E [ Υ ( 1 ) ] − E [ Υ ( 0 ) ] ? = E [ Υ ( 1 ) ∣ T = 1 ] − E [ Υ ( 0 ) ∣ T = 0 ] = E [ Υ ∣ T = 1 ] − E [ Υ ∣ T = 0 ] E[\Upsilon (1)]-E[\Upsilon (0)] ?=E[\Upsilon (1)|T=1]-E[\Upsilon (0)|T=0]\\=E[\Upsilon |T=1]-E[\Upsilon |T=0] E[Υ(1)]E[Υ(0)]?=E[Υ(1)T=1]E[Υ(0)T=0]=E[Υ∣T=1]E[Υ∣T=0]
在这里插入图片描述

该假设从因果图上理解,就是T条件没有混杂因素影响,其不同治疗方法的群体是可比较的,因此假设也叫可交换性假设
在这里插入图片描述
根据假设得到定义,如果一个因果量化可由纯粹的统计量化计算,那么它是可识别的.
在这里插入图片描述
当然第一节课也说到,不同治疗T群体的可比较性是比较不现实的(比如测试基因对糖尿病的因果作用,没有办法随机改变一个人的基因),因此它会收到混杂因素的影响.

2、条件可交换

有混杂因子X,这时公式变为 E [ ( Υ ( 1 ) − Υ ( 0 ) ∣ X ] = E [ Υ ( 1 ) ∣ X ] − E [ Υ ( 0 ) ∣ X ] ? = E [ Υ ( 1 ) ∣ T = 1 , X ] − E [ Υ ( 0 ) ∣ T = 0 , X ] = E [ Υ ∣ T = 1 , X ] − E [ Υ ∣ T = 0 , X ] E[(\Upsilon (1)-\Upsilon (0)|X]\\=E[\Upsilon (1)|X]-E[\Upsilon (0)|X] \\?=E[\Upsilon (1)|T=1,X]-E[\Upsilon (0)|T=0,X]\\=E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X] E[(Υ(1)Υ(0)X]=E[Υ(1)X]E[Υ(0)X]?=E[Υ(1)T=1,X]E[Υ(0)T=0,X]=E[Υ∣T=1,X]E[Υ∣T=0,X]
当我们控制住X时,其群体又是可比较的了,其因果图如下所示,满足这个条件的时候其等式成立.这个条件即为假设2:条件可交换,也叫无混杂因子假设.这样最后的因果量化可以由上面式子在X的边际期望得到 E [ Υ ( 1 ) ] − E [ Υ ( 0 ) ] = E X [ E [ Υ ∣ T = 1 , X ] − E [ Υ ∣ T = 0 , X ] ] E[\Upsilon (1)]-E[\Upsilon (0)]=E_X[E[\Upsilon |T=1,X]-E[\Upsilon |T=0,X]] E[Υ(1)]E[Υ(0)]=EX[E[Υ∣T=1,X]E[Υ∣T=0,X]]
在这里插入图片描述
在这里插入图片描述
同样根据假设得定理调整式子,可以看到公式里面除了条件假设还有正值,一致性,无干扰假设,接下来再对后面几个假设做简要说明.
在这里插入图片描述

  • 正值性:看我们公式是条件期望,那么回想一下贝叶斯公式,转换一下,那么下述假设就会成为分母,若假设不成立就会导致除以0出现,那么调整公式就不成立了.
    在这里插入图片描述

  • 无干扰性:是指单个目标的治疗不受其前后左右影响,就取决于自身的治疗策略
    在这里插入图片描述

  • 一致性:指我们观测到的 Υ \Upsilon Υ确实是由观测到的T 产生的,还记得这个转化不,如果一致性不成立,那么下面这个转化也不成立了,当然这个很难理解假设会不成立,举个例子,有狗无狗对情绪的影响,若实际实验中,狗狗给了幼犬和老年犬两个版本,那这个观测值就不是刚刚开始定义的有狗无狗的T了,这样观测到的结果也不是由T得到的了.
    在这里插入图片描述
    所有假设定义合并一下可得到完整额公式变化:
    在这里插入图片描述

二、估计

理论已经证明完成,那么实际应用上是如何使用的呢?
前面我们已经将因果量化转为观测值上期望计算(概率估计),接下来就是估计了. 举一个例子,目标是看sodium这个药对血压的影响,其混杂因子是age,proteinuria,使用线性回归模型进行估计,其因果量化取均值得到;由于我们使用的是线性模型,其因果量化就等于其拟合的模型sodium的系数.
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/87547.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/87547.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VASP 教程:VASP 机器学习力场微调

机器学习力场(Machine-Learned Force Fields, MLFFs)作为一种新兴的计算方法,已在第一性原理分子动力学(Ab Initio Molecular Dynamics, AIMD)模拟中展现出独特优势(参见 VASP Wiki:Category:Ma…

Java+Vue开发的仓库管理系统,实时监控库存,精准统筹货物出入与调配

前言: 在当今竞争激烈的商业环境中,高效的仓库管理对于企业的运营和成本控制至关重要。一个完善的仓库管理系统能够帮助企业实现货物的精准存储、快速出入库、实时库存监控以及全面的数据分析,从而提升整体运营效率、降低库存成本、增强客户…

【王阳明代数】热门问答,什么是张量?

【王阳明代数】热门问答,什么是张量? 流形学习基础概念前情提要,张量概念的提出,王船山流形与信息容量的概念回答:什么是张量前,对王船山流形,意气实体的定义再表述;王船山流形分析1…

差分压缩算法(增量更新)

差分压缩算法是一种数据压缩技术,它的核心思想是通过找出数据之间的差异来减少需要存储或传输的数据量。下面从基本原理、常见应用场景、算法示例等方面详细介绍差分压缩算法。 基本原理 差分压缩算法的基本原理是比较相邻数据元素之间的差异,并只记录…

Html5支持的视频文件格式和音频文件格式有哪些?

视频文件格式 MP4:MPEG-4 Part 14,支持H.264编码。几乎所有的浏览器都支持该格式。 WebM:谷歌开发的格式,使用VP8或VP9编码,可以在大多数现代浏览器中播放 Ogg:开放媒体格式,使用Vorbis编码&…

J20250704 算法题5道

题目一览: 606. 根据二叉树创建字符串 - 力扣(LeetCode) 506. 相对名次 - 力扣(LeetCode) 1. 两数之和 - 力扣(LeetCode) 100. 相同的树 - 力扣(LeetCode) 101. 对称…

UNet改进(15):分组注意力机制在UNet中的应用探索

引言 注意力机制已成为现代深度学习架构中不可或缺的组成部分,特别是在计算机视觉领域。近年来,各种注意力机制的变体被提出,以解决不同场景下的特定问题。本文将深入探讨一种称为分组注意力(Grouped Attention)的机制,以及它如何被集成到经典的UNet架构中,从而提升模型在…

C++之路:类基础、构造析构、拷贝构造函数

目录 前言从结构体到类类的声明与使用基础声明继承声明数据与函数声明与调用声明调用 类的访问修饰符类对象的内存分布类内数据相关静态变量非静态变量 类成员函数相关普通成员函数友元函数构造与析构函数构造函数析构函数 拷贝构造函数总结 前言 面向对象编程有三大特性&#…

黑神话悟空游戏舆情分析

完整项目包点击文末名片 黑神话悟空上线初期舆情分析 背景 《黑神话:悟空》在上线首日便创下了全球游戏行业的多项新纪录,包括Steam同时在线人数超过222万,全渠道总销量超过450万份,总销售额超过15亿元。本项目旨在对 3A 游戏《黑…

python的or-tools算法踩坑

debug模式代码好的,然后正常运行不行(用的PyCharm) 不知道为什么debug模式这个可以的,但是正常模式不行 用or-tools算路径的时候 因为要多次到达同一个点,但是or-tools不支持,所以弄了虚拟点和真实点的距离是0,但是实际上如果虚拟点到真实点为0的话or-tools结果秒出,但是实…

docker-compose一键部署全栈项目。springboot后端,react前端

部署总览前端打包: 我们将配置 package.json,使用 npm run build (内部调用 vite build) 来打包。这个过程将完全在 Docker 构建镜像的过程中自动完成,你的主机上甚至不需要安装 Node.js。后端打包: 我们将配置 pom.xml,使用 mvn clean packa…

MCMC:高维概率采样的“随机游走”艺术

MCMC(马尔可夫链蒙特卡洛) 是一种从复杂概率分布中高效采样的核心算法,它解决了传统采样方法在高维空间中的“维度灾难”问题。以下是其技术本质、关键算法及实践的深度解析: 本文由「大千AI助手」原创发布,专注用真话…

HarmonyOS免密认证方案 助力应用登录安全升级

6月21日,2025年华为开发者大会"安全与隐私分论坛"在松山湖顺利举办。本论坛聚焦App治理与监管、星盾安全2.0的核心能力等进行深度分享与探讨。其中,HarmonyOS Passkey免密认证方案作为安全技术创新成果备受瞩目。该方案基于FIDO协议实现&#…

flutter flutter_vlc_player播放视频设置循环播放失效、初始化后获取不到视频宽高

插件:flutter_vlc_player: ^7.4.3 问题1:设置循环播放_controller.setLooping(true);无用。 解决方法: //vlcPlayer设置循环播放失效,以这种方式失效循环播放 _setLoopListener() async {if (_videoController!.value.hasError…

React与Vue的主要区别

React和Vue都是当今最流行、最强大的前端Javascript框架,它们都能构建出色的单页面应用。 以下是React和Vue的主要区别: React: React官方自称是一个用于构建用户界面的JavaScript库(尤其是UI组件)。它专注于视图层。…

浏览器原生控件上传PDF导致hash值不同

用户要求对上传的pdf计算hash排重,上线后发现排重失败 1、postman直接调用接口没有发现问题,每次获取的hash值是一样的 2、apifox网页版,调用接口发现问题,清除缓存后(将选择的文件删除重新选择)&#xf…

.net 的依赖注入

依赖注入(Dependency Injection,简称 DI)是一种软件设计模式,旨在将对象之间的依赖关系从代码内部解耦出来,通过外部提供的方式来建立依赖关系,从而提高软件的可维护性、可测试性和可扩展性。以下从概念、工作原理、常见类型、在不同框架中的应用等方面进行详细解释: 概…

【unitrix】 4.17 类型级别右移运算实现解析(shr.rs)

一、源码 这段代码实现了类型级别的右移运算(>>),包括对整数和定点数的支持。 /*类型级别的右移运算实现* 编制人: $ource* 修改版次:0版完成版* 本版次创建时间: 2025年6月27日* 最后修改时间: 2025年7月2日 Sub1修改* 待完善问题&a…

Java 并发核心:AQS(AbstractQueuedSynchronizer) 详解

一、什么是 AQS? AbstractQueuedSynchronizer(简称 AQS)是 Java 并发包 java.util.concurrent.locks 中的一个核心同步框架,用于构建锁和同步器,如: ReentrantLockReentrantReadWriteLockCountDownLatchS…

LoRA 实战指南:NLP 与 CV 场景的高效微调方法全解析

大模型已成 AI 应用的“标配”,但高昂的训练和部署成本让很多企业望而却步。LoRA(Low-Rank Adaptation)作为一种轻量级微调方案,正成为 NLP 与 CV 场景中低成本定制的利器。本文详细通过详细介绍 LoRA 的核心原理、在文本与图像任…