Bootstrap法进行随机模拟

一、问题背景

# 26名神经功能受损儿童接受了两组(A组与B组)空间知觉测试,得分如下A组和B组数据。
# A组数据
x_A <- c(48, 36, 20, 29, 42, 42, 20, 42, 22, 41, 45, 14, 6, 0, 33, 28, 34, 4, 32, 24, 47, 41, 24, 26, 30, 41)# B组数据
x_B <- c(42, 33, 16, 39, 38, 36, 15, 33, 20, 43, 34, 22, 7, 15, 34, 29, 41, 13, 38, 25, 27, 41, 28, 14, 28, 40)

二、问题求解

问题一

  • 给出A组与B组得分的皮尔逊相关系数的Bootstrap点估计、区间估计(95%置信区间)

Bootstrap估计皮尔逊相关系数及置信区间的步骤原理

  1. 计算原始样本的皮尔逊相关系数
    先对A组和B组的原始数据计算皮尔逊相关系数,作为点估计。

  2. Bootstrap重抽样
    设定Bootstrap重复次数B(如1000),每次从原始数据中有放回地随机抽取n对(n为样本容量)A组和B组数据,形成新的样本对。

  3. 每次重抽样计算相关系数
    对每一次Bootstrap样本,计算其皮尔逊相关系数,记录下来,最终得到B个相关系数的Bootstrap分布。

  4. 点估计与置信区间

    • 点估计:用原始样本的皮尔逊相关系数。
    • 置信区间:对B个Bootstrap相关系数,取其2.5%和97.5%的分位数,作为95%置信区间的下限和上限。
  5. 结果解释
    通过Bootstrap方法,可以在不依赖正态分布假设的情况下,获得相关系数的稳健置信区间。

    公式原理说明

皮尔逊相关系数公式:

设有两组数据 X = ( x 1 , x 2 , . . . , x n ) X = (x_1, x_2, ..., x_n) X=(x1,x2,...,xn) Y = ( y 1 , y 2 , . . . , y n ) Y = (y_1, y_2, ..., y_n) Y=(y1,y2,...,yn),其皮尔逊相关系数计算公式为:
r = ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = 1 n ( x i − x ˉ ) 2 ∑ i = 1 n ( y i − y ˉ ) 2 r = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n (x_i - \bar{x})^2} \sqrt{\sum_{i=1}^n (y_i - \bar{y})^2}} r=i=1n(xixˉ)2 i=1n(yiyˉ)2 i=1n(xixˉ)(yiyˉ)
其中 x ˉ \bar{x} xˉ y ˉ \bar{y} yˉ 分别为 X X X Y Y Y 的均值。

Bootstrap置信区间原理:

  1. 从原始样本 ( x i , y i ) (x_i, y_i) (xi,yi) 有放回地抽取 n n n 对,重复 B B B 次,得到 B B B 组Bootstrap样本。
  2. 每组Bootstrap样本计算皮尔逊相关系数 r b ∗ r^*_b rb b = 1 , 2 , . . . , B b=1,2,...,B b=1,2,...,B
  3. 置信区间为 r ∗ r^* r 的第2.5百分位数和第97.5百分位数:
    CI 95 % = [ Q 0.025 ( r ∗ ) , Q 0.975 ( r ∗ ) ] \text{CI}_{95\%} = \left[ Q_{0.025}(r^*),\ Q_{0.975}(r^*) \right] CI95%=[Q0.025(r), Q0.975(r)]
    其中 Q p ( r ∗ ) Q_p(r^*) Qp(r) 表示 r ∗ r^* r 的第 p p p 分位数。

这种方法无需对原始数据分布做正态性假设,适用于样本量较小或分布未知的情况。

set.seed(1234)
n <- length(x_A)
B <- 1000 # Bootstrap重复次数
boot_corr <- numeric(B)for (i in 1:B) {idx <- sample(1:n, n, replace = TRUE)boot_corr[i] <- cor(x_A[idx], x_B[idx], method = "pearson")
}# 点估计
corr_hat <- cor(x_A, x_B, method = "pearson")
# 置信区间
ci <- quantile(boot_corr, c(0.025, 0.975))cat("皮尔逊相关系数点估计:", round(corr_hat, 3), "\n")
cat("Bootstrap 95%置信区间: [", round(ci[1], 3), ",", round(ci[2], 3), "]\n")
皮尔逊相关系数点估计: 0.821 
Bootstrap 95%置信区间: [ 0.662 , 0.913 ]

问题二

  • 以B组得分为因变量,A组得分为自变量,建立一元线性回归模型: B i = b + a A i + ϵ i ( i = 1 , 2 , . . . , 26 ) B_i = b +aA_i + \epsilon_i(i=1,2,...,26) Bi=b+aAi+ϵi(i=1,2,...,26),请给出a的Bootstrap点估计和假设检验

Bootstrap点估计与假设检验的具体操作步骤

  1. 建立一元线性回归模型
    用B组得分为因变量,A组得分为自变量,拟合模型 B i = b + a A i + ϵ i B_i = b + aA_i + \epsilon_i Bi=b+aAi+ϵi,得到回归系数 a a a的原始点估计。

  2. Bootstrap重抽样
    设定Bootstrap重复次数 B B B(如1000),每次从原始数据中有放回地随机抽取 n n n ( A i , B i ) (A_i, B_i) (Ai,Bi),形成新的样本对。

  3. 每次重抽样拟合回归模型
    对每一次Bootstrap样本,拟合一元线性回归模型,记录回归系数 a b ∗ a^*_b ab,最终得到 B B B a ∗ a^* a的Bootstrap分布。

  4. 点估计与置信区间

    • 点估计:用原始样本拟合得到的 a a a
    • 置信区间:对 B B B a ∗ a^* a,取其2.5%和97.5%的分位数,作为 a a a的95%置信区间。
  5. 假设检验(a=0)
    计算 a = 0 a=0 a=0在Bootstrap分布中的分位数,得到双侧 p p p值: p = 2 × min ⁡ ( 比例 ( a ∗ ≥ 0 ) , 比例 ( a ∗ ≤ 0 ) ) p = 2 \times \min(\text{比例}(a^* \geq 0), \text{比例}(a^* \leq 0)) p=2×min(比例(a0),比例(a0))。若 p p p值较小,说明 a a a显著不为0。

  6. 结果解释
    通过Bootstrap方法,可以在不依赖正态分布假设的情况下,对回归系数 a a a进行稳健的点估计、区间估计和显著性检验。

set.seed(1234)
n <- length(x_A)
B <- 1000
boot_a <- numeric(B)for (i in 1:B) {idx <- sample(1:n, n, replace = TRUE)fit <- lm(x_B[idx] ~ x_A[idx])boot_a[i] <- coef(fit)[2]
}# 点估计
fit_full <- lm(x_B ~ x_A)
a_hat <- coef(fit_full)[2]# 置信区间
ci_a <- quantile(boot_a, c(0.025, 0.975))# 假设检验(p值):计算a=0在bootstrap分布中的分位数
p_value <- 2 * min(mean(boot_a >= 0), mean(boot_a <= 0))cat("回归系数a的点估计:", round(a_hat, 3), "\n")
cat("Bootstrap 95%置信区间: [", round(ci_a[1], 3), ",", round(ci_a[2], 3), "]\n")
cat("a=0的双侧p值:", round(p_value, 4), "\n")
回归系数a的点估计: 0.656 
Bootstrap 95%置信区间: [ 0.49 , 0.847 ]
a=0的双侧p值: 0 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84842.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring AI 多模型智能协作工作流实现指南

Spring AI 多模型智能协作工作流实现指南 说明 本文档旨在指导开发者基于 Spring AI 框架&#xff0c;在 Spring Boot 2 环境下集成多种主流大语言模型&#xff08;如 OpenAI ChatGPT、Deepseek、阿里云通义千问等&#xff09;&#xff0c;并提供从环境配置、模型调用、流式输…

C语言中清空缓存区到底写到哪里比较好

文章目录 问题背景%d和%c读取缓冲区的差别清空缓存区 问题背景 在写C语言的命令行程序时&#xff0c;我们经常会用到用户输入和标准输出&#xff0c;特别的&#xff0c;当用户输入后&#xff0c;我们发现程序运行不是我们要的样子&#xff0c;这个时候&#xff0c;很可能就是输…

计算机视觉与深度学习 | 基于 YOLOv8 + BeautyGAN + CodeFormer + Face Parsing 实现简单的人脸美颜

人脸美颜 **一、算法流程图****二、完整代码实现**1. 环境准备2. 完整代码(face_beautify.py)**三、核心算法公式**1. YOLOv8检测损失函数2. BeautyGAN损失函数3. CodeFormer图像重建公式**四、关键实现细节**1. 多尺度人脸处理2. 颜色校正策略**五、模型下载清单****六、性能…

如何在WordPress中选择最佳Elementor主题:专家指南

当你在WordPress建站过程中逐步积累了经验&#xff0c;你可能会发觉&#xff0c;基础和进阶主题已难以完全满足你的需求。如果你需要更复杂的功能、更灵活的布局设计&#xff0c;甚至高级定制效果&#xff0c;那么就需要选择更加专业的主题。在这篇文章中&#xff0c;我将为你推…

FPGA高速接口 mipi lvds cameralink hdml 千兆网 sdi

mipi: https://blog.csdn.net/SDJ_success/article/details/146541776 cameralink CameraLink协议 CameraLink协议是一种专门针对机器视觉应用领域的串行通信协议&#xff0c;它使用低压差分信号(LVDS)进行数据的传输和通信。CameraLink标准是在ChannelLink标准的基础上多加了…

手机收不到WiFi,手动输入WiFi名称进行连接不不行,可能是WiFi频道设置不对

以下是电脑上分享WiFi后&#xff0c;部分手机可以看到并且能连接&#xff0c;部分手机不行&#xff0c;原因是&#xff1a;频道设置为5GHz&#xff0c;修改成&#xff0c;任何可用频率&#xff0c;则可

12.Java 对象冷冻术:从用户登录到游戏存档的序列化实战

目录 一、引言 二、用户登录存档&#xff1a;让账号信息「冻龄」不变 1. 给对象贴「冷冻标签」&#xff1a;实现 Serializable 2. 冷冻与解冻实战&#xff1a;把用户存进文件 3. 演示场景 三、游戏存档复活&#xff1a;让角色进度「穿越时空」 1. 复杂对象冷冻&#xff…

conda 环境中opencv 报错以及其他报错

如题&#xff0c;通过 conda install opencv 然后遇到 ImportError: DLL load failed while importing cv2: 找不到指定的模块。 参考网络相关答案 通过conda 卸载 然后通过 pip3 安装opencv-pyhton https://stackoverflow.com/questions/75387197/anaconda-importerror-dll-…

(已开源-CVPR2024) RadarDistill---NuScenes数据集Radar检测第一名

本文介绍一篇Radar 3D目标检测模型&#xff1a;RadarDistill。雷达数据固有的噪声和稀疏性给3D目标检测带来了巨大挑战。在本文中&#xff0c;作者提出了一种新的知识蒸馏(KD)方法RadarDistill&#xff0c;它可以通过利用激光雷达数据来提高雷达数据的表征。RadarDistill利用三…

创建型设计模式之Singleton(单例)设计模式

创建型设计模式之Singleton&#xff08;单例&#xff09;设计模式 摘要&#xff1a; Singleton&#xff08;单例&#xff09;设计模式确保一个类仅有一个实例&#xff0c;并提供全局访问点。其结构包含一个静态方法getInstance()用于获取唯一实例&#xff0c;构造方法私有化防…

C++11:系统类型增强

C11&#xff1a;系统类型增强 强枚举类型作用域限定隐式类型转换指定类型前置声明 类型别名 using模板别名复杂指针别名 auto限制性 auto注意事项 nullptrdecltype 强枚举类型 在C98的枚举设计中&#xff0c;存在很多缺陷&#xff0c;为此C11推出了强枚举来代替旧版的枚举&…

linux 内核warn_on/Bug_on

1,warn_on() warn_on() 是 Linux 内核中用于报告潜在问题或警告的宏。与 bug_on() 不同&#xff0c;bug_on() 通常用于报告严重错误&#xff0c;其触发往往会导致内核Oops或panic&#xff0c;而 warn_on() 则用于报告不太严重的、可能只是潜在问题或预期外情况的情况。它的触…

SQL输出20个9

在SQL Server中要输出20个连续的9&#xff0c;可以使用以下几种方法&#xff1a; 使用REPLICATE函数重复生成字符&#xff1a; SELECT REPLICATE(9, 20) AS Result 2. 使用UNION ALL联合查询生成多行&#xff1a; SELECT 9 AS Number FROM (VALUES (1),(1),(1),(1),(1),(1),…

懒人云电脑方案:飞牛NAS远程唤醒 + 节点小宝一键唤醒、远程控制Windows!

后台高频问题解答&#xff1a; “博主&#xff0c;飞牛NAS能定时开关机了&#xff0c;能不能让它顺便把家里Windows电脑也远程唤醒控制&#xff1f;最好点一下就能连&#xff0c;不用记IP端口那种&#xff01;” 安排&#xff01;今天这套方案完美实现&#xff1a; ✅ 飞牛NAS…

Linux特殊符号

1 管道符| 管道符号 | 用于将一个命令的输出作为另一个命令的输入。这种机制允许将多个命令组合在一起&#xff0c;形成一个数据处理链&#xff0c;每个命令处理前一个命令的输出&#xff0c;从而实现复杂的数据处理任务。示例 # 查询/var/log目录下所有的log文件,并进行分页…

初识Docker:容器化技术的入门指南

初识Docker&#xff1a;容器化技术的入门指南 一、Docker是什么&#xff1a;容器化技术的核心概念二、Docker的核心优势2.1 环境一致性2.2 高效部署与快速迭代2.3 资源利用率高 三、Docker的安装与基本使用3.1 安装Docker3.2 Docker基本概念3.3 第一个Docker容器体验 四、Docke…

商务风企业公司推广培训计划PPT模版分享

商务风企业公司推广培训计划PPT模版分享&#xff1a;商务培训推广计划PPT模版https://pan.quark.cn/s/063282eaf739 第1套PPT模版&#xff0c;绿橙配色&#xff0c;几何图形拼接背景&#xff0c;有中英文标题和占位文本。 第2套PPT模版是黑金高端商务风格&#xff0c;有汇报人…

深入理解Nginx:详尽配置手册

Nginx是一款高性能的HTTP和反向代理服务器&#xff0c;广泛应用于负载均衡、缓存和Web服务器等场景。随着互联网应用的快速发展&#xff0c;掌握Nginx的配置和优化技巧显得尤为重要。在本篇文章中&#xff0c;我们将深入探讨Nginx的配置&#xff0c;帮助你更好地理解和使用这款…

每日leetcode

1572. 矩阵对角线元素的和 - 力扣&#xff08;LeetCode&#xff09; 题目 给你一个正方形矩阵 mat&#xff0c;请你返回矩阵对角线元素的和。 请你返回在矩阵主对角线上的元素和副对角线上且不在主对角线上元素的和。 示例 1&#xff1a; 输入&#xff1a;mat [[1,2,3], …

Server 9 ,在 VMware 虚拟机上安装 Windows 系统完整指南

目录 前言 一、准备工作 1.1 准备安装文件 1.2 安装VMware软件 1.3 创建新的虚拟机 1.4 开启虚拟机 二、注意事项 2.1 调整硬件设置 2.2 启动顺序配置 2.3 固件类型选择 2.4 安全启动配置 三、安装优化 3.1 安装VMware Tools 3.2 系统更新与激活 四、更多操作 ​…