在补充图6中,对喉镜形态分类、病理类型和病程使用 Wilcoxon秩和检验(Mann-Whitney U检验) 结合 Bonferroni校正,而非 Kruskal-Wallis检验加Dunn’s检验,原因如下:
1. 方法选择的依据
(1) 变量类型与比较组数
- 变量类型:
- 喉镜形态分类、病理类型、病程被定义为 有序多分类变量(如病理分级:无增生=0,轻度=1,…,原位癌=4)。
- 分组变量(如FAM49B表达水平)为 二分类变量(高表达组 vs 低表达组)。
- 组别数量:
- 比较的目标是 两组(如高/低表达组)在有序变量上的分布差异。
- 若比较组别为 三组或更多(如高、中、低表达组),则需使用 Kruskal-Wallis检验(多组非参数检验),随后通过 Dunn’s检验 进行两两比较。
(2) Wilcoxon秩和检验的适用性
- 适用场景:
- 比较 两组独立样本 在 连续变量 或 有序分类变量 上的分布差异。
- 不依赖数据正态性假设,通过秩次(Rank)评估组间差异。
- 变量要求:
- 独立变量:二分类(如高/低表达组)。
- 依赖变量:连续型 或 有序分类变量(如病程、病理分级)。
- 优势:
- 直接回答“高表达组是否比低表达组在病理分级上更严重”这类问题。
- 对有序变量的等级信息敏感,检验效能高于卡方检验。
(3) Kruskal-Wallis + Dunn’s检验的适用场景
- 适用场景:
- 比较 三组或更多独立样本 的分布差异。
- 例如,若分组为高、中、低表达组,需先通过Kruskal-Wallis检验判断是否存在全局差异,再通过Dunn’s检验进行两两比较。
- 局限性:
- 当仅有两组时,Kruskal-Wallis检验等价于Wilcoxon检验,但流程更复杂(需额外事后检验)。
2. 为什么使用Bonferroni校正?
(1) 多重比较问题
在补充图6中,需对 多个变量(喉镜形态、病理类型、病程)进行独立检验。若直接使用原始显著性水平(如α=0.05),整体第一类错误率(假阳性)会显著增加。例如:
- 检验3个变量时,至少出现1次假阳性的概率为:
1 − ( 1 − 0.05 ) 3 ≈ 0.1426 1 - (1 - 0.05)^3 \approx 0.1426 1−(1−0.05)3≈0.1426
即 14.26% 的假阳性风险,远超预设的5%。
(2) Bonferroni校正的作用
- 将显著性阈值调整为:
α 校正 = α n \alpha_{\text{校正}} = \frac{\alpha}{n} α校正=nα
其中,( n ) 为独立检验的次数。例如:- 若检验3个变量,则调整后阈值:
α 校正 = 0.05 3 ≈ 0.0167 \alpha_{\text{校正}} = \frac{0.05}{3} \approx 0.0167 α校正=30.05≈0.0167 - 仅当某变量的p值 < 0.0167时,才认为结果显著。
- 若检验3个变量,则调整后阈值:
- 优势:简单易行,严格控制家族误差率(Family-Wise Error Rate, FWER)。
- 局限性:过于保守,可能增加第二类错误(假阴性)。
(3) Dunn’s检验的作用(对比)
- 适用场景:
- 作为Kruskal-Wallis检验的事后检验,用于多组间的两两比较。
- 例如,若分三组(高、中、低表达),需先通过Kruskal-Wallis检验确定全局差异,再通过Dunn’s检验比较每两组的差异。
- 与Bonferroni的差异:
- Dunn’s检验专为非参数多组比较设计,直接控制多重比较误差率。
- Bonferroni是通用校正方法,适用于任何独立的多重检验场景。
3. 总结:为什么选择Wilcoxon + Bonferroni?
- 组别数量为两组:
- 直接使用Wilcoxon秩和检验更高效,无需多步检验流程。
- 变量为有序分类或连续型:
- Wilcoxon检验能有效利用有序变量的等级信息,避免卡方检验忽略排序的问题。
- 多重比较校正需求:
- 因同时分析多个变量(喉镜、病理、病程),需通过Bonferroni校正控制整体假阳性风险。
- Kruskal-Wallis + Dunn’s的替代性:
- 仅当分组变量为多组(≥3组)时,才需要此组合方法。
4. 操作建议与改进方向
(1) 结果报告规范
-
表格示例:
变量 Mann-Whitney U 渐近p值 Bonferroni校正后阈值(α=0.0167) 显著性 喉镜形态分类 78.5 0.032 0.032 > 0.0167 不显著 病理类型 92.0 0.127 0.127 > 0.0167 不显著 病程(月) 65.0 0.008 0.008 < 0.0167 显著 -
文字描述:
“高表达组与低表达组的病程存在显著差异(p=0.008,Bonferroni校正后α=0.0167),而喉镜形态和病理类型差异未达显著性。”
(2) 替代方案(若需优化)
- Holm-Bonferroni校正:
按p值排序逐步调整阈值,比经典Bonferroni更高效。例如:- 对最小p值使用α/3,次小p值使用α/2,最大p值使用α/1。
- 效应量补充:
报告 Cliff’s delta(适用于有序变量)或 秩二列相关性,量化差异程度。* 示例:通过R语言或插件计算Cliff’s delta.
(3) 可视化建议
- 分面条形图:展示喉镜形态或病理类型在两组中的分布比例。
- 箱线图或Violin图:直观比较病程的中位数及分布形态。
5. 最终结论
在补充图6中,选择 Wilcoxon秩和检验 + Bonferroni校正 的原因是:
- 比较目标为 两组独立样本(如高/低表达组);
- 依赖变量为 有序多分类或连续型,Wilcoxon检验能有效利用其等级信息;
- Bonferroni校正确保多重比较的假阳性风险可控。
若未来实验设计涉及多组(≥3组)比较,可切换至 Kruskal-Wallis + Dunn’s检验 组合。
⛄
好的,我需要回答用户关于为什么在补充图6中使用Wilcoxon秩和检验(Mann-Whitney U检验)结合Bonferroni校正,而不是Kruskal-Wallis检验加Dunn’s检验的问题。此外,用户还问到Wilcoxon检验是否适用于分类变量和连续型变量。让我一步一步来思考。
首先,用户提到的变量是喉镜形态分类、病理类型和病程,这些已经被转换为有序多分类变量。用户想知道为什么选择Wilcoxon-Mann-Whitney U检验(以下简称Wilcoxon检验)加Bonferroni校正,而不是Kruskal-Wallis检验加Dunn’s检验,并且对Wilcoxon检验的变量类型适用性有疑问。
我需要先回顾这些统计方法的适用场景和区别:
- Wilcoxon秩和检验(Mann-Whitney U检验):
-
用于比较两组独立样本的中位数是否存在显著差异。
-
适用于连续变量或有序分类变量。
-
非参数检验,不假设数据符合正态分布。
- Kruskal-Wallis检验:
-
用于比较三个或更多组独立样本的中位数是否存在显著差异。
-
如果Kruskal-Wallis检验显示总体存在显著差异,通常会进行事后检验(如Dunn’s检验)来比较各组之间的差异。
- Bonferroni校正:
-
用于多重比较校正,控制族系误差率(Family-Wise Error Rate, FWER)。
-
通过调整显著性水平(α)来减少假阳性的风险。
- Dunn’s检验:
-
作为Kruskal-Wallis检验的事后检验,用于两两比较多组间的差异。
-
同样适用于非参数数据。
现在,用户的变量是有序多分类变量,且被转换为有序多分类。这里可能涉及两种情况:
-
两组比较:例如,高表达组 vs 低表达组。
-
多组比较:如果有三个或更多组需要比较。
根据用户的问题,补充图6中的变量可能被分为两组(如高表达和低表达),因此使用Wilcoxon检验是合理的,因为它是针对两组比较的非参数方法。而如果组别超过两组,则需要使用Kruskal-Wallis检验,随后进行Dunn’s检验进行两两比较。
此外,用户提到使用了Bonferroni校正。Bonferroni校正通常用于当进行多个独立假设检验时,调整显著性水平以避免假阳性。例如,如果同时比较多个变量(如喉镜形态、病理类型、病程),每个变量的检验都需要校正。
关于Wilcoxon检验的变量类型适用性:
-
独立变量:应为二分类变量(如高表达组和低表达组)。
-
依赖变量:可以是有序多分类变量或连续变量。对于有序分类变量,Wilcoxon检验通过比较秩次来评估两组间的分布差异。
因此,如果补充图6中的比较是针对两组(如高/低表达)在多个有序分类变量上的差异,Wilcoxon检验是合适的选择。而Bonferroni校正则用于控制多个比较的误差率。
相反,如果存在三个或更多组需要比较,应该使用Kruskal-Wallis检验,随后进行Dunn’s检验进行两两比较。但根据用户描述,补充图6中可能是两组比较,因此Wilcoxon检验更直接。
最后,用户可能存在的误解是,认为有序多分类变量需要更复杂的多组比较方法,而实际上如果是两组比较,Wilcoxon检验已经足够,并且Bonferroni校正适用于多个独立检验的校正。
总结:
-
使用Wilcoxon检验是因为比较的是两组独立样本。
-
Bonferroni校正是因为同时进行了多个独立的假设检验。
-
Kruskal-Wallis加Dunn’s检验适用于多组(≥3组)比较,而用户的情况可能是两组。
-
Wilcoxon检验的依赖变量可以是连续型或有序分类变量,独立变量应为二分类。
需要进一步确认补充图6中实际比较的组别数量,但根据用户描述,可能为两组,因此当前方法是合理的。