中科院1区|IF10+:加大医学系团队利用GPT-4+电子病历分析,革新肝硬化并发症队列识别

图片

中科院1区|IF10+:加大医学系团队利用GPT-4+电子病历分析,革新肝硬化并发症队列识别

在当下的科研领域,人工智能尤其是大语言模型的迅猛发展,正为各个学科带来前所未有的机遇与变革。在医学范畴,从疾病的早期精准筛查,如AI预测系统可提前数年察觉阿尔茨海默病等千余种疾病风险,到影像诊断中显著降低骨折漏诊率,AI的应用已逐步渗透。在生物医学研究方面,单细胞RNA测序技术结合人工智能,为深入解析细胞异质性开拓了新思路。于此同时,大语言模型在医学知识问答、临床报告生成等场景中也崭露头角。在这样充满活力与创新的大背景下,一篇发表于知名期刊Hepatology的论文,另辟蹊径,巧妙运用生物信息方法及其他手段,在肝病研究领域取得了令人瞩目的成果,接下来就让我们深入探究这篇论文的精妙之处。 

https://doi.org/10.1097/HEP.0000000000001115

图片

正式介绍


基本信息

  • 论文标题:利用GPT-4评估基于编码的肝硬化及其并发症识别的阳性预测值

  • 发表期刊:Hepatology,中科院医学大类分区1区,IF=12.9002

  • 发表日期:2025年6月1日在线发表


研究背景

临床需求矛盾:肝硬化及并发症的队列识别依赖诊断编码(如 ICD 码),但编码准确性低(既往研究 PPV 仅 43%-91%),且无法区分“活动性”与“历史性”病情;手动 chart review 虽为金标准,却耗时耗力,难以规模化。技术机遇:大语言模型(LLM)如 GPT-4 具备非结构化文本解析能力,可高效处理电子健康记录(EHR),为解决上述问题提供可能。


研究思路

数据提取:从 UCSF 医疗中心提取2013-2022 年 3788 份肝硬化相关出院小结,基于OMOP 编码分为肝硬化、肝性脑病、腹水等 5 类队列。双轨验证设计: 金标准:随机抽取 5%-10% 病例进行手动 chart review,由资深医生校正。LLM 方法:使用GPT-4-turbo-128k 设计零-shot 提示,识别出院小结中“活动性”病情,对比手动 review 计算准确性(Accuracy、PPV 等)。规模化评估编码性能:以 LLM 分类为“银标准”,计算传统 OMOP 编码在全部 3788 份小结中的 PPV,评估编码可靠性。

图片


研究亮点

方法学突破:首次在肝病领域将 GPT-4 作为“银标准”规模化评估诊断编码性能,替代部分手动 review。临床价值:证明 LLM 可准确区分肝硬化并发症的“活动性”(Accuracy 87.8%-98.8%),为 EHR 数据的高效利用提供技术支撑。成本效益:LLM 单例分析成本仅 0.05 美元,显著低于手动 review,为大规模队列研究提供经济可行的方案。


数据来源和生物信息方法

1、数据来源

数据来源:UCSF 医疗中心 2013-2022 年肝硬化患者的电子健康记录(EHR),包含 3788 份出院小结,涉及 2747 例患者。

2、生物信息方法

GPT-4 部署:通过 UCSF 合规的 Versa API 调用 GPT-4-turbo-128k,使用零-shot 提示工程,温度参数调优至 0.0 和 0.7。提示工程:设计 5 组针对性提示,识别肝硬化及 4 种并发症的活动性,如“请判断该患者在住院期间是否存在活动性肝性脑病,并说明临床管理措施”。统计分析。


主要结果

1、传统编码vs手动chart review(金标准)

肝硬化识别 PPV 为 82.2%;并发症中腹水 PPV 最高(72.8%),肝性脑病最低(41.7%)。小结:传统编码对肝硬化本身识别尚可,但对并发症(尤其是肝性脑病)准确性差,提示编码无法可靠反映“活动性”病情。

2、GPT-4vs手动chart review(金标准)

肝硬化识别Accuracy 最高达 98.8%(温度 0.0),PPV 98.9%;肝性脑病 Accuracy 96.3%(温度 0.7),腹水 PPV 达 100%(温度 0.0 和 0.7);胃肠道出血与自发性细菌性腹膜炎 Accuracy 分别为 87.8% 和 90.7%。小结:GPT-4 对肝硬化及并发症的“活动性”识别准确性显著高于传统编码,尤其在腹水等场景中接近完美(PPV 100%)。

3、传统编码 vs GPT-4(银标准)

肝硬化PPV 79.8%;并发症PPV 53.9%-67.6%,其中肝性脑病(53.9%)和腹水(55.3%)仍较低。小结:以LLM为银标准,传统编码局限性进一步凸显,提示需结合NLP技术优化队列识别。

4、LLM 成本与效率分析

单例分析成本0.05 美元,总 token 消耗随病例数增加而线性增长(如肝硬化 3788 例消耗 1881 万tokens,成本 188.18 美元)。小结:LLM 方法兼具高效性与经济性,适合大规模队列研究。


研究结论

GPT-4等LLM可准确识别肝硬化及并发症的“活动性”(Accuracy 87.8%-98.8%),性能显著优于传统诊断编码。以LLM作为“银标准”可规模化评估编码性能,发现传统方法对并发症识别的不足。LLM方法成本低、可扩展,有望替代部分手动chart review,成为临床研究队列识别的新标准。


研究的局限性和未来方向

局限性:手动review存在9.2%的校正率,本身可能引入误差;数据依赖OMOP编码提取,可能存在信息丢失;GPT-4的通用性有待外部队列验证。

未来方向:在不同医疗机构使用Llama 3、Claude等模型验证结果;应用LLM区分肝硬化病因;开发基于LLM的实时EHR数据标注工具。

感谢您的阅读,欢迎关注“生信学术纵览”。谢谢您的分享、点赞+在看!

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/87069.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python学习小结

bg:记录一下,怕忘了;先写一点,后面再补充。 1、没有方法重载 2、字段都是公共字段 3、都是类似C#中顶级语句的写法 4、对类的定义直接: class Student: 创建对象不需要new关键字,直接stu Student() 5、方…

QCustomPlot 中实现拖动区域放大‌与恢复

1、拖动区域放大‌ 在 QCustomPlot 中实现 ‌拖动区域放大‌(即通过鼠标左键拖动绘制矩形框选区域进行放大)的核心方法是设置 SelectionRectMode。具体操作步骤: 1‌)禁用拖动模式‌ 确保先关闭默认的图表拖动功能(否…

如何将文件从 iPhone 传输到闪存驱动器

您想将文件从 iPhone 或 iPad 传输到闪存盘进行备份吗?这是一个很好的决定,但您需要先了解一些实用的方法。虽然 Apple 生态系统在很大程度上是封闭的,但您可以使用一些实用工具将文件从 iPhone 或 iPad 传输到闪存盘。下文提供了这些行之有效…

互联网大厂Java求职面试:云原生架构与微服务设计中的复杂挑战

互联网大厂Java求职面试:云原生架构与微服务设计中的复杂挑战 面试官开场白 面试官(严肃模式开启):郑薪苦,欢迎来到我们的技术面试环节。我是本次面试的技术总监,接下来我们将围绕云原生架构、微服务设计、…

leetcode-hot-100 (链表)

1. 相交链表 题目链接:相交链表 题目描述:给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点,返回 null 。 解答: 其实这道题目我一开始没太看懂题目给…

Web前端基础之HTML

一、浏览器 火狐浏览器、谷歌浏览器(推荐)、IE浏览器 推荐谷歌浏览器原因: 1、简洁大方,打开速度快 2、开发者调试工具(右键空白处->检查,打开调试模式) 二、开发工具 核心IDE工具 Visual Studio Code (VS Code)‌ 微软开发…

11.TCP三次握手

TCP连接建立与传输 1.主机 A 与主机 B 使用 TCP 传输数据,A 是 TCP 客户,B 是 TCP 服务器。假设有512B 的数据要传输给 B,B 仅给 A 发送确认;A 的发送窗口 swnd 的尺寸为 100B,而 TCP 数据报文段每次也携带…

Python 爬虫入门 Day 3 - 实现爬虫多页抓取与翻页逻辑

Python 第二阶段 - 爬虫入门 🎯 今日目标 掌握网页分页的原理和定位“下一页”的链接能编写循环逻辑自动翻页抓取内容将多页抓取整合到爬虫系统中 📘 学习内容详解 🔁 网页分页逻辑介绍 以 quotes.toscrape.com 为例: 首页链…

分布式定时任务系列12:XXL-job的任务触发为什么是死循环?

传送门 分布式定时任务系列1:XXL-job安装 分布式定时任务系列2:XXL-job使用 分布式定时任务系列3:任务执行引擎设计 分布式定时任务系列4:任务执行引擎设计续 分布式定时任务系列5:XXL-job中blockingQueue的应用 …

位运算详解之异或运算的奇妙操作

位运算详解之异或运算的奇妙操作 一、异或运算的本质与核心性质1.1 异或运算的定义与逻辑规则1.2 异或运算的核心代数性质(1)自反性:a ^ a 0(2)恒等性:a ^ 0 a(3)交换律&#xff1…

Element Plus 去除下拉菜单周黑边

问题: 如上图所示,当鼠标移入(hover)和点击时就会围绕一圈黑色边框,但通过本文的方案 100% 完美解决。 解决方案: :deep(:focus-visible) {outline: none; } 备用方案 :deep(.el-tooltip__trigger:focus-visible) …

React Native 项目实战 —— 记账本应用开发指南

React Native 项目实战 —— 记账本应用开发指南 项目概述:本文将指导您使用 React Native 开发一个简单的记账本应用,帮助用户记录收入和支出。核心内容:我们将分析功能模块、设计接口、划分组件结构、管理数据流、实现页面跳转&#xff0c…

从 PPO、DPO 到 GRPO:大语言模型策略优化算法解析

从 PPO、DPO 到 GRPO:大语言模型策略优化算法解析 背景与简介 大语言模型(LLM)的训练通常分为预训练和后训练两个阶段。预训练阶段,模型在海量文本上学习下一词预测的能力;后训练阶段,我们希望进一步对齐…

React中使用Day.js指南

文章目录 引言什么是Day.js?Day.js的核心特性 安装和基础配置安装Day.js基础导入和使用 在React中的基础使用1. 显示格式化日期2. 实时时钟组件 常用插件配置1. 相对时间插件2. 高级格式化插件3. 时区处理插件 实战案例:博客文章时间组件高级应用场景1. …

【系统设计【1】】系统设计面试方法论:从0到百万用户的需求到架构的推演

文章目录 一、系统设计面试的底层逻辑:从需求到架构的推演(一)需求澄清:界定问题边界(二)分层设计:从单节点到分布式的演进1. Web层:无状态化与负载均衡2. 数据层:数据库…

京津冀城市群13城市空间权重0-1矩阵

京津冀城市群13城市空间权重0-1矩阵 1、数据说明:京津冀13个城市:北京市、保定市、沧州市、承德市、邯郸市、衡水市、廊坊市、秦皇岛市、石家庄市、唐山市、邢台市、张家口市、天津市、 2、指标解释:空间权重矩阵是一种用于表征空间表达式的…

七大技术路线解析:自动驾驶如何被数据重新定义

自动驾驶技术从实验室的算法验证走向大规模量产应用,是一场充满挑战的征程。这段征程的核心驱动力,不仅是芯片和传感器的升级,更是一场关于数据的“喂养”竞赛——从简单的像素标注到多模态大模型的理解,数据需求的演变悄然推动着…

计网复习知识(16)传输层及其协议功能

目录 考研大纲 1.传输层概述 端口号 有连接/无连接传输 可靠/不可靠传输 2.UDP协议 2.1 udp数据报 2.2 udp检验 3.TCP协议 3.1 TCP协议的框架梳理 3.2 TCP报文段**** 3.3 三次握手与四次挥手 三次握手 四次挥手 3.4 可靠传输与流量控制 流量控制:滑动…

每天一个前端小知识 Day 1

语义化 HTML&#xff08;Semantic HTML&#xff09; 1. 什么是语义化 HTML&#xff1f; 语义化 HTML 指的是使用符合内容含义的标签&#xff0c;而不仅仅为了布局或样式。例如&#xff1a; <article>…</article> <nav>…</nav> <header>…&l…

在docker中部署mysql

部署 MySQL&#xff08;端口 9006&#xff09; 1. 创建数据目录 mkdir -p ~/qihuang/mysql/data2. 启动 MySQL 容器 docker run -d \--name mysql-qihuang \-p 9006:3306 \-v ~/qihuang/mysql/data:/var/lib/mysql \-e MYSQL_ROOT_PASSWORDroot \-e MYSQL_DATABASEqihuangdb…