使用ESM3蛋白质语言模型进行快速大规模结构预测

文章目录

  • ESM3介绍
  • ESM3在线使用
  • 本地使用api批量预测
  • ESM相较于AlphaFold的优势


ESM3介绍

ESM3是由EvolutionaryScale(前Meta团队)开发的一款蛋白质大语言模型,于2025年以《用语言模型模拟 5 亿年的进化》为题正式发表在Science上
文章链接: https://www.science.org/doi/10.1126/science.ads0018
在这里插入图片描述

文章展示了一个例子,如何用ESM3设计新型绿色荧光蛋白(GFP),设计出的新蛋白与自然界中最相近的序列相比也仅有58%的相似度,证明该模型在拓展蛋白质新编码空间上具有巨大潜力。

尽管该science论文主推ESM3的蛋白质设计功能,本文仅介绍如何使用ESM3的蛋白质结构预测功能


ESM3在线使用

使用EvolutionaryScale的在线网站可以预测结构、生成新蛋白,速度非常快,500个氨基酸左右的蛋白结构基本几秒内就可以给出,比AlphaFold3快不少

链接: https://forge.evolutionaryscale.ai/tools/predict
在这里插入图片描述
注意非商业使用需要通过学术机构后缀的邮箱来申请

本地使用api批量预测

如果你不想下载那些很大的权重文件到本地,或者你没有算力足够的机器来运行,可以使用官方提供的api来进行批量预测

首先需要在你的电脑上安装esm3,非常简单,只需要

pip install esm

即可安装

安装完毕后在EvolutionaryScale上获取你的api keys

在这里插入图片描述

在下面填入你 EvolutionaryScale的token即可,两个都是可以免费获取的


from esm.sdk import client
from esm.sdk.api import ESM3InferenceClient, ESMProtein, GenerationConfigmodel: ESM3InferenceClient = client("esm3-large-2024-03", token="<your evolutionary token>")sequence= "MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN"
# 替换为你感兴趣的蛋白序列protein = ESMProtein(sequence=sequence)protein = model.generate(protein, GenerationConfig(track="structure", num_steps=8,temperature=0.1))
protein.to_pdb("./predict.pdb")

使用EvolutionarySclae的api时可以有以下几种模型进行选择,替换client的模型名称即可:
在这里插入图片描述

同时预测时num_steps和temperature参数都是可调的,num_steps越多消耗的tokens数也越多

每日默认总积分数只有10分,在Credits处可查
在这里插入图片描述

可以通过填写一下表格申请到每日100个credits,填了一下发现几分钟就给通过了,估计也没有人工审批

ESM相较于AlphaFold的优势

之前一直想做大规模蛋白质结构预测,尽管ColabFold和AlphaFold 3都已经公开可用,但这两个模型都需要进行多序列比对,而这一步在部署到本地后十分耗时,之前本人尝试过结果表明一个200氨基酸左右的序列需要近20分钟才能预测完成。

相比之下,如今使用ESM3每个蛋白预测时间在num_steps数设置合适的时候半分钟不到就可以预测完成,极大提高效率。而Credits限制的问题可以通过开多个账号或者本地部署ESM3模型来解决,比解决AlphaFold MSA的问题方便多了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/90947.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/90947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PostgreSQL 时间/日期管理详解

PostgreSQL 时间/日期管理详解 引言 PostgreSQL是一款功能强大的开源关系型数据库管理系统&#xff0c;在时间/日期管理方面具有独特的优势。本文将详细介绍PostgreSQL中时间/日期数据类型及其相关功能&#xff0c;帮助读者更好地理解和应用时间/日期管理。 时间/日期数据类型 …

Agent篇

Agent包含哪些模块&#xff0c;实现了什么功能Agent 就像一个多功能的接口&#xff0c;它能够接触并使用一套工具。根据用户的输入&#xff0c;Agent会规划出一条解决用户问题的路线&#xff0c;决定其中需要调用哪些工具&#xff0c;并调用这些工具。Agent 大语言模型规划记忆…

利用 MySQL 进行数据清洗

利用 MySQL 进行数据清洗是数据预处理的重要环节&#xff0c;以下是常见的数据清洗操作及对应 SQL 示例&#xff1a;1. 去除重复数据使用 ROW_NUMBER() 或 GROUP BY 识别并删除重复记录。-- 查找重复记录&#xff08;以 user_id 和 email 为例&#xff09; WITH Duplicates AS …

【MySQL笔记】事务的ACID特性与隔离级别

目录1. 什么是事务&#xff1f;2. 事务的ACID特性&#xff08;重要&#xff09;3. 事务控制语法4. 隔离级别与并发问题1. 什么是事务&#xff1f; 事务&#xff08;Transaction&#xff09;是由一组SQL语句组成的逻辑单元&#xff0c;这些操作要么全部成功&#xff0c;要么全部…

Mock 数据的生成与使用全景详解

Mock 数据的生成与使用全景详解 在后端开发过程中,真实数据往往受限于业务进度、隐私保护或接口未完成等因素,无法及时获取。这时,Mock数据(模拟数据)就成为开发、测试、联调不可或缺的利器。本文将从Mock数据的意义、常用场景、主流工具、实战案例到最佳实践,带你全面掌…

HTML 标题标签

需求&#xff1a;在网页显示六级标题标签。代码&#xff1a;//需求&#xff1a;在网页显示六级标题标签。 <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title></head><body><h1>一级标题&l…

(限免!!!)全国青少年信息素养大赛-算法创意实践挑战赛小学组复赛(代码版)

选择题部分在 C 中&#xff0c;以下代表布尔类型的是&#xff08;  &#xff09;选项&#xff1a;A. double B. bool C. int D. char答案&#xff1a;B解析&#xff1a;C 中布尔类型的关键字为bool&#xff0c;用于存储逻辑值true或false。执行以下程序&#xff0c;输出的…

编译器优化——LLVM IR,零基础入门

编译器优化——LLVM IR&#xff0c;零基础入门 对于大多数C开发者而言&#xff0c;我们的代码从人类可读的文本到机器可执行的二进制文件&#xff0c;中间经历的过程如同一个黑箱。我们依赖编译器&#xff08;如GCC, Clang, MSVC&#xff09;来完成这项复杂的转换。然而&#x…

react中为啥使用剪头函数

在 React 中使用箭头函数&#xff08;>&#xff09;主要有以下几个原因&#xff1a;1. 自动绑定 this传统函数的问题&#xff1a;在类组件中&#xff0c;普通函数的this指向会根据调用方式变化&#xff0c;导致在事件处理函数中无法正确访问组件实例&#xff08;this为undef…

JavaSE-多态

多态的概念在完成某个行为时&#xff0c;不同的对象在完成时会呈现出不同的状态。比如&#xff1a;动物都会吃饭&#xff0c;而猫和狗都是动物&#xff0c;猫在完成吃饭行为时吃猫粮&#xff0c;狗在完成吃饭行为时吃狗粮&#xff0c;猫和狗都会叫&#xff0c;狗在完成这个行为…

TDengine 使用最佳实践(2)

TDengine 使用最佳实践&#xff08;1&#xff09; 安装部署 目录规划 软件安装 参数配置 时钟同步 验证环境 集群部署 写入查询 连接方式 数据写入 数据查询 运维巡检 运维规范 数据库启停 状态检查 运维技巧 日常巡检 数据库升级 故障排查 故障定位 日志调试 故障反馈 关于 T…

如何通过公网IP访问部署在kubernetes中的服务?

背景说明我们有些私有化部署的项目&#xff0c;使用k8s来承载服务&#xff0c;通过ingress-nginx转发外部的请求到集群。有时候业主的域名没有申请下来&#xff0c;我们会配置临时的域名&#xff0c;测试同事配置主机hosts来完成功能验证&#xff0c;等功能验证完毕后&#xff…

Datawhale AI 夏令营2025科大讯飞AI大赛<夏令营:用AI做带货视频评论分析>

赛题题目 任务一&#xff1a;商品识别 基于视频内容识别对应的商品 【情感分析】对评论文本进行多维度情感分析&#xff0c;涵盖维度见数据说明&#xff1b; 任务二&#xff08;文本分类&#xff09;&#xff1a;从非结构化评论中提取情感倾向 评论聚类】按商品对归属指定维度的…

AI 时代的分布式多模态数据处理实践:我的 ODPS 实践之旅、思考与展望

AI 时代的分布式多模态数据处理实践&#xff1a;我的 ODPS 实践之旅、思考与展望 &#x1f31f;嗨&#xff0c;我是LucianaiB&#xff01; &#x1f30d; 总有人间一两风&#xff0c;填我十万八千梦。 &#x1f680; 路漫漫其修远兮&#xff0c;吾将上下而求索。 目录 1. 什…

硬件工程师笔试面试高频考点汇总——(2025版)

目录 1 电子器件部分 1.1 电阻 1.1.1 电阻选型时一般从哪几个方面进行考虑? 1.1.2 上拉下拉电阻的作用 1.1.3 PTC热敏电阻作为电源电路保险丝的工作原理 1.1.4 如果阻抗不匹配&#xff0c;有哪些后果 1.1.5 电阻、电容和电感0402、0603和0805封装的含义 1.1.6 电阻、电…

华为HarmonyOS 5.0深度解析:跨设备算力池技术白皮书(2025全场景智慧中枢)

​​摘要​​HarmonyOS 5.0的​​跨设备算力池技术​​正在重构终端计算范式。本文首次系统性拆解其技术内核&#xff1a;通过​​异构硬件资源虚拟化​​、​​任务流图调度引擎​​、​​确定性时延网络​​三大支柱&#xff0c;实现手机、汽车、智慧屏等设备的算力动态聚合与…

ASP.NET Core 中的延迟注入:原理与实践

在软件开发中&#xff0c;依赖注入已成为构建可维护、可测试和可扩展应用程序的核心模式。ASP.NET Core 内置的依赖注入容器为我们管理服务生命周期提供了极大的便利。然而在某些特定场景下&#xff0c;我们可能不希望某个依赖项在宿主对象被创建时立即实例化&#xff0c;而是希…

PHP内存溢出问题的深度分析与系统解决方案

文章目录一、问题本质&#xff1a;什么是PHP内存溢出&#xff1f;内存管理核心原理二、高频内存溢出场景深度解析场景1&#xff1a;大数据集不当处理场景2&#xff1a;无限递归陷阱场景3&#xff1a;实体关系映射&#xff08;ORM&#xff09;的N1问题场景4&#xff1a;未及时释…

常见 HTTP 方法的成功状态码200,204,202,201

HTTP 协议中&#xff0c;操作成功后的状态码选择取决于操作类型和响应内容&#xff0c;并非所有非 GET/POST 请求都返回 204。以下是常见 HTTP 方法的成功状态码规范&#xff1a;1. GET200 OK&#xff1a;默认成功状态码&#xff0c;表示请求成功且返回了资源内容。206 Partial…

【论文阅读】Think Only When You Need with Large Hybrid-Reasoning Models

Think Only When You Need with Large Hybrid-Reasoning Models2 Large Hybrid-Reasoning Models2.1 Problem Formulation关键定义与目标核心挑战与解决方案2.2 第一阶段&#xff1a;混合微调&#xff08;Hybrid Fine-Tuning, HFT&#xff09;核心设计数据构建数据集统计优化目…