【知识图谱构建系列6】:借了张显卡先跑着

文章目录

  • 前情提要
  • mistral模型
  • 运行代码


前情提要

之前咱对LLM4KGC的代码稍作修改,目标是用modelscope来下载模型。

现在这个代码终于能跑了。

前面咱说,我们的显卡只有6G的显存。现在呢,我也成功借到了A100的显卡。这下,咱可以先跑跑这个项目默认带的mistral模型。

mistral模型

Mistral 是由法国初创公司 Mistral AI 推出的开源大语言模型(LLM)系列,以高性能、轻量化设计和对开发者友好的开源策略著称。其核心特点及发展历程如下:

  1. 性能突破与高效架构

    • Mistral 7B(2023年10月发布)作为首个开源模型,仅 70亿参数 即在多项基准测试中超越 Llama 2 13B,甚至在推理和代码任务上优于 Llama 1 34B。其核心技术包括 分组查询注意力(GQA) 加速推理,以及 滑动窗口注意力(SWA) 支持长上下文(最高128K tokens)并降低计算成本。
    • Mistral Large 2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85832.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85832.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零开始手写redis(16)实现渐进式 rehash map

手写 Redis 系列 java从零手写实现redis(一)如何实现固定大小的缓存? java从零手写实现redis(三)redis expire 过期原理 java从零手写实现redis(三)内存数据如何重启不丢失? jav…

List、Queue、Deque、Stack常用方法总结

Java 中几个常见的线性数据结构的 方法总结与对比,包括: List(ArrayList、LinkedList)Queue(LinkedList、PriorityQueue)Deque(ArrayDeque、LinkedList)Stack(传统 Stac…

github为InfiniSynapse Docker提PR过程留档@Windows10

为InfiniSynapse Docker提了一个PR:修改阿里源为清华源,并不再安装PPA。 by skywalk163 Pull Request #1 chaozwn/infini_docker 整体操作 提PR的前置动作 先fork要提PR的项目git clone到本地用VSCode修改代码 提交PR git add . git commit -m &…

搭建加解密网站遇到的问题

本机向云服务器传输文件 用winscp 服务器在安装 SSH 服务时自动生成密钥对(公钥私钥) 为什么要有指纹验证? 防止中间人攻击(Man-in-the-Middle) 指纹验证打破这个攻击链: 小问题 安装python时 ./confi…

Docker高级管理--容器通信技术与数据持久化

第一节:容器通信技术 一:Docker 容器的网络模式 当项目大规模使用 Docker 时,容器通信的问题也就产生了。要解决容器通信问题,必须先了解很多关于网络的知识。Docker 的网络模式非常丰富,可以满足不同容器的通信要求&…

jsons.top工具之数组交集、去重

作为一名程序员,一款高效的 在线转换工具 (在线时间戳转换 计算器 字节单位转换 json格式化)必不可少!https://jsons.top 用js实现一个轻量级的集合运算工具,可以对数组、集合去重、求交并差集,找出两个集…

Vue3 + Tailwind CSS 后台管理系统教程

Vue3 搭配 Tailwind CSS 是构建现代后台管理系统的绝佳组合。Vue3 提供了高效的响应式框架,而 Tailwind CSS 则让样式编写变得快速且灵活。下面我将分步骤教你如何创建一个功能完整的后台管理系统。 第 1 步:创建项目 首先,我们需要使用 Vit…

ComfyUI遭“Pickai“C++后门攻击,全球700余台AI图像生成服务器沦陷

大规模AI基础设施遭遇定向攻击 网络安全研究机构XLab近日发现针对ComfyUI框架的活跃攻击活动。ComfyUI是当前广泛用于部署大型AI图像生成模型的开源框架。攻击者通过该框架漏洞植入名为Pickai的C后门程序,已导致全球近700台服务器失陷。中国国家网络安全通报中心于…

Unity_VR_如何用键鼠模拟VR输入_PICO项目配置

文章目录 [TOC] 一、创建项目1.直接创建VR核心模板(简单)2.创建3D核心模板导入XR包(并配置pico)(1)创建项目(2)导入PICO的SDK(3)启用 PICO XR 插件&#xff0…

站点天下--网站在线和SSL过期监控的可靠助手

简介 网站突然访问不了、HTTPS证书到期,如果不能及时发现,将蒙受损失~ 站点天下提供应用在线状态监控和SSL证书到期监控: 若访问不了或SSL证书即将到期,则立即发邮件通知!可以在线查看应用的在线状态和SSL证书到期时…

React setState原理

异步更新 原因 1设置为异步提升性能 如果setState每次调用直接执行,会造成 render 函数被频繁执行 ,页面重新被渲染 解决:异步批处理 2如果render函数未执行时,保证props和state一致性 拿到最新state的方法 法一:setState&…

汉代大模型:历史镜像与智能重构的深度对话

引言:当历史遇见人工智能 一件汉代陶俑的三维模型正通过增强现实技术向观众演绎农耕场景。这个看似寻常的文物活化案例,实则蕴含着人工智能与历史学交叉领域的前沿探索——汉代大模型。作为连接过去与未来的智能载体,汉代大模型不仅重构了我…

es向量检索里的efSearchc参数是干嘛用的

在Elasticsearch的向量检索中,ef_search(或efSearch)是控制HNSW近似最近邻(ANN)搜索精度与性能平衡的关键参数,其作用机制和影响如下: 🛠️ 一、核心作用 ef_search 限制底层图遍历…

Mac SSH终端操作工具 SecureCRT

SecureCRT Mac 是一款SSH终端工具,为计算专业人士提供高级会话管理工具。 也是一个功能强大且值得信赖的基于GUI的SHH和Telnet客户端,以及旨在提高工作效率并简化重复任务的终端仿真器。 借助SecureCRT mac版的帮助,您可以通过对ANSI&#…

UE5关卡快照

关卡快照(Level Snapshots) 使你能够在关卡的 世界大纲视图(World Outliner) 中保存 Actors 的特定配置,并立即将场景恢复到该状态。这样可以大幅简化复杂的设置,并避免对不同场景同一关卡的多个变体进行复…

Maven 或 Gradle 下载和添加 jar 文件的步骤

使用 Maven 或 Gradle 来自动下载和添加 jar 文件是管理 Java 项目依赖的最佳方式。 以下是如何使用 Maven 和 Gradle 来自动下载和添加 jar 文件的步骤: 使用 Maven # 创建一个 Maven 项目: mvn archetype:generate -DgroupIdcom.example -Dartifact…

JVM对象创建全流程解析

一、JVM对象创建流程 Ⅰ、类加载检查——JVM创建对象时先检查类是否加载 在虚拟机遇到new指令时,比如new关键字、对象克隆、对象序列化时,如下字节码 0: new #2 // class com/example/demo/Calculate检查指令的参数&#x…

深度学习从入门到精通:PyTorch实战与核心原理详解

掌握深度学习核心概念,玩转PyTorch框架,从理论到实战一站式学习指南 🚀 一、深度学习全景图 🌟 人工智能金字塔 🔍 深度学习核心优势 ​​优势​​​​劣势​​​​适用场景​​自动特征提取依赖大数据图像识别&…

计算机网络期末 物理层

目录 数据通信基础(理解) 传输介质(熟悉) 基带传输(熟悉) 数字编码(熟悉) 频带传输与调制解调(理解) 多路复用技术(了解) 物理层设备与极限速率(掌握) 数据通信基础(理解) 一堆概念 通信的类型 同步技术 传输介质(熟悉) 有线介质 同轴电缆 双绞线 光纤 无线介质 无线电…

力扣-139.单词拆分

题目描述 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。如果可以利用字典中出现的一个或多个单词拼接出 s 则返回 true。 注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。 class Solution {public boolean wordBrea…