阅读笔记——理解什么是LLM大语言模型

阅读笔记——理解什么是LLM大语言模型

web/2025/8/4 14:23:50/文章来源:https://blog.csdn.net/2302_80723133/article/details/148291421

阅读笔记：
理解LLM
deepseek创新了什么
什么是多模态

什么是token

定义：Token是LLM处理文本的最小单位，相当于语言的"原子"
类比：
中文：1个token ≈ 1个汉字或常见词（如"模型"可能为1个token）
英文：1个token ≈ 4个字母（如"apple"可能拆为"app"+“le”）

每个token都会在模型中生成三个核心向量
在这里插入图片描述
○ Q 是查询向量

○ K 是线索向量

○ V 是答案向量

候选token：在自注意力机制中，候选token 是指当前token在计算注意力权重时，所有可能与之发生交互的其他token。

api

大语言模型的本质就是文字接龙 , 相对应的使用大模型也比较简单. 可以参见deepseek的文字接龙 api 请求:
在这里插入图片描述

tools 工具支持：

大模型对 function calling 的支持，即大模型可以调用各种外部工具

为什么说LLM是无状态的

LLM有自注意力机制能动态关联上下文（通过Q/K/V向量），但LLM却被认为无状态。这看似矛盾，实则反映了不同层级的特性：
在这里插入图片描述
这时候就有一个问题，既然LLM是无状态的，不能记住跨序列的多次输入，那么LLM是如何持续关联一个对话的上下文的？——增加一个外部记忆库（传统方案是增大一个序列的max_length）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/web/81629.shtml
繁体地址，请注明出处：http://hk.pswp.cn/web/81629.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

(自用)Java学习-5.14(注册，盐值加密，模糊查询)

(自用)Java学习-5.14(注册，盐值加密，模糊查询)

一、核心功能实现 1. 用户注册功能前端实现用户名实时校验：通过AJAX异步请求检查用户名是否已存在。 function checkName() {$.ajax({url: /users/checkUserName?uname uname,success: function(resp) {if (resp.code 200) alert("用户名可用");el…

阅读更多...

【杂谈】STM32使用快速傅里叶变换库函数后如何比较准确地找到n次谐波幅值

【杂谈】STM32使用快速傅里叶变换库函数后如何比较准确地找到n次谐波幅值

目录 1.简单介绍傅里叶变换的作用 2.谐波是什么 3.解决方法 1.简单介绍傅里叶变换的作用任何复杂的波形归根结底都是由多个频率和相位不一样的正弦波组成的通过傅里叶变换可以找到组成一个复杂的波形的所有正弦波的频率和幅度信息 2.谐波是什么假设有一个复杂的波形&a…

阅读更多...

芯科科技推出首批第三代无线开发平台SoC，高度集成的解决方案推动下一波物联网实现突破

芯科科技推出首批第三代无线开发平台SoC，高度集成的解决方案推动下一波物联网实现突破

SiXG301和SiXG302是芯科科技采用22纳米工艺节点推出的首批无线SoC系列产品，在计算能力、功效、集成度和安全性方面实现突破性进展低功耗无线解决方案领导性创新厂商Silicon Labs（亦称“芯科科技”，NASDAQ：SLAB）近日宣…

阅读更多...

写作即是生活

写作即是生活

一个问题 “我是什么时候开始写作的呢？”请你先暂停一下，别往下读，先想想这个问题。什么才是写作？ 或许在想上个问题之后，你就会开始想问另外一个问题，什么才算是写作呢？ 我的回答是&#x…

阅读更多...

SpringBoot 执行Lua脚本服务端执行减少性能损耗优化性能优化连接性能

SpringBoot 执行Lua脚本服务端执行减少性能损耗优化性能优化连接性能

介绍通过 Redis 执行 Lua 脚本时，所有的操作都在服务器端完成，而不是多次通过网络进行请求。这可以显著减少网络延迟，尤其是在需要多次与 Redis 交互的场景中。多个操作可以在 Lua 脚本中组合成一个操作，而不是分多次请求&#…

阅读更多...

Nginx代理、缓存与Rewrite

Nginx代理、缓存与Rewrite

目录一、正向代理 （一）核心概念与应用场景 （二）Nginx正向代理编译安装（以OpenEuler为例） （三）验证正向代理二、反向代理 （一）七层代理（HT…

阅读更多...

PortSwigger-02-XXE

PortSwigger-02-XXE

一：漏洞原理 1、XXE XXE全称xml外部实体注入 XML：是一种用于标记电子文件使其具有结构性的标记语言，提供统一的方法来描述和交换独立于应用程序或者供应商的结构化数据，它可以用来标记数据，定义数据类型、是一种允许…

阅读更多...

常规算法学习

常规算法学习

算法 1. 排序算法1. 归并排序1.1 普通归并排序1.2 优化后的归并排序（TimSort） 2. 插入排序2.1 直接插入排序2.2 二分插入排序2.3 成对插入排序 3. 快速排序3.1 单轴快速排序3.2 双轴快排 4. 计数排序 2. 树1. 红黑树（Red Black Tree&#xff…

阅读更多...

关于线程死锁的相关知识

关于线程死锁的相关知识

前言今天学习了线程死锁的相关知识。线程死锁是非常重要的知识，写成博客，加深自己对于知识的理解。线程死锁结语希望可以帮助到大家~

阅读更多...

EMQX启用单向认证的SSl/TLS连接的配置步骤

EMQX启用单向认证的SSl/TLS连接的配置步骤

先确保您已经安装了 OpenSSL 执行openssl version -a 获取 openssl.cnf 目录生成自签名服务端证书 CA 证书生成 server-ca.crt openssl req \-new \-newkey rsa:2048 \-days 365 \-nodes \-x509 \-subj "/CCN/OEMQ Technologies Co., Ltd/CNEMQ CA" \-keyout s…

阅读更多...

依赖nacos实例动态创建线程池并监听服务上下线

依赖nacos实例动态创建线程池并监听服务上下线

版本 Spring Booot 版本 3.2.4Spring Cloud 版本 2023.0.1Spring Cloud Alibaba 版本 2023.0.1.2 依赖 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId> </depe…

阅读更多...

全面指南：使用Node.js和Python连接与操作MongoDB

全面指南：使用Node.js和Python连接与操作MongoDB

在现代Web开发中，数据库是存储和管理数据的核心组件。MongoDB作为一款流行的NoSQL数据库，以其灵活的数据模型、高性能和易扩展性广受开发者欢迎。无论是使用Node.js还是Python，MongoDB都提供了强大的官方驱动和第三方库，使得数据库…

阅读更多...

LeetCode 3068.最大节点价值之和：脑筋急转弯+动态规划（O(1)空间）

LeetCode 3068.最大节点价值之和：脑筋急转弯+动态规划（O(1)空间）

【LetMeFly】3068.最大节点价值之和：脑筋急转弯动态规划（O(1)空间） 力扣题目链接：https://leetcode.cn/problems/find-the-maximum-sum-of-node-values/ 给你一棵 n 个节点的无向树，节点从 0 到 n - 1 编号。树以长…

阅读更多...

HTTPS加密通信详解及在Spring Boot中的实现

HTTPS加密通信详解及在Spring Boot中的实现

HTTPS（Hyper Text Transfer Protocol Secure）是HTTP的安全版本，通过SSL/TLS协议为通讯提供加密、身份验证和数据完整性保护。一、HTTPS核心原理 1.加密流程概述客户端发起HTTPS请求（连接到服务器443端口）服务器返…

阅读更多...

解决线程安全问题

解决线程安全问题

前言昨天学习了如何去解决线程不安全的问题。一般方法都是通过加锁来处理，跟大家分享一波。解决线程安全问题结语希望可以帮助到大家~ byebye

阅读更多...

网络常识：网线和光纤的区别

网络常识：网线和光纤的区别

网络常识：网线和光纤的区别一. 介绍二. 网线2.1 什么是网线？2.2 网线的主要类别2.3 网线的优势2.4 网线的劣势三. 光纤3.1 什么是光纤？3.2 光纤的主要类别3.3 光纤的优势3.4 光纤的劣势四. 网线 vs 光纤：谁更适合你&#xff1f…

阅读更多...

win11 禁用/恢复内置笔记本键盘（保证管用）

win11 禁用/恢复内置笔记本键盘（保证管用）

文章目录禁用启用禁用 1）按下 win x，点击设备管理器 2）拔掉所有笔记本外设（一定要都拔掉，不然后面禁用设备会混淆），然后右键点击键盘 > HID Keyboard Device 2）点击更新…

阅读更多...

Three.js搭建小米SU7三维汽车实战（5）su7登场

Three.js搭建小米SU7三维汽车实战（5）su7登场

汽车模型加载我们在sktechfab上下载的汽车是glb的文件格式，所以使用gltfLoader进行加载。这里将小车直接加载进来看看效果； import { GLTFLoader } from "three/addons/loaders/GLTFLoader.js"; ....其余代码省略 const gltfLoader new GLT…

阅读更多...

ETL怎么实现多流自定义合并？

ETL怎么实现多流自定义合并？

随着信息技术的迅猛发展以及数据生成环境的多样化，互联网、物联网和社交媒体的广泛应用导致各种设备和平台不断产生大量数据，需要整合这些数据，从而进行数据融合。数据集成和管理平台ETLCloud，主要用于支持数据的抽取（…

阅读更多...

数据结构- 10种常见树：二叉树、平衡二叉树、完全二叉树

数据结构- 10种常见树：二叉树、平衡二叉树、完全二叉树

一、树树型结构是一类重要的非线性数据结构。其中以树和二叉树最为常用，直观看来，树是以分支关系定义的层次结构。把它叫做“树”是因为它常看起来像一棵倒挂的树，也就是说它常是根朝上，而叶朝下的。 1.树的定义： 树…

阅读更多...

最新文章