003大模型基础知识

大模型分类:
技术架构: Encoder Only Bert
Decoder Only 著名的大模型都是
Encoder - Decoder T5
是否开源: 开源阵营: Llama DeepSeek Qwen
闭源阵营: ChatGpt Gemini Claude

语言模型发展阶段: 基于规则统计 n-gram:上下文比较短,数据稀疏,泛化能力差
神经网络语言模型:泛化能力差(解决) 数据稀疏(解决) RNN,LSTM
Transformer: Bert,GPT
LLM:参数以 10 亿计
评估指标: BLEU 精准率,需要有参考答案
ROUGE 召回率 需要有参考答案
PPL
大模型演进路线: Encoder-only 双向注意力机制,完形填空,阅读理解,Pre-train+下游任务fine-tuning
Decoder-only gpt:
gpt2:
gpt3:
Encoder-Decoder : T5


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
RLHF解决的是什么问题? 对齐问题,训练一个奖励模型

在这里插入图片描述
位置编码:
在这里插入图片描述

总结:

强化学习:
ChatGPT SFT :人类价值观对齐,
RLHF: 训练奖励模型, 人的参与是为了准备训练奖励模型的语料
强化学习:Agent,Environment,state,Policy,Reward
PPO:

不同大模型的差异:
位置编码: 传统Transformer,相对位置编码,旋转位置编码(用的最多),ALiBi
注意力机制:
LN:层归一化:
前馈神经网络:MOE

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/89012.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/89012.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM监控及诊断工具-GUI篇

19.1. 工具概述 使用上一章命令行工具或组合能帮您获取目标Java应用性能相关的基础信息,但它们存在下列局限: 1.无法获取方法级别的分析数据,如方法间的调用关系、各方法的调用次数和调用时间等(这对定位应用性能瓶颈…

适用于Windows系统截图工具

1.Faststone Capture 官网网址:https://faststone-capture.com/ 网上很多注册码:https://www.cnblogs.com/LiuYanYGZ/p/16839503.html 2.Snipaste 官网网址:https://apps.microsoft.com/detail/9p1wxpkb68kx?launchtrue&modefull&…

区块链的三种共识机制——PoW、PoS和DPoS原理

区块链的核心是去中心化网络的信任机制,而共识机制是实现这一目标的关键。共识机制可分为两个阶段:(1)提出共识内容(2)对内容达成共识(遵循最长链原则)。三种主流的共识机制主要有工…

React 和 Vue的自定义Hooks是如何实现的,如何创建自定义钩子

目的:将公共逻辑提取出来,类似于 mixin,解决了mixin的设计缺陷。 React 和 Vue 自定义 Hooks 实现对比 React 自定义 Hooks React 的自定义 Hooks 是 JavaScript 函数,它们以 use 开头,可以调用其他 Hooks。 基本规则 …

构建高效事件驱动架构:AWS S3与SQS集成实践指南

引言 在现代云架构中,事件驱动的设计模式越来越受到开发者的青睐。AWS S3与SQS的集成为我们提供了一个强大的事件处理机制,能够在文件上传、删除或修改时自动触发后续的业务逻辑。本文将详细介绍如何配置S3事件通知到SQS队列,并分享实际项目中的最佳实践。 架构概述 S3事…

C++ -- STL-- List

////// 欢迎来到 aramae 的博客,愿 Bug 远离,好运常伴! ////// 博主的Gitee地址:阿拉美 (aramae) - Gitee.com 时代不会辜负长期主义者,愿每一个努力的人都能达到理想的彼岸。1. list的介绍及使用 2. list的深度剖…

rt-thread 线程间同步方法详解

rt-thread 线程间同步方法详解一、什么是线程间同步线程同步的必要性线程同步的挑战二、同步方式1、信号量信号量工作机制信号量的管理方式信号量的创建与删除信号量的获取与释放信号量的典型应用场景信号量的注意事项2、互斥量互斥量工作机制互斥量的特性互斥量的操作接口互斥…

Spring Boot + Vue2 实现腾讯云 COS 文件上传:从零搭建分片上传系统

目录 一、项目目标 二、腾讯云 COS 基本配置 1. 创建存储桶 2. 获取 API 密钥 3. 设置跨域规则(CORS) 三、后端(Spring Boot)实现 1. 依赖配置 2. 配置腾讯云 COS(application.yml) 3. 初始化 COS…

使用 Java 获取 PDF 页面信息(页数、尺寸、旋转角度、方向、标签与边框)

目录 引言 一、安装和引入PDF处理库 二、获取 PDF 页数 三、获取页面尺寸(宽高) 四、获取页面旋转角度 五、判断页面方向(横向 / 纵向) 六、获取页面标签 七、获取页面边框信息 八、总结 引言 了解 PDF 页面属性是我们在…

基于 AI 的大前端安全态势感知与应急响应体系建设

大前端应用(Web、APP、小程序)作为用户交互的入口,面临日益复杂的安全威胁:从传统的 XSS 攻击、CSRF 伪造,到新型的供应链投毒、AI 驱动的自动化爬虫,再到针对业务逻辑的欺诈攻击(如薅羊毛、账号…

Java 与 MySQL 性能优化:MySQL全文检索查询优化实践

文章目录一、引言二、InnoDB引擎下的全文检索功能详解2.1 全文索引的基本概念与原理2.2 全文索引的创建与管理2.3 全文检索的三种查询模式2.4 中文全文检索的挑战与解决方案三、CMS 场景下的全文检索性能瓶颈分析3.1 索引构建与维护开销3.2 查询性能瓶颈3.3 锁机制与并发性能问…

应用软件格式渗透 利用word去渗透(MS10-087)

用到的靶机为:WinXP漏洞原理:一、漏洞触发机制与核心组件 漏洞根源:RTF文件解析逻辑缺陷 触发组件:Microsoft Word的RTF(Rich Text Format)解析引擎,具体涉及 mso.dll 模块中的 路径规范化函数&…

解密AWS VPC路由表:显式关联与隐式关联,谁决定了网络出口?

大家好,今天我们来聊一个在 AWS 云计算世界里既基础又关键的话题:VPC 路由表。 很多刚接触 AWS 的朋友,在配置网络时可能会遇到这样的困惑:为什么我的 EC2 实例无法访问互联网?为什么某些子网的网络策略和其他子网不一…

LeetCode题解---<203.移除链表元素>

文章目录题目代码及注释关键点题目 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1: 输入:head [1,2,6,3,4,5,6], val 6 输出:[1,2,3,4,…

【JavaScript高级】构造函数、原型链与数据处理

目录构造函数和原型构造函数实例成员和静态成员构造函数的问题构造函数原型 prototype对象原型 \_\_proto\_\_constructor 构造函数构造函数、实例、原型对象三者之间的关系原型链JavaScript 的成员查找机制(规则)原型对象的this指向扩展内置对象继承cal…

项目进度与预算脱节,如何进行同步管理

项目进度与预算脱节会导致资源浪费、成本超支和项目延期。进行同步管理的方法包括:建立统一的项目进度预算管理体系、实施实时监控与反馈机制、采用项目管理工具辅助同步管理。尤其是实施实时监控与反馈机制,通过持续监测进度与预算的匹配情况&#xff0…

TCP半关闭

理解TCP半关闭:像水管一样的网络连接控制 从全关闭到半关闭:为什么需要这种机制? 想象你和朋友正在通电话讨论一个重要项目: 全关闭:就像突然挂断电话,双方都无法再说话半关闭:你说"我说完…

衡石科技技术手册--仪表盘过滤控件详解

过滤控件说明 过滤控件 的定义 过滤控件用于在仪表盘中过滤图表数据,分为仪表盘内过滤控件和全局过滤控件。 过滤控件结构说明 字段类型描述uidSTRING过滤控件唯一识别 idappIdLONG过滤控件所属的应用 iddataAppIdLONG字段来源是数据包时的数据包 iddashboar…

ASP.NET Core中数据绑定原理实现详解

在ASP.NET Core 中,数据绑定是将 HTTP 请求中的数据(如表单、查询字符串、请求体等)映射到控制器动作方法参数或模型对象的过程。以下将从原理、核心组件、执行流程及关键机制等方面详细解析其实现逻辑。 一、数据绑定的核心原理与组件 1. 数…

牛客:HJ24 合唱队[华为机考][最长递增子集][动态规划]

学习要点 求最长递增字列求最长递减子列 题目链接 合唱队_牛客题霸_牛客网 题目描述 解法&#xff1a;动归求最长递增子列 #include <iostream> #include <vector> using namespace std;int main() {int n;while (cin >> n) {// 输入的数组int tmp;vect…