【小白AI教程】大模型知识扫盲通识

目录

一、究竟什么是大模型

二、大模型的两大分支

2.1 在线大模型

2.2 开源大模型

2.3 大模型的应用

利用行业知识重新训练AI大模型

利用行业知识对AI大模型进行微调

利用行业知识建立知识库

三、Reasoning 大模型

3.1 基本概述

3.2 核心概念

3.3 技术实现

3.4 应用场景

3.5 总结


一、究竟什么是大模型

说了这么多大模型重要的因素,那么究竟什么是大模型?我们如何通俗的理解大模型这项伟大的AI技术呢?

我们可以把大模型类比生活场景中的各种“模具”:我们在生活中会使用到很多模具,比如制作雪糕的模具、蛋糕模具、爱心煎蛋的心形模具等等。我们是可以使用这些模具来更加简单便捷且快速地完成最终要制作的成品。

如果将其映射到数学上,就像是我们听到过的数学建模:比如,一位老师想计算班级100位同学的期末总成绩,那么根据学校本学期的要求,考试成绩占总成绩的70%,平成成绩占总成绩的30%,那么老师们只需要找到其中的运算规律就可以指定一个通用的模型来快速计算每一个学生的总成绩:总成绩y = (考试成绩x1 * 0.7) + (平时成绩x2 * 0.3),其中该方程式就是模型的算法,而0.7和0.3这个权重占比就是模型的参数。

大模型:LLM(Large Language Model)是指具有大量参数和复杂结构的机器学习模型。这些模型可以应用于处理大规模的数据和复杂的问题。“大模型”中的“大”是指模型的参数量非常大(百亿千亿级别)。相对来讲,参数量越大,则大模型的综合能力就越强。

二、大模型的两大分支

2.1 在线大模型

大模型本身是部署在云端,用户可以通过网络调用云端大模型相关的接口进行在线使用大模型相关的功能。

因此,在线大模型具备如下优势:在线模型普遍性能更强、使用的技术门槛和硬件门槛更低、配套模型生态和服务更加完善;

但是其弊端也同时存在:首先是数据安全问题,因为使用线上大模型必须通过网络进行数据传输,需要将本都数据传输给在线大模型,才可以基于大模型本身的能力对数据进行分析、处理和其他操作。但是一旦企业生产资料联网,就肯呢个会带来数据安全隐患,无法保障内容真实可信等诸多痛点的发生。还有就是,在线大模型的企业应用会产生长期的费用,在线大模型会根据调用次数或者按量进行计费,如果一旦使用频率和规避较大,则会产生较高的费用。最后一点就是在线大模型无法很好的定制化,也就是无法从训练语料进行定制化训练。

2.2 开源大模型

开源大模型是可以在本地设备上进行部署和使用的。相比与在线大模型,开源大模型可以使⽤更多微调框架进⾏模型微调,微调空间更⼤,更有可能快速完成定制化⼤模型训练;此外,数据可以直接本地训练模型,⽆需在线提交数据进⾏在线模型微调,数据安全也将更有保障;

但是,一般大模型的参数量级都会比较大,动不动就是几十亿、几百亿、几千亿的量级。因此本地部署,需要提供较高配置的硬件设备,该设备相对费用也不会太低。好在这是一次投资即可终身使用。

2.3 大模型的应用

随着人工智能技术的不断发展,AI大模型已经成为垂直行业应用的热点。

然而,AI大模型虽然功能强大,但在垂直行业应用中存在一些突出的问题,如缺乏特定行业领域的专有知识,尤其是深度知识、私有知识、保密知识等;还有就是输出内容很难精确控制;常常会出现幻觉(一本正经地胡说八道)等问题。

为解决这些问题,有三种在垂直行业中应用AI大模型的方法,包括重新训练、微调和知识库检索。

 

利用行业知识重新训练AI大模型

由于通用AI大模型缺乏行业专有知识,重新训练AI大模型成为一种可行的解决方案。

该方法的基本思想是,将行业相关的数据集和专业知识用于重新训练AI大模型,使其拥有行业特定的理解和知识。这样,AI大模型在垂直行业中的应用就能更好地理解和处理相关的任务和问题。

例如,在医疗领域中应用AI大模型时,可以利用医学文献、诊断报告和临床数据等专业知识进行模型的重新训练,使其具备医学背景和专业判断能力。

因此,重新训练大模型可以提高AI模型在特定领域中的准确性和专业性,并降低产生幻觉的可能性。不过,重新训练需要大量的数据,且对算力要求较高,对人力资源、算力费用和时间成本要求都非常高。

利用行业知识对AI大模型进行微调

除了重新训练,微调是另一种常用的方法来应用AI大模型于垂直行业。

微调是指在通用AI大模型的基础上,通过在特定的行业数据集上进行再次训练,调整模型的部分参数,以适应特定行业的需求。这种方法相比于重新训练,既可以保留通用AI大模型的原生能力,又能增加对行业问题的理解能力。例如,在金融领域中,可以利用金融数据和交易信息微调模型,以实现更准确和适应特定金融市场应用场景的预测和建议。

微调是在通用AI大模型的基础上,通过针对特定行业场景进行精细调整来实现更好的适应性。微调相对于重新训练而言,时间和资源消耗较少。

利用行业知识建立知识库

当AI大模型无法提供准确答案或输出时,可以利用行业知识建立知识库模型,充分融合AI大模型的通用知识和知识库的专有知识,使得大模型可以提供更有针对性的输出。

例如,在法律咨询领域,当AI大模型遇到具体法律案例时,可以将相关法律条款和判例作为知识库模型的输出,促进AI大模型产生更准确的法律意见或建议。

通过建立行业知识库和企业私有知识库模型,不仅可以提高输出内容的准确性,而且可以大大降低幻觉问题影响。但知识库模型的效果与知识库的质量和覆盖度密切相关。此外,不断更新、维护和扩充知识库也是一项重要的任务。

三、Reasoning 大模型

3.1 基本概述

Reasoning大模型特指 ”推理大模型“(Reasoning Large Language Model)是专门设计用于处理需要复杂推理任务的大型语言模型。

3.2 核心概念

推理特指的是什么呢?如何理解模型的推理能力呢?

  • 推理能力的定义:推理是指根据已知的信息和知识,通过逻辑推导得出新的结论或答案的过程。对于大模型而言,推理能力使其能够处理不仅仅是简单的事实查询,还包括解决复杂的问题、进行逻辑推断、数学计算、理解代码等需要多步思考和分析的任务。

  • 与常规大模型的区别:常规的大模型主要侧重于对大量文本数据的学习和理解,以便生成流畅、自然的文本回应,但它们通常直接输出最终的答案,而不展示中间的推理过程。而推理大模型在回答问题前,会先将问题拆解为更小的步骤,即推理步骤或思维链(Chain of Thought, CoT),然后将这些推理过程和最终答案一起输出,使人们能够看到模型的思考过程和逻辑推导路径。
     

3.3 技术实现

要使得模型具备强大的推理能力,可以从如下3点(架构基础、训练方法和提示工程)进行技术实现:

  • 架构基础

    • 推理大模型通常基于Transformer架构构建,这种架构能够有效地处理长序列数据,并且在自注意力机制的帮助下,可以捕捉到输入数据中的复杂依赖关系,为推理提供了良好的基础。

      自注意力机制(Self-Attention Mechanism)是Transformer架构中的一个核心部分。简单来说,自注意力机制就像是给模型装上了一双“慧眼”,让它能够同时关注输入数据中的所有部分,并自动判断哪些部分更加重要。这样,模型就能更好地理解数据的整体结构和内在联系。

      想象一下你在阅读一篇文章。当你读到文章中的一个词时,你的大脑会不自觉地回忆起与这个词相关的其他词或句子,帮助你更好地理解当前的内容。这就是一种注意力机制。
      ​
      在推理大模型中,自注意力机制的工作方式类似。当模型处理一个句子时,它会检查句子中的每个词,并通过比较这些词之间的关系来确定它们的重要性。例如,在处理句子“我喜欢在公园里散步”时,模型会发现“我”和“喜欢”之间有很强的关联,因为“我”是动作的执行者;同样,“散步”和“公园”之间也有紧密的联系,因为“散步”通常发生在“公园”里。通过这种方式,模型能够捕捉到句子中的复杂依赖关系,从而更准确地理解其含义。
      ​
      因此,自注意力机制使得推理大模型能够更有效地处理长序列数据,并在自然语言处理、语音识别等领域展现出强大的性能。
  • 训练方法

    推理模型的训练需要基于(预训练、微调和强化学习)来进行,以确保模型具备强大的推理能力

    • 预训练:模型首先在大规模的无标注文本数据上进行预训练,学习语言的基本结构和模式,获得广泛的语言知识和世界知识。这一阶段的数据量通常非常大,以涵盖尽可能多的语言现象和信息。

    • 微调:在预训练的基础上,使用特定领域或有标注的数据对模型进行微调,以优化其在特定任务上的性能和输出风格。例如,对于推理任务,可能会使用包含推理链的数据集进行微调,让模型学习如何生成合理的推理步骤。

    • 强化学习:部分推理大模型还会采用强化学习技术,通过奖励模型来评估模型输出的质量和准确性,并根据奖励信号不断调整模型的参数,以提高模型的推理能力。

      想象一下,一个孩子(模型)刚开始学习解决问题时,他可能会尝试不同的方法(动作),而每次尝试后,他会根据结果得到一些反馈(奖励信号)。如果某种方法得到了好结果(比如解决了问题或者得到了表扬),那么孩子就更有可能在下次遇到类似问题时再次使用这种方法。这就是强化学习的基本思想:通过“试错”和“延迟回报”来不断学习和改进。
  • 提示工程

    • 提示工程是提高推理大模型性能的重要手段之一。通过精心设计输入提示,引导模型按照预期的方式生成推理步骤和答案。例如,在提示中明确要求模型“一步步思考”“详细解释推理过程”等,可以帮助模型生成更符合要求的回答。

 

3.4 应用场景

  • 学术研究:帮助研究人员解决复杂的学术问题,如数学证明、科学理论推导等,提供新的研究思路和方法。

  • 教育领域:辅助学生学习,解答学科相关的问题,提供详细的解题步骤和解释,培养学生的逻辑思维和解决问题的能力。

  • 商业决策:为企业提供数据分析、市场预测、风险评估等方面的支持,帮助企业做出更明智的决策。

  • 智能客服:更准确地回答用户的问题,提供更详细、专业的解决方案,提高客户服务的质量和效率。

 

3.5 总结

总的来说,推理大模型通过独特的技术实现和广泛的应用场景,展现出了强大的能力和潜力。随着技术的不断进步和应用需求的不断提高,推理大模型将在未来发挥更加重要的作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84674.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

测试 Gemini Pro 2.5

好的,我已经明白了您的需求。您希望: 增大概览消息(Toast)的尺寸:使其更加醒目。消息持久性:当在用户中心内部切换不同标签页(例如从“个人信息”切换到“安全设置”)时&#xff0c…

大模型——MCP 深度解析

MCP 深度解析 套用一句关于幺半群的名言:"MCP 是一种开放协议,用于标准化应用程序向 LLM 提供上下文的方式,问题何在?"但即使花数小时阅读 MCP 的定义并实操示例,仍难以清晰把握其具体运作流程:LLM 负责什么?MCP 服务器做什么?MCP 客户端的角色是什么?数据…

使用 scikit-learn 库对乌克兰冲突事件数据集进行多维度分类分析

使用scikit-learn库对乌克兰冲突事件数据集进行多维度分类分析 背景 在现代冲突研究中,对冲突事件进行多维度分析和可视化可以帮助我们更好地理解冲突的模式、趋势和影响因素。本次作业将使用开源冲突数据,构建一个完整的机器学习分类流程,…

工作流 x 深度学习:揭秘蓝耘元生代如何用 ComfyUI 玩转 AI 开发

目录 一、从 “代码噩梦” 到 “积木游戏”:我与工作流的初次碰撞 二、深度学习:复杂而迷人的 “数字迷宫” (一)深度学习的神秘面纱 (二)深度学习的发展历程 (三)深度学习面临…

《软件工程》第 14 章 - 持续集成

在软件工程的开发流程中,持续集成是保障代码质量与开发效率的关键环节。本章将围绕持续集成的各个方面展开详细讲解,结合 Java 代码示例与可视化图表,帮助读者深入理解并实践相关知识。 14.1 持续集成概述 14.1.1 持续集成的相关概念 持续集…

1992-2021年各省工业增加值数据(无缺失)

1992-2021年各省工业增加值数据(无缺失) 1、时间:1992-2021年 2、来源:国家统计局、统计年鉴 3、指标:工业增加值 4、范围:31省 5、缺失情况:无缺失 6、指标说明:工业增加值是…

Android15 Camera Hal设置logLevel控制日志输出

这里说明三个内容 Camera Hal Demo默认使用的也是Android原生日志接口(例如:ALOGD, ALOGV),为什么logLevel设置为V级别,但是通过ALOGV打印的日志不输出,不生效Camera Hal Demo在不修改ALOGX接口使用的情况…

C++:设计模式--工厂模式

更多内容:XiaoJ的知识星球 目录 1.简单工厂模式1.1 简单工厂1.2 实现步骤1.3 实现代码1.4 优缺点 2.工厂模式2.1 工厂模式2.2 实现步骤2.3 实现代码2.4 优缺点 3.抽象工厂模式3.1 抽象工厂模式3.2 实现步骤3.3 实现代码3.4 优缺点 1.简单工厂模式 . 1.1 简单工厂 …

【DSP笔记】掌握数字世界的律动:时域离散信号与系统基础

掌握数字世界的律动:时域离散信号与系统基础 想象一下,你用手机拍了一张照片,或者听了一首MP3歌曲。这些图片和声音,原本都是连续变化的模拟信号,但为什么它们能被你的手机存储和处理呢?秘密就在于“数字化…

织梦dedecms上传附件不自动改名的办法

织梦dedecms的系统在上传附件后,会将文件自动改名字,那怎么样才能让附件上传后不自动改名字呢,让附件上传后不自动改名字(中文名的附件将会改成拼音文件名称),现在说一下方法吧: 我们打开网站目录下include\dialog\se…

https下git拉取gitlab仓库源码

git init 创建仓库 参考下面创建公私秘钥对 GitLab配置ssh key - 阿豪聊干货 - 博客园 Your identification has been saved in /home/xxx/.ssh/id_ed25519 Your public key has been saved in /home/xxx/.ssh/id_ed25519.pub 然后查看对应公钥,复制 cat ~/.ss…

Mybatis使用update更新值为null时不生效问题解决

1.出现的问题 前端修改数据时把属性内容删除然后进行保存,默认传的null,后端更新时属性值为null, 然后调用updateById进行更新时发现该属性还是原来的值: update方法不会对属性null的进行更新 2.原因 mybatis-plus FieldStrat…

JAVA 学习日志

$2 周期小结 #8 工作汇报 数学建模部分 前三天的主要精力用在电工杯数学建模大赛上了,虽然这是Java学习笔记 当是还是总结一下吧 首先是任务分工方面 需要三个人都会python基础语法 然后一起写论文 ,就是需要边建模边写论文 ,然后在 后续…

Java网络编程性能优化

1.网络编程性能优化基础 1. 性能关键指标 指标 描述 优化目标 响应时间 从请求到响应的总时间 降低到毫秒级 吞吐量 单位时间内处理的请求数量 提高到每秒数千至数万请求 并发用户数 系统同时处理的用户数量 支持数千至数万并发连接 资源利用率 CPU、内存、网络带…

react native搭建项目

React Native 项目搭建指南 React Native 是一个使用 JavaScript 和 React 构建跨平台移动应用的框架。以下是搭建 React Native 项目的详细步骤: 1. 环境准备 安装 Node.js 下载并安装 Node.js (推荐 LTS 版本) 安装 Java Development Kit (JDK) 对于 Androi…

Redis 容器启动失败Fatal error loading the DB, check server logs. Exiting.的解决方法

❗ 问题分析:Redis 容器启动失败 根据提供的 Redis 启动日志,关键信息如下: 🔍 模块加载情况 模块名称状态备注RedisCompat✅ 成功search✅ 成功RediSearch 模块timeseries✅ 成功RedisTimeSeries 模块ReJSON✅ 成功bf✅ 成功R…

chrome打不开axure设计的软件产品原型问题解决办法

1、打开原型文件夹,进入到其中的如下目录中:resources->chrome->axure-chrome-extension.crx,找到 Axure RP Extension for Chrome插件。 2、axure-chrome-extension.crx文件修改扩展名.rar,并解压到文件夹 axure-chrome-ex…

Java 各版本核心新特性的详细说明

一、Java 8(2014)—— 函数式编程的里程碑 1. Lambda 表达式 作用:简化匿名内部类,支持函数式编程。示例:// 传统匿名内部类 Runnable r1 new Runnable() {Overridepublic void run() {System.out.println("He…

【md2html python 将 Markdown 文本转换为 HTML】

测试md文本 md_text """ # title## subtitle\python print("Hello, World!") \- item 1| Header 1 | Header 2 | |----------|----------| | Row 1 Col 1 | Row 1 Col 2 |- item 2> This is a blockquote.### SubsubtitleThis is a paragraph wi…

Prompt Engineering 提示工程介绍与使用/调试技巧

1. 介绍 Prompt Engineering 是一种人工智能(AI)技术,它通过设计和改进 AI 的 prompt 来提高 AI 的表现。Prompt Engineering 的目标是创建高度有效和可控的 AI 系统,使其能够准确、可靠地执行特定任务。 如果你从来没有使用过Pr…