科普:极简的AI乱战江湖

本文无图。

大模型

‌2022年2月,‌文生图应用的鼻祖Midjourney上线。

‌2022年8月,‌开源版的Midjourney,也就是Stable Diffusion上线。

2022年11月30日‌,OpenAI正式发布ChatGPT-3.5。

此后,不断有【大模型】面世,例如国内的文心一言、通义千问、讯飞星火、智谱清言、DeepSeek等,国外的LlaMa、Gemini等。

一点小常识:

  • 【量化】:在各类开源平台下载大模型时,有时会看到FP32、FP16、TF32、BF16等字眼,它们表示大模型的量化精度,通俗的解释是用整数代替浮点数,以提高模型运算速度、减少存储空间。

  • 【蒸馏】:就是把已经充分训练过的大模型的知识,让“小模型”来学习,类似于“小人国”。从而改善运行效率,减少运行开销。

  • 【微调】:这里的微调更多是指优化的意思。有两种方案:一种是基于LoRA的矩阵分解(可以把它比喻成用加法代替乘法,降低冗余但又不影响结果)的方式,另一种是基于Embedding的嵌入方式(可以把它理解为给大模型加个外G)。

  • 【评测】:为了避免大模型一本正经地胡说八道,就需要一些评价指标来保证执行结果的正确性和合理性,目前比较有名的大模型专业评测机构包括国外的MMLU和国内的OpenCompass、FlagEval。

智能体

如果把大模型比作大脑的话,那么【智能体】就等于是给大脑加上了耳朵和嘴巴:有专门用来写作的智能体,有专门用来编程的智能体,还有专门用来问诊的智能体,这些都和行业有关。

当智能体多了以后,人们发现如果将他们“串联”或“并联”起来,就可以组成功能更强大的应用,于是就出现了【工作流】。

为了解决大模型无法克服的“幻觉”问题,人们再次给它加了一层外G,叫做【RAG】,相当于是让大模型遇到不懂的问题时去查查字典。

为了满足文、图、音频、视频等互相转化的能力,出现了【多模态】大模型。

前阵子比较火的Manus本质上也是智能体 + 工作流 + RAG + 多模态的【多智能体】混搭,并且赋予了它独立访问网络,调用各种应用接口的能力。例如查询天气、航班、搜索网络内容。它的创新点在于以一种非常直观的形式将每一步的执行过程给展示了出来,并且任务分解的颗粒度合适,所以执行结果比较符合人们的期望。

社区

国外的大模型开发者们为了互相交流学习,整了一个叫做Hugging Face的社区,这里聚集了很多个人或组织训练好的免费大模型。

阿里的Model Scope则是国内版的Hugging Face,类似的还有其他的一些。

但它们基本上只提供大模型的上传、下载和托管,为了能够实现在线调用大模型,又出现了OpenRouter(国外)和硅基流动(国内)这种能够部署和调用大模型算力的平台。本质上,它们就是个中介代理(类似于链家),既提供中介服务,也提供“自营”的房源(大模型算力)出租。

除了Hugging Face、Model Scope、OpenRouter和硅基流动,还有一种介于本地部署和网页应用之间的大模型部署方式,这就是ollama和xinference,它们以类似于Docker的方式将大模型下载到本地,再通过它们暴露的端口来调用大模型的能力。

工具

在智能体里面,有做的非常出色的,比较有代表性的是早期的Kimi、豆包和扣子。

但是工程师们并不满足于此,他们自己动手对接各种大模型接口,然后将这些接口封装起来,形成了可以进行二次开发的大模型应用产品,其中最有代表性就是低代码平台Dify和更高级的开发框架LangChain,后起之秀CrewAI则是完全基于多智能体的应用开发组件。

而在开发侧,出现了Claude、Cursor、Trae这种原生的AI开发IDE(一种集成开发工具),它们不再只是插件,而是一种全新的AI开发范式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/80555.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS- 4.5 css + div 布局 简易网易云音乐 官网布置实例

本系列可作为前端学习系列的笔记,代码的运行环境是在HBuilder中,小编会将代码复制下来,大家复制下来就可以练习了,方便大家学习。 HTML系列文章 已经收录在前端专栏,有需要的宝宝们可以点击前端专栏查看! 点…

【滑动窗口】LeetCode 1004题解 | 最大连续1的个数 Ⅲ

最大连续1的个数 Ⅲ 一、题目链接二、题目三、题目解析四、算法原理解法一:暴力枚举 zero计数器解法二:滑动窗口 五、编写代码六、时空复杂度 一、题目链接 最大连续1的个数 Ⅲ 二、题目 三、题目解析 注意题目中说的是最多k次,在一个数组…

PyTorch音频处理技术及应用研究:从特征提取到相似度分析

文章目录 音频处理技术及应用音频处理技术音视频摘要技术音频识别及应用 梅尔频率倒谱系数音频特征尔频率倒谱系数简介及参数提取过程音频处理快速傅里叶变换(FFT)能量谱处理离散余弦转换 练习案例:音频建模加载音频数据源波形变换的类型绘制波形频谱图波形Mu-Law 编…

鸿蒙OSUniApp 实现的语音输入与语音识别功能#三方框架 #Uniapp

UniApp 实现的语音输入与语音识别功能 最近在开发跨平台应用时,客户要求添加语音输入功能以提升用户体验。经过一番调研和实践,我成功在UniApp项目中实现了语音输入与识别功能,现将过程和方法分享出来,希望对有类似需求的开发者有…

2025年卫星遥感行业最新发展趋势深度分析

一、国内发展趋势:政策引领与技术突破双轮驱动 (一)政策体系持续完善,顶层设计深化行业发展 国家级战略与标准体系构建 中国政府将卫星遥感产业纳入“十四五”规划核心战略,明确构建“通导遥”一体化空间基础设施。20…

SIP协议栈--osip源码梳理

文章目录 osiposip主体结构体code main函数 状态机转化结构体code状态转换 sip事务结构体code osip_dialog结构体code 创建并发送200 OK响应 osip_message结构体code osip_eventcode 打印接收到的SIP消息 osip OSIP(Open Source Implementation of SIP)…

Linux之Yum源与Nginx服务篇

1.Yum源知识理论总结概括 Yum源概述 Yum 源 即软件仓库的标识,里面承载着软件包集合 Yum源组成 包含模块 【OS】、【everything】、【EPOL】、【debuginfo】、【source】、【update-source】 【os】:简称operator system 它内部包含操作系统的核心组件&#x…

从单体架构到微服务:架构演进之路

引言:当“大货车”遇上“集装箱运输” 在软件开发领域,单体架构曾像一辆载满货物的大货车,将所有功能打包在一个应用中。但随着业务复杂度飙升,这辆“大货车”逐渐陷入泥潭:启动慢如蜗牛、故障波及全局、升级如履薄冰……

AM32电调学习解读九:ESC上电启动关闭全流程波形分析

这是第九篇,前面的文章把各个模块的实现都介绍了一轮,本章是从运行的角度结合波形图,把整个流程走一遍。 先看下一运行的配置,我把一些配置关闭了,这样跑起来会好分析一些,不同配置跑起来效果会有差异。使用…

全球宠物经济新周期下的亚马逊跨境采购策略革新——宠物用品赛道成本优化三维路径

在全球"孤独经济"与"银发经济"双轮驱动下,宠物用品市场正经历结构性增长。Euromonitor数据显示,2023年全球市场规模突破1520亿美元,其中中国供应链贡献度达38%,跨境电商出口增速连续三年超25%。在亚马逊流量红…

reshape/view/permute的原理

在pytorch中,Tensor的存储是行主序的,也就是意味着最后一个维度的元素的存储时连续的,reshape和view并不改变元素存储的内存,仅仅改变访问的间隔,下面举例说明; 比如一个23的Tensor在内存中的存储是连续的&…

upload-labs靶场通关详解:第11关

一、分析源代码 $is_upload false; $msg null; if (isset($_POST[submit])) {if (file_exists(UPLOAD_PATH)) {$deny_ext array("php","php5","php4","php3","php2","html","htm","phtml"…

L1-7 最短字母串【保姆级详细讲解】

请你设计一个程序,该程序接受起始字母和目标字母作为输入,通过在字母表中向前或向后移动来计算两个给定字母之间的最短路径。然后,程序会沿着最短路径打印出从起始字母到目标字母的所有字母。例如,如果输入“c”和“k”作为起始字…

项目QT+ffmpeg+rtsp(三)——延迟巨低的项目+双屏显示

文章目录 前言双屏显示widget.cppwidget.h前言 对于复现情况,分为两种情况 第一种,对于我而言,是直接解压后,就能直接运行了 第二种,对于师兄而言,需要你构建debug后,会产生这个文件夹,执行的时候,地址应该在这,我猜的,这里面没有dll,exe程序就找不到dll这些库,你…

ansible进阶06

复杂的循环结构 循环基础 [studentworktest myansible]$ cat users.yml --- - name: create usershosts: serveratasks:- name: create some usersuser:name: "{{item}}"password: "{{123456|password_hash(sha512)}}"state: presentloop:- zhangsan- li…

Go 模块版本管理

Go 模块版本管理指南 1、创建带注释的 Git 标签 基本命令 # 创建带注释的标签 git tag -a v1.0.0 -m "Release version 1.0.0 - initial stable release" -a:创建带注释的标签 -m:添加标签注释信息 # 推送标签到远程仓库 git push origin v…

Java—— IO流 第一期

什么是IO流 存储和读取数据的解决方案 I:input O:output 流:像水流一样传输数据 IO流的作用 用于读写数据(本地文件,网络) IO流的分类 按照流向分类 输出流:程序 --> 文件 输入流:文件 --> 程序 按照…

物联网安全技术的最新进展与挑战

随着物联网(IoT)技术的飞速发展,越来越多的设备被连接到互联网,从智能家居设备到工业控制系统,物联网正在深刻改变我们的生活和生产方式。然而,物联网的安全问题也日益凸显,成为制约其发展的关键…

【深度学习基础】损失函数与优化算法详解:从理论到实践

【深度学习基础】损失函数与优化算法详解:从理论到实践 一、引言 1. 损失函数与优化算法在深度学习中的核心作用 在深度学习中,模型训练的本质是通过不断调整参数,使模型输出尽可能接近真实值。这一过程的核心驱动力是损失函数(…

mvc-review

review: 1.Servlet生命周期中初始化方法:init(),init(config) public void init(ServletConfig config) throws ServletException { this.config config; this.init(); } 因此,如果我们需要…