大模型,英文名叫Large Model,也被称为基础模型(Foundation Model)。我们通常说的大模型,主要指的是其中最常用的一类——大语言模型(Large Language Model,简称LLM)。除此之外,还有视觉大模型、多模态大模型等。所有这些类别合在一起,被称为广义的大模型;而狭义的大模型则特指「大语言模型」。
「大模型的本质」 本质是基于深度神经网络的超大规模参数系统,通过对海量数据的训练实现知识的压缩与智能的涌现。其核心在于利用巨大的参数规模(通常十亿级以上)和复杂的网络结构,模拟人脑的认知过程,从而完成多领域的智能任务。
「神经网络的基础」神经网络是AI领域目前最基础的计算模型。它通过模拟大脑中神经元的连接方式,能够从输入数据中学习并生成有用的输出。