李宏毅2025《机器学习》第三讲-AI的脑科学

在之前的课程中探讨了如何利用大模型构建AI Agent,本科将暂时放下应用层面的探索,拿起“手术刀”和“显微镜”,深入剖析LLM的“大脑”,带您踏上一场“AI脑神经科学”的旅程。课程不讨论模型的训练过程,而是假设我们拥有一个已经训练好的、功能完备的LLM。我们的目标是:理解这个庞大而复杂的神经网络,在面对输入并生成输出的每一个瞬间,其内部究竟发生了什么。

重要提醒: 正如李宏毅老师在课程开始时强调的,目前绝大多数的这类分析研究,受限于计算资源,往往是在相对较小或较早期的开源模型(如GPT-2、LLaMA系列早期版本)上进行的。这就像是通过研究老鼠的大脑来推断人类大脑的运作机制。虽然基本原理可能相通,但我们必须认识到,这些结论不一定完全适用于最新、最顶尖的闭源模型。然而,这些开创性的研究为我们提供了一套宝贵的分析方法论和深刻的洞见。

本次探索将分为四个部分:

  1. 单个神经元在做什么?——从最基础的单元开始。
  2. 一层神经元在做什么?——从个体到群体的协作模式。
  3. 跨层神经元如何互动?——追踪信息在网络中的完整流动路径。
  4. 让模型亲口说出想法——利用LLM的语言能力进行自我剖析。

第一部分:一个神经元的使命——“川普神经元”与分布式表达的现实

要理解一个神经元,我们首先要明确它在Transformer中的位置。在Transformer的每个层块(Layer)中,除了自注意力(Self-Attention)机制外,还有一个重要的部分叫做前馈网络(Feed-Forward Network, FFN)。这个FFN通常由两个线性层和一个非线性激活函数(如ReLU)组成。当我们说“一个神经元”时,通常指的就是FFN中第一个线性层之后、激活函数之前或之后的一个节点。它的输出,是其输入向量的加权和,再通过激活函数(例如ReLU,将负值归零)处理后的结果。一个神经元的“激活”,通常意味着它的输出值大于零。

那么,我们如何探究一个神经元的功能呢?通常遵循一个三步流程:

  1. 观察(相关性):找到能最大化激活该神经元的输入文本。例如,我们发现当某个神经元被高度激活时,模型倾向于生成脏话。这说明该神经元与“说脏话”这一行为相关
  2. 干预(因果性):为了验证因果关系,我们需要进行实验。最直接的方法是“敲除”(Ablation)这个神经元,即强制将其输出设为零(或其在大量数据上的平均激活值)。如果敲除后,模型在各种挑衅下都无法生成脏话,我们就能更确信这个神经元对“说脏话”有因果作用。
  3. 控制(剂量效应):如果可能,尝试不同程度地激活该神经元,观察其输出的变化。比如,轻微激活时说轻度脏话,强烈激活时则言辞激烈。

历史上最著名的例子莫过

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85966.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85966.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CVPR 2025 | 微米级光影CT精度!复旦腾讯优图开源Real-IAD D³数据集

【导读】 本文介绍了复旦联合腾讯优图发布高精度多模态数据集Real-IAD D,并基于此数据集提出了一种创新的多模态融合检测方法,数据集已被CVPR 2025收录,并开源。>>更多资讯可加入CV技术群获取了解哦~ 目录 一、Real-IAD D的创新之处…

解决mysql左连接加where就不会保留左表中的全部数据的问题

在SQL中使用MySQL的LEFT JOIN操作时,如果加入了WHERE条件,确实会影响结果集的完整性,特别是如果你在WHERE条件中使用了JOIN的另一张表中的字段作为过滤条件。这是因为当你在WHERE子句中加入了对JOIN另一张表的过滤条件时,实际上你是在执行一个INNER JOIN(内连接)而非LEFT…

算法与数据结构:动态规划DP

文章目录 动态规划算法全面解析一、核心思想与基本概念二、动态规划与其他算法的区别三、动态规划的解题步骤四、经典案例解析1. **斐波那契数列(Fibonacci)**2. **0-1背包问题(0-1 Knapsack)**3. **最长公共子序列(LC…

Coilcraft电感上的横线是什么意思?电感有方向么?

通常我们会认为电容、电感、电阻这几类无源器件没有方向性,在布局和贴片时可以任意方向放置,也不会在PCB上增加丝印标识说明其方向。与此相互印证的是,电容表面无丝印,无法识别方向;电阻表面一般只有包含阻值大小的数字…

通过Docker挂载nginx并修改页面

1:通过docker创建nginx: 首先关闭原来的Docker(防止端口号冲突) sudo nginx -s stop 直接启动 Nginx 进程 sudo nginx 启动nginx: docker run -di --namemynginx -p 80:80 nginx cd /etc/nginx docker run -d …

力扣1124. 表现良好的最长时间段

这一题我看到数据范围是10^4,暗自窃喜能用双重循环,看题目是典型的前缀和哈希。不过需要一个转换将大于8小时的转化为1,其他都为-1,方便计算,之前的题目中也有这种方法。 那这样就简单了 class Solution { public:int…

EDA2算法速通(编者崩溃版)

这个内容是用来回忆一下EDA2涉及的算法和解题的主要步骤: 有疑问或发现错误可以私信来讨论 高级综合概述 柏拉图优化:这个是来判断是否有哪些节点能完全被其他节点优化掉。比如(1,2)这个节点就可以完全优化(3,4&…

雷池waf配置第三方登录-钉钉配置详细教程

雷池waf配置第三方登录-钉钉配置详细教程 前往钉钉开放平台https://open.dingtalk.com/ 选择一个登录方式登录钉钉开放平台 选择一个自己所管理的组织 登录成功后点击我的后台 选择应用开发 在钉钉应用下点击创建应用 填写应用名称和应用描述后点击保存 点击网页…

神经网络中的均方误差(Mean Squared Error)详解

引言 在机器学习和神经网络领域,损失函数(Loss Function)是衡量模型预测值与真实值之间差异的关键指标。均方误差(Mean Squared Error, MSE)作为一种经典的损失函数,因其简单性、可解释性和数学上的优良性…

day036-lsyncd实时同步服务与网站存储架构

文章目录 1. 实时同步工具2. lsyncd 实时同步服务2.1 环境准备2.2 rsync准备2.2.1 服务端检查2.2.2 客户端检查2.2.3 备份测试 2.3 配置lsyncd2.3.1 安装软件2.3.2 编写配置文件 2.4 测试 3. 案例-网站存储架构3.1 rsync服务配置3.1.1 服务端配置3.1.2 客户端配置 3.2 lsyncd服…

React Native WebView键盘难题:如何让输入框不被键盘遮挡?

写在前面 “明明点击了输入框,键盘却把内容顶得不见踪影!” —— 这可能是React Native开发者使用WebView时最头疼的问题之一。 想象一下:你的App内嵌了一个网页表单,用户兴奋地准备填写信息,结果键盘弹出后&#xf…

Web攻防-XSS跨站浏览器UXSS突变MXSSVueReactElectron框架JQuery库写法和版本

知识点: 1、Web攻防-XSS跨站-浏览器&转换-UXSS&MXSS 2、Web攻防-XSS跨站-框架和库-VUE&React&Electron&JQuery 分类: 1、框架或三方库的XSS(Vue、React、Electron、JQuery) 2、浏览器或插件的XSS(UXSS) 3、客户端预览内核的XSS(MXS…

PyTorch 中torch.clamp函数使用详解和实战示例

torch.clamp 是 PyTorch 中的一个非常有用的函数,它可以将张量的每个元素限制在一个指定的范围内,超出范围的元素将被裁剪为边界值。 函数签名: torch.clamp(input, minNone, maxNone, outNone)参数说明: input:输入…

详解Redis数据库和缓存不一致的情况及解决方案

数据库与缓存不一致是分布式系统中常见问题,本质是数据在缓存层和存储层出现版本差异。 一、并发写操作导致不一致(最常见) 场景描述 线程A更新数据库 → 线程B更新数据库 → 线程B更新缓存 → 线程A更新缓存 结果:缓存中存储的…

湖北理元理律师事务所:企业债务危机的“急诊科”式应对方案

当企业陷入债务危机时,传统“头痛医头”的应对往往加速死亡。本方案基于企业债务重组实务,提炼出 “止血-清创-修复”三阶急救体系,助力企业守住生存底线。 第一阶段:精准止血(0-30天关键期) 目标&#x…

华为云Flexus+DeepSeek征文|基于Dify构建智能票据信息识别助手

华为云FlexusDeepSeek征文|基于Dify构建智能票据信息识别助手 一、构建智能票据信息识别助手前言二、构建智能票据信息识别助手环境2.1 基于FlexusX实例的Dify平台2.2 基于MaaS的模型API商用服务 三、构建智能票据信息识别助手实战3.1 配置Dify环境3.2 配置Dify工具…

Python实例题:基于联邦学习的隐私保护 AI 系统(分布式学习、隐私计算)

目录 Python实例题 题目 问题描述 解题思路 关键代码框架 难点分析 扩展方向 Python实例题 题目 基于联邦学习的隐私保护 AI 系统(分布式学习、隐私计算) 问题描述 开发一个基于联邦学习的隐私保护 AI 系统,包含以下功能&#xff…

点点(小红书AI搜索):生活场景的智能搜索助手

1. 产品概述 点点是小红书于2024年12月正式推出的AI搜索助手,由上海生动诗章科技有限公司开发,定位为生活场景搜索工具,聚焦交通、美食、旅游、购物等日常需求,旨在通过即时信息和真实用户分享帮助用户“精准避坑”。 核心特点 …

软件工程概述:核心概念、模型与方法全解析

一、软件工程定义与诞生背景 定义 将系统化、规范化、可度量的方法应用于软件开发、运行和维护的过程(IEEE标准)。 核心目标:在可控成本下,生产高质量、可维护、满足需求的软件产品。 - 软件开发:需求 → 设计 → 编码…

LVS+Keepalived+nginx

LVSKeepalivednginx 1 安装依赖 sudo yum install ipvsadm keepalived -y 查询是否安装成功 rpm -q -a keepalived 2 配置虚拟IP并安装ipvsadm /etc/sysconfig/network-scripts cp ifcfg-ens33 ifcfg-ens33:1 修改里面配置文件 TYPE"Ethernet" PROXY_METHOD"n…