深度学习题目(仅供参考)

一、注意力和transformer

一、选择题

  1. 注意力机制的核心步骤不包括?
    A. 计算注意力分布
    B. 加权平均输入信息
    C. 随机丢弃部分输入
    D. 打分函数计算相关性
    答案:C(硬性注意力虽随机选择输入,但核心步骤仍为分布计算与加权)

  2. Transformer 中使用的注意力打分函数是?
    A. 加性模型
    B. 缩放点积模型
    C. 双线性模型
    D. 余弦相似度
    答案:B(公式为dk​​Q⋅KT​,避免高维梯度消失)

  3. 以下哪项不是 Transformer 编码器的组件?
    A. 掩码自注意力
    B. 层归一化
    C. 残差连接
    D. 前馈神经网络
    答案:A(掩码自注意力属于解码器,用于屏蔽未来位置)

二、填空题

  1. 注意力机制中,softmax 函数的作用是将打分函数输出转化为__________。
    答案:概率分布(注意力权重)

  2. 自注意力模型中,输入序列通过线性变换生成 Q、K、__________三个向量。
    答案:V(Value)

  3. Transformer 的位置编码分为绝对位置编码和__________,前者基于__________函数实现。
    答案:相对位置编码;正弦和余弦

三、简答题

  1. 简述软性注意力与硬性注意力的区别。

    • 软性注意力对所有输入加权求和,可微,如机器翻译中对齐所有单词;
    • 硬性注意力随机选择部分输入(如聚焦图像某区域),不可微,需用强化学习训练,计算效率更高但稳定性差。
  2. 为什么 Transformer 需要位置编码?自注意力如何结合位置信息?

    • 自注意力本身不具备序列顺序感知能力,位置编码通过正弦 / 余弦函数为每个位置生成唯一向量,与词嵌入相加后输入模型,让模型理解单词顺序(如 “我吃饭” 和 “吃饭我” 的差异)。
  3. 解释残差连接在 Transformer 中的作用。

    • 残差连接通过x+SubLayer(x)避免深层网络退化,当子层输出为 0 时,直接传递输入x(恒等映射),保证梯度流通,解决梯度消失问题,允许模型堆叠更多层(如 BERT 的 12 层 / 24 层结构)。

二、绪论

一、选择题

  1. 下列关于人工智能、机器学习、深度学习的关系描述正确的是?
    A. 机器学习包含人工智能,深度学习是机器学习的子集
    B. 深度学习包含机器学习,机器学习是人工智能的子集
    C. 人工智能包含机器学习,深度学习是机器学习的子集
    D. 人工智能包含深度学习,机器学习是深度学习的子集
    答案:C

  2. 人工神经元的输出计算不包括以下哪个步骤?
    A. 输入信号加权求和
    B. 激活函数非线性变换
    C. 反馈连接记忆存储
    D. 偏置项添加
    答案:C

  3. 深度学习与传统机器学习的核心区别在于?
    A. 是否使用 GPU 加速
    B. 是否自动学习特征表示
    C. 是否需要标注数据
    D. 是否处理图像数据
    答案:B

二、填空题

  1. 1956 年的________会议首次提出 “人工智能” 概念,被视为 AI 学科诞生的标志。
    答案:达特茅斯

  2. 人工神经网络的三要素包括激活规则、________和学习算法。
    答案:拓扑结构

  3. 深度学习中,通过多层网络自动提取特征的过程称为________。
    答案:表示学习

三、机器学习概述 

一、选择题

  1. 下列属于无监督学习的是?
    A. 图像分类
    B. 客户分群聚类
    C. 房价预测
    D. 围棋策略学习
    答案:B(聚类属于无监督学习,其他选项为监督学习或强化学习)

  2. 线性回归中,L2 正则化的作用是?
    A. 使参数稀疏化(变为 0)
    B. 防止过拟合,平滑参数
    C. 加速收敛速度
    D. 提高模型拟合能力
    答案:B(L2 正则化通过惩罚大参数,减少方差,防止过拟合)

  3. 极大似然估计假设数据服从某种分布,其核心目标是?
    A. 最大化先验概率
    B. 最小化预测误差
    C. 最大化观测数据出现的概率
    D. 最小化结构风险
    答案:C

二、填空题

  1. 机器学习四要素包括数据、模型、________和优化算法。
    答案:学习准则(或损失函数 / 风险函数)

  2. 监督学习的优化目标是拟合函数 y=f(x) 或________。
    答案:条件概率 p(y∣x)

  3. 线性回归中,当特征矩阵 X 不可逆时,可通过________方法求解参数。
    答案:岭回归(或 L2 正则化)

 

四、 前馈神经网络

一、选择题

  1. 下列激活函数中,哪一个存在 “死亡神经元” 问题?
    A. tanh
    B. ReLU
    C. sigmoid
    D. GELU
    答案:B(ReLU 在负输入时输出为 0,若梯度长期为 0 则神经元 “死亡”)

  2. 前向传播中,隐藏层节点的输出计算顺序是?
    A. 先激活函数,再线性变换
    B. 先线性变换,再激活函数
    C. 仅线性变换
    D. 仅激活函数
    答案:B(先计算净输入z=Wx+b,再应用激活函数)

  3. 反向传播算法的核心依据是?
    A. 链式法则
    B. 奥卡姆剃刀
    C. 大数定律
    D. 中心极限定理
    答案:A(通过链式法则计算复合函数梯度)

二、填空题

  1. 通用近似定理表明,多层感知器可通过增加______层神经元数量,以任意精度拟合复杂函数。
    答案:隐藏

  2. sigmoid 函数的导数表达式为______。
    答案:σ′(x)=σ(x)(1−σ(x))

  3. 前馈神经网络中,输入层到隐藏层的权重矩阵维度为m×n,则输入特征维度为______,隐藏层节点数为______。
    答案:n;m

五、卷积神经网络

一、选择题

  1. 下列哪项不属于卷积神经网络的结构特征?
    A. 局部连接
    B. 权重共享
    C. 全连接层
    D. 空间次采样
    答案:C(全连接层是 CNN 的组成部分,但非结构特征)

  2. 等宽卷积的填充量计算方式为?
    A. P=0
    B. P=K−1
    C. P=(K−1)/2
    D. P=K
    答案:C(等宽卷积通过填充 (K−1)/2 保持输出尺寸与输入一致)

  3. 残差网络解决的核心问题是?
    A. 梯度爆炸
    B. 网络退化
    C. 过拟合
    D. 计算量过大
    答案:B(残差连接通过恒等映射避免深层网络训练误差上升)

二、填空题

  1. 卷积神经网络中,权重共享的作用是__________。
    答案:减少参数数量,提取通用特征

  2. 空洞卷积通过插入__________来扩大感受野。
    答案:空洞(或零)

  3. ResNet 的残差单元输出公式为__________。
    答案:y=x+F(x)

六、循环神经网络 

一、选择题

  1. RNN 在反向传播时梯度消失的主要原因是?
    A. 激活函数导数累乘小于 1
    B. 学习率设置过小
    C. 输入序列过长
    D. 权重矩阵初始化过大
    答案:A(激活函数导数如 tanh'∈[0,1],累乘导致梯度衰减)

  2. LSTM 中控制历史信息丢弃比例的门是?
    A. 输入门
    B. 遗忘门
    C. 输出门
    D. 重置门
    答案:B

  3. GRU 与 LSTM 的主要区别是?
    A. GRU 没有记忆单元
    B. GRU 合并了遗忘门和输入门
    C. GRU 使用双向传播
    D. GRU 参数更多
    答案:B

  4. RNN 前向传播中,隐层状态更新公式正确的是?
    A. ht​=σ(Uxt​+Wht−1​)
    B. ht​=Uxt​+Wht−1​
    C. ht​=tanh(Uxt​⋅Wht−1​)
    D. ht​=tanh(Uxt​+Wht−1​)
    答案:D

二、填空题

  1. RNN 反向传播算法的全称是__________。
    答案:反向传播通过时间(BPTT)

  2. LSTM 的记忆单元更新公式为__________。
    答案:ct​=ft​⋅ct−1​+it​⋅c~t​

  3. 梯度爆炸的解决方案通常是__________。
    答案:梯度截断

  4. GRU 中的 “更新门” 作用是控制__________。
    答案:历史信息保留和新信息输入的比例

七、网络优化与正则化

一、选择题

  1. 下列哪项不是网络优化的难点?
    A. 非凸优化问题
    B. 梯度消失 / 爆炸
    C. 凸优化目标函数
    D. 超参数敏感
    答案:C

  2. 小批量梯度下降(MBGD)的主要优势是?
    A. 计算效率与梯度稳定性平衡
    B. 绝对收敛到全局最优
    C. 无需调参
    D. 适合所有规模数据集
    答案:A

  3. Adam 优化算法结合了哪些技术?
    A. 动量法与 Adagrad
    B. 动量法与 RMSprop
    C. SGD 与 Adadelta
    D. 梯度截断与早停
    答案:B

二、填空题

  1. 网络优化中,梯度消失的主要原因是__________和__________的累乘。
    答案:激活函数导数、权重矩阵

  2. 批量归一化(BN)的主要目的是解决__________问题。
    答案:内部协变量偏移

  3. Dropout 通过随机丢弃神经元,等效于__________训练,提升模型泛化性。
    答案:集成

八、模型的学习方式

一、选择题

  1. 下列属于集成学习中 Boosting 框架的算法是?
    A. 随机森林
    B. AdaBoost
    C. Stacking
    D. Bagging
    答案:B

  2. 多任务学习中,硬共享模式的特点是?
    A. 各任务独立训练,无参数共享
    B. 共享底层网络,顶层任务特定
    C. 通过正则化约束参数相似
    D. 按任务相关性分层共享
    答案:B

  3. 迁移学习中,源域与目标域特征空间相同但分布不同的场景属于?
    A. 异构迁移
    B. 同构迁移
    C. 元学习
    D. 终身学习
    答案:B

二、填空题

  1. 集成学习的三大框架包括 Boosting、
    答案:Bagging、Stacking

  2. 多视角学习中,通过交替标注未标记数据的方法称为__________。
    答案:协同训练(Co-Training)

  3. 迁移学习中,利用预训练模型在目标任务微调的方法属于__________策略。
    答案:预训练 - 微调

 九、深度生成模型

一、选择题

  1. 下列属于生成模型的是?
    A. 逻辑回归
    B. 支持向量机
    C. 生成对抗网络(GAN)
    D. 随机森林
    答案:C

  2. GAN 的核心架构包含哪两个网络?
    A. 编码器与解码器
    B. 生成器与判别器
    C. 前向网络与反向网络
    D. 特征提取器与分类器
    答案:B

  3. 生成模型学习的目标是?
    A. 直接拟合条件概率 p(y∣x)
    B. 学习数据的联合概率 p(x,y) 或边缘概率 p(x)
    C. 寻找最优决策边界
    D. 最大化分类准确率
    答案:B

二、填空题

  1. 机器学习的两种范式是__________和__________。
    答案:判别模型、生成模型

  2. GAN 的目标函数设计遵循__________与__________的对抗优化原则。
    答案:生成器、判别器

  3. 生成模型的两大核心步骤是__________和__________。
    答案:密度估计、采样

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/87424.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/87424.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WebWorker:提升前端性能的多线程利器

简介 在现代Web开发中,随着应用越来越复杂,JavaScript的单线程模型开始显现其局限性。Web Workers的出现为解决这一问题提供了优雅的方案,它允许开发者在后台线程中运行脚本,而不会影响主线程的性能。 Web Workers是HTML5标准的…

milvus教程:collection和scheme

环境配置:可以看上一节 一.数据库使用 连接 Milvus Standalone创建数据库 my_database_1(无额外属性)创建数据库 my_database_2(设置副本数为 3)列出所有数据库查看默认数据库(default)详情修…

14:00开始面试,14:06就出来了,问的问题有点变态。。。

从小厂出来,没想到在另一家公司又寄了。 到这家公司开始上班,加班是每天必不可少的,看在钱给的比较多的份上,就不太计较了。没想到6月一纸通知,所有人不准加班,加班费不仅没有了,薪资还要降40%…

Electron(01)

Electron Electron是什么 electron可以使用前端技术开发桌面应用,跨平台性,开发一套应用,可以打包到三个平台。 electron结合Chromium(谷歌内核)和 Node.js 和Native Api 当使用 Electron 时,很重要的一…

Kafka 拦截器深度剖析:原理、配置与实践

引言 在构建高可用、可扩展的消息系统时,Kafka以其卓越的性能和稳定性成为众多企业的首选。而Kafka拦截器作为Kafka生态中强大且灵活的功能组件,能够在消息的生产和消费过程中实现自定义逻辑的注入,为消息处理流程带来极大的扩展性和可控性。…

Flutter 与原生技术(Objective-C/Swift,java)的关系

在 iOS 开发中,Flutter 与原生技术(Objective-C/Swift)的关系 一、技术定位与核心差异 Flutter 语言:使用Dart 语言开发,通过 AOT(提前编译)将代码转换为原生 ARM 指令,无需依赖 iOS…

最新期刊影响因子,基本包含全部期刊

原文链接:2024年期刊最新影响因子(IF) 2024年期刊最新影响因子(IF) BioinfoR生信筆記 ,注于分享生物信息学相关知识和R语言绘图教程。

java 设计模式_行为型_14策略模式

14.策略模式 策略模式作为一种软件设计模式,指对象有某个行为,但是在不同的场景中,该行为有不同的实现算法。 策略模式把这些算法,都抽取出来,组成一个一个的类,可以任意的替换,大大降低了代码…

【AI Study】第四天,Pandas(9)- 进阶主题

文章概要 本文详细介绍 Pandas 的进阶主题,包括: 自定义函数高级索引数据导出实际应用示例 自定义函数 函数应用 # 基本函数应用 def calculate_bonus(salary, performance):"""计算奖金Args:salary (float): 基本工资performance (…

Boost dlib opencv vs2022 C++ 源码安装集成配置

​在进行人脸检测开发时候出现 E1696: 无法打开源文件 "dlib/image_processing/frontal_face_detector.h 解决方案 1, 下载boost 需要:https://www.boost.org/ 或github git clone --recursive https://gitee.com/luozhonghua/boost.git 记住一定要完整版源码…

rest_framework permission_classes 无效的解决方法

写了一个特别简单的view: csrf_exempt login_required() authentication_classes([TokenAuthentication]) permission_classes([IsAdminUser, IsAuthenticated]) def department_management_view(request):if request.method POST:department_name request.POST.…

Windows 体系对比 + 嵌入式开发全流程拆解

一、操作系统层级对比:Windows 家族 vs Linux 家族 角色Windows 体系Linux 体系本质核心内核Windows NT KernelLinux Kernel操作系统引擎(管理CPU/内存/硬件)完整操作系统Windows 11 Home/ProUbuntu / Debian / CentOS内核 界面 软件 驱动…

C# 实现 gRPC高级通信框架简单实现

1. 前言 gRPC(Google Remote Procedure Call)是一个高性能、开源和通用的RPC框架,由Google主导开发。它支持多种编程语言,并广泛用于构建分布式应用程序和服务。gRPC基于HTTP/2协议,支持双向流、请求-响应和多请求-多…

将项目推到Github

前提条件 需要安装GIT需要注册GitHub账号 步骤 首先我们需要登录我们的GITHUB账号,然后点击新建存储库 然后起一个名字,设置一些私有公开即可 创建完成之后,这里有可以远程推送的命令 后面就直接输出命令即可 之后推送即可 git push orig…

K8S 专栏 —— namespace和Label篇

文章目录 namespace创建namespacenamespace使用默认namespaceLabel添加Label查询Labelnamespace 命名空间是一种用于在 kubernetes 集群中划分资源的虚拟化手段,每个资源都属于一个命名空间,使得多个团队或应用可以在同一个集群中独立运行,避免资源冲突。 创建namespace y…

44.第二阶段x64游戏实战-封包-分析掉落物列表id存放位置

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 本次游戏没法给 内容参考于:微尘网络安全 上一个内容:43.第二阶段x64游戏实战-封包-代码实现获取包裹物品 之前的内容找到了掉落物的…

汇编语言期末快速过手笔记

一、计算机系统组成 计算机系统组成:由硬件系统和软件系统组成 硬件系统:CPU、存储器、输入/输出设备等物理部件软件系统:操作系统、各种语言、系统软件和应用软件 汇编语言分类 属于低级语言(直接面向硬件)与高级语言…

C++相比于C语言增加了哪些概念?

C相比于C语言增加了哪些概念? 作者将狼才鲸创建日期2025-06-17 CSDN阅读地址:C相比于C语言增加了哪些概念?Gitee源码目录:qemu/demo_代码示例/02_C_Class 目标受众:熟悉C语言,对C完全不了解,但…

HarmonyOS5 分布式测试:断网情况支付场景异常恢复验证

以下是针对HarmonyOS 5分布式事务在断网支付场景下的异常恢复验证全流程方案,综合关键技术与测试策略: 一、核心事务机制验证 ‌两阶段提交(2PC)协议‌ 模拟支付流程中网络中断,验证事务协调者能否正确处理预提交与回滚…

【狂飙AGI】第5课:前沿技术-文生图(系列1)

目录 (一)绘画本质(二)国内外AI转绘展(三)创作思路(四)美学理论(1)不可能美学(2)趋无限美学(3)反物理美学&…