深度学习题目（仅供参考）

深度学习题目（仅供参考）

diannao/2025/6/19 19:17:56/文章来源:https://blog.csdn.net/2301_78450837/article/details/148716239

一、注意力和transformer

一、选择题

注意力机制的核心步骤不包括？
A. 计算注意力分布
B. 加权平均输入信息
C. 随机丢弃部分输入
D. 打分函数计算相关性
答案：C（硬性注意力虽随机选择输入，但核心步骤仍为分布计算与加权）
Transformer 中使用的注意力打分函数是？
A. 加性模型
B. 缩放点积模型
C. 双线性模型
D. 余弦相似度
答案：B（公式为dkQ⋅KT，避免高维梯度消失）
以下哪项不是 Transformer 编码器的组件？
A. 掩码自注意力
B. 层归一化
C. 残差连接
D. 前馈神经网络
答案：A（掩码自注意力属于解码器，用于屏蔽未来位置）

二、填空题

注意力机制中，softmax 函数的作用是将打分函数输出转化为__________。
答案：概率分布（注意力权重）
自注意力模型中，输入序列通过线性变换生成 Q、K、__________三个向量。
答案：V（Value）
Transformer 的位置编码分为绝对位置编码和__________，前者基于__________函数实现。
答案：相对位置编码；正弦和余弦

三、简答题

简述软性注意力与硬性注意力的区别。
答：
- 软性注意力对所有输入加权求和，可微，如机器翻译中对齐所有单词；
- 硬性注意力随机选择部分输入（如聚焦图像某区域），不可微，需用强化学习训练，计算效率更高但稳定性差。
为什么 Transformer 需要位置编码？自注意力如何结合位置信息？
答：
- 自注意力本身不具备序列顺序感知能力，位置编码通过正弦 / 余弦函数为每个位置生成唯一向量，与词嵌入相加后输入模型，让模型理解单词顺序（如 “我吃饭” 和 “吃饭我” 的差异）。
解释残差连接在 Transformer 中的作用。
答：
- 残差连接通过x+SubLayer(x)避免深层网络退化，当子层输出为 0 时，直接传递输入x（恒等映射），保证梯度流通，解决梯度消失问题，允许模型堆叠更多层（如 BERT 的 12 层 / 24 层结构）。

二、绪论

一、选择题

下列关于人工智能、机器学习、深度学习的关系描述正确的是？
A. 机器学习包含人工智能，深度学习是机器学习的子集
B. 深度学习包含机器学习，机器学习是人工智能的子集
C. 人工智能包含机器学习，深度学习是机器学习的子集
D. 人工智能包含深度学习，机器学习是深度学习的子集
答案：C
人工神经元的输出计算不包括以下哪个步骤？
A. 输入信号加权求和
B. 激活函数非线性变换
C. 反馈连接记忆存储
D. 偏置项添加
答案：C
深度学习与传统机器学习的核心区别在于？
A. 是否使用 GPU 加速
B. 是否自动学习特征表示
C. 是否需要标注数据
D. 是否处理图像数据
答案：B

二、填空题

1956 年的________会议首次提出 “人工智能” 概念，被视为 AI 学科诞生的标志。
答案：达特茅斯
人工神经网络的三要素包括激活规则、________和学习算法。
答案：拓扑结构
深度学习中，通过多层网络自动提取特征的过程称为________。
答案：表示学习

三、机器学习概述

一、选择题

下列属于无监督学习的是？
A. 图像分类
B. 客户分群聚类
C. 房价预测
D. 围棋策略学习
答案：B（聚类属于无监督学习，其他选项为监督学习或强化学习）
线性回归中，L2 正则化的作用是？
A. 使参数稀疏化（变为 0）
B. 防止过拟合，平滑参数
C. 加速收敛速度
D. 提高模型拟合能力
答案：B（L2 正则化通过惩罚大参数，减少方差，防止过拟合）
极大似然估计假设数据服从某种分布，其核心目标是？
A. 最大化先验概率
B. 最小化预测误差
C. 最大化观测数据出现的概率
D. 最小化结构风险
答案：C

二、填空题

机器学习四要素包括数据、模型、________和优化算法。
答案：学习准则（或损失函数 / 风险函数）
监督学习的优化目标是拟合函数 y=f(x) 或________。
答案：条件概率 p(y∣x)
线性回归中，当特征矩阵 X 不可逆时，可通过________方法求解参数。
答案：岭回归（或 L2 正则化）

四、前馈神经网络

一、选择题

下列激活函数中，哪一个存在 “死亡神经元” 问题？
A. tanh
B. ReLU
C. sigmoid
D. GELU
答案：B（ReLU 在负输入时输出为 0，若梯度长期为 0 则神经元 “死亡”）
前向传播中，隐藏层节点的输出计算顺序是？
A. 先激活函数，再线性变换
B. 先线性变换，再激活函数
C. 仅线性变换
D. 仅激活函数
答案：B（先计算净输入z=Wx+b，再应用激活函数）
反向传播算法的核心依据是？
A. 链式法则
B. 奥卡姆剃刀
C. 大数定律
D. 中心极限定理
答案：A（通过链式法则计算复合函数梯度）

二、填空题

通用近似定理表明，多层感知器可通过增加______层神经元数量，以任意精度拟合复杂函数。
答案：隐藏
sigmoid 函数的导数表达式为______。
答案：σ′(x)=σ(x)(1−σ(x))
前馈神经网络中，输入层到隐藏层的权重矩阵维度为m×n，则输入特征维度为______，隐藏层节点数为______。
答案：n；m

五、卷积神经网络

一、选择题

下列哪项不属于卷积神经网络的结构特征？
A. 局部连接
B. 权重共享
C. 全连接层
D. 空间次采样
答案：C（全连接层是 CNN 的组成部分，但非结构特征）
等宽卷积的填充量计算方式为？
A. P=0
B. P=K−1
C. P=(K−1)/2
D. P=K
答案：C（等宽卷积通过填充 (K−1)/2 保持输出尺寸与输入一致）
残差网络解决的核心问题是？
A. 梯度爆炸
B. 网络退化
C. 过拟合
D. 计算量过大
答案：B（残差连接通过恒等映射避免深层网络训练误差上升）

二、填空题

卷积神经网络中，权重共享的作用是__________。
答案：减少参数数量，提取通用特征
空洞卷积通过插入__________来扩大感受野。
答案：空洞（或零）
ResNet 的残差单元输出公式为__________。
答案：y=x+F(x)

六、循环神经网络

一、选择题

RNN 在反向传播时梯度消失的主要原因是？
A. 激活函数导数累乘小于 1
B. 学习率设置过小
C. 输入序列过长
D. 权重矩阵初始化过大
答案：A（激活函数导数如 tanh'∈[0,1]，累乘导致梯度衰减）
LSTM 中控制历史信息丢弃比例的门是？
A. 输入门
B. 遗忘门
C. 输出门
D. 重置门
答案：B
GRU 与 LSTM 的主要区别是？
A. GRU 没有记忆单元
B. GRU 合并了遗忘门和输入门
C. GRU 使用双向传播
D. GRU 参数更多
答案：B
RNN 前向传播中，隐层状态更新公式正确的是？
A. ht=σ(Uxt+Wht−1)
B. ht=Uxt+Wht−1
C. ht=tanh(Uxt⋅Wht−1)
D. ht=tanh(Uxt+Wht−1)
答案：D

二、填空题

RNN 反向传播算法的全称是__________。
答案：反向传播通过时间（BPTT）
LSTM 的记忆单元更新公式为__________。
答案：ct=ft⋅ct−1+it⋅c~t
梯度爆炸的解决方案通常是__________。
答案：梯度截断
GRU 中的 “更新门” 作用是控制__________。
答案：历史信息保留和新信息输入的比例

七、网络优化与正则化

一、选择题

下列哪项不是网络优化的难点？
A. 非凸优化问题
B. 梯度消失 / 爆炸
C. 凸优化目标函数
D. 超参数敏感
答案：C
小批量梯度下降（MBGD）的主要优势是？
A. 计算效率与梯度稳定性平衡
B. 绝对收敛到全局最优
C. 无需调参
D. 适合所有规模数据集
答案：A
Adam 优化算法结合了哪些技术？
A. 动量法与 Adagrad
B. 动量法与 RMSprop
C. SGD 与 Adadelta
D. 梯度截断与早停
答案：B

二、填空题

网络优化中，梯度消失的主要原因是__________和__________的累乘。
答案：激活函数导数、权重矩阵
批量归一化（BN）的主要目的是解决__________问题。
答案：内部协变量偏移
Dropout 通过随机丢弃神经元，等效于__________训练，提升模型泛化性。
答案：集成

八、模型的学习方式

一、选择题

下列属于集成学习中 Boosting 框架的算法是？
A. 随机森林
B. AdaBoost
C. Stacking
D. Bagging
答案：B
多任务学习中，硬共享模式的特点是？
A. 各任务独立训练，无参数共享
B. 共享底层网络，顶层任务特定
C. 通过正则化约束参数相似
D. 按任务相关性分层共享
答案：B
迁移学习中，源域与目标域特征空间相同但分布不同的场景属于？
A. 异构迁移
B. 同构迁移
C. 元学习
D. 终身学习
答案：B

二、填空题

集成学习的三大框架包括 Boosting、和。
答案：Bagging、Stacking
多视角学习中，通过交替标注未标记数据的方法称为__________。
答案：协同训练（Co-Training）
迁移学习中，利用预训练模型在目标任务微调的方法属于__________策略。
答案：预训练 - 微调

九、深度生成模型

一、选择题

下列属于生成模型的是？
A. 逻辑回归
B. 支持向量机
C. 生成对抗网络（GAN）
D. 随机森林
答案：C
GAN 的核心架构包含哪两个网络？
A. 编码器与解码器
B. 生成器与判别器
C. 前向网络与反向网络
D. 特征提取器与分类器
答案：B
生成模型学习的目标是？
A. 直接拟合条件概率 p(y∣x)
B. 学习数据的联合概率 p(x,y) 或边缘概率 p(x)
C. 寻找最优决策边界
D. 最大化分类准确率
答案：B

二、填空题

机器学习的两种范式是__________和__________。
答案：判别模型、生成模型
GAN 的目标函数设计遵循__________与__________的对抗优化原则。
答案：生成器、判别器
生成模型的两大核心步骤是__________和__________。
答案：密度估计、采样

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/diannao/87424.shtml
繁体地址，请注明出处：http://hk.pswp.cn/diannao/87424.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

WebWorker：提升前端性能的多线程利器

WebWorker：提升前端性能的多线程利器

简介在现代Web开发中，随着应用越来越复杂，JavaScript的单线程模型开始显现其局限性。Web Workers的出现为解决这一问题提供了优雅的方案，它允许开发者在后台线程中运行脚本，而不会影响主线程的性能。 Web Workers是HTML5标准的…

阅读更多...

milvus教程：collection和scheme

milvus教程：collection和scheme

环境配置：可以看上一节一.数据库使用连接 Milvus Standalone创建数据库 my_database_1（无额外属性）创建数据库 my_database_2（设置副本数为 3）列出所有数据库查看默认数据库（default）详情修…

阅读更多...

14：00开始面试，14：06就出来了，问的问题有点变态。。。

14：00开始面试，14：06就出来了，问的问题有点变态。。。

从小厂出来，没想到在另一家公司又寄了。到这家公司开始上班，加班是每天必不可少的，看在钱给的比较多的份上，就不太计较了。没想到6月一纸通知，所有人不准加班，加班费不仅没有了，薪资还要降40%…

阅读更多...

Electron（01）

Electron（01）

Electron Electron是什么 electron可以使用前端技术开发桌面应用，跨平台性，开发一套应用，可以打包到三个平台。 electron结合Chromium（谷歌内核）和 Node.js 和Native Api 当使用 Electron 时，很重要的一…

阅读更多...

Kafka 拦截器深度剖析：原理、配置与实践

Kafka 拦截器深度剖析：原理、配置与实践

引言在构建高可用、可扩展的消息系统时，Kafka以其卓越的性能和稳定性成为众多企业的首选。而Kafka拦截器作为Kafka生态中强大且灵活的功能组件，能够在消息的生产和消费过程中实现自定义逻辑的注入，为消息处理流程带来极大的扩展性和可控性。…

阅读更多...

Flutter 与原生技术（Objective-C/Swift，java）的关系

Flutter 与原生技术（Objective-C/Swift，java）的关系

在 iOS 开发中，Flutter 与原生技术（Objective-C/Swift）的关系一、技术定位与核心差异 Flutter 语言：使用Dart 语言开发，通过 AOT（提前编译）将代码转换为原生 ARM 指令，无需依赖 iOS…

阅读更多...

最新期刊影响因子，基本包含全部期刊

最新期刊影响因子，基本包含全部期刊

原文链接：2024年期刊最新影响因子（IF） 2024年期刊最新影响因子（IF） BioinfoR生信筆記 ，注于分享生物信息学相关知识和R语言绘图教程。

阅读更多...

java 设计模式_行为型_14策略模式

java 设计模式_行为型_14策略模式

14.策略模式策略模式作为一种软件设计模式，指对象有某个行为，但是在不同的场景中，该行为有不同的实现算法。策略模式把这些算法，都抽取出来，组成一个一个的类，可以任意的替换，大大降低了代码…

阅读更多...

【AI Study】第四天，Pandas（9）- 进阶主题

【AI Study】第四天，Pandas（9）- 进阶主题

文章概要本文详细介绍 Pandas 的进阶主题，包括： 自定义函数高级索引数据导出实际应用示例自定义函数函数应用 # 基本函数应用 def calculate_bonus(salary, performance):"""计算奖金Args:salary (float): 基本工资performance (…

阅读更多...

Boost dlib opencv vs2022 C++ 源码安装集成配置

Boost dlib opencv vs2022 C++ 源码安装集成配置

在进行人脸检测开发时候出现 E1696: 无法打开源文件 "dlib/image_processing/frontal_face_detector.h 解决方案 1, 下载boost 需要：https://www.boost.org/ 或github git clone --recursive https://gitee.com/luozhonghua/boost.git 记住一定要完整版源码…

阅读更多...

rest_framework permission_classes 无效的解决方法

rest_framework permission_classes 无效的解决方法

写了一个特别简单的view： csrf_exempt login_required() authentication_classes([TokenAuthentication]) permission_classes([IsAdminUser, IsAuthenticated]) def department_management_view(request):if request.method POST:department_name request.POST.…

阅读更多...

Windows 体系对比 + 嵌入式开发全流程拆解

Windows 体系对比 + 嵌入式开发全流程拆解

一、操作系统层级对比：Windows 家族 vs Linux 家族角色Windows 体系Linux 体系本质核心内核Windows NT KernelLinux Kernel操作系统引擎（管理CPU/内存/硬件）完整操作系统Windows 11 Home/ProUbuntu / Debian / CentOS内核界面软件驱动…

阅读更多...

C# 实现 gRPC高级通信框架简单实现

C# 实现 gRPC高级通信框架简单实现

1. 前言 gRPC（Google Remote Procedure Call）是一个高性能、开源和通用的RPC框架，由Google主导开发。它支持多种编程语言，并广泛用于构建分布式应用程序和服务。gRPC基于HTTP/2协议，支持双向流、请求-响应和多请求-多…

阅读更多...

将项目推到Github

将项目推到Github

前提条件需要安装GIT需要注册GitHub账号步骤首先我们需要登录我们的GITHUB账号，然后点击新建存储库然后起一个名字，设置一些私有公开即可创建完成之后，这里有可以远程推送的命令后面就直接输出命令即可之后推送即可 git push orig…

阅读更多...

K8S 专栏 —— namespace和Label篇

K8S 专栏 —— namespace和Label篇

文章目录 namespace创建namespacenamespace使用默认namespaceLabel添加Label查询Labelnamespace 命名空间是一种用于在 kubernetes 集群中划分资源的虚拟化手段，每个资源都属于一个命名空间，使得多个团队或应用可以在同一个集群中独立运行，避免资源冲突。创建namespace y…

阅读更多...

44.第二阶段x64游戏实战-封包-分析掉落物列表id存放位置

44.第二阶段x64游戏实战-封包-分析掉落物列表id存放位置

免责声明：内容仅供学习参考，请合法利用知识，禁止进行违法犯罪活动！ 本次游戏没法给内容参考于：微尘网络安全上一个内容：43.第二阶段x64游戏实战-封包-代码实现获取包裹物品之前的内容找到了掉落物的…

阅读更多...

汇编语言期末快速过手笔记

汇编语言期末快速过手笔记

一、计算机系统组成计算机系统组成：由硬件系统和软件系统组成硬件系统：CPU、存储器、输入/输出设备等物理部件软件系统：操作系统、各种语言、系统软件和应用软件汇编语言分类属于低级语言（直接面向硬件）与高级语言…

阅读更多...

C++相比于C语言增加了哪些概念？

C++相比于C语言增加了哪些概念？

C相比于C语言增加了哪些概念？ 作者将狼才鲸创建日期2025-06-17 CSDN阅读地址：C相比于C语言增加了哪些概念？Gitee源码目录：qemu/demo_代码示例/02_C_Class 目标受众：熟悉C语言，对C完全不了解，但…

阅读更多...

HarmonyOS5 分布式测试：断网情况支付场景异常恢复验证

HarmonyOS5 分布式测试：断网情况支付场景异常恢复验证

以下是针对HarmonyOS 5分布式事务在断网支付场景下的异常恢复验证全流程方案，综合关键技术与测试策略： 一、核心事务机制验证 ‌两阶段提交（2PC）协议‌ 模拟支付流程中网络中断，验证事务协调者能否正确处理预提交与回滚…

阅读更多...

【狂飙AGI】第5课：前沿技术-文生图（系列1）

【狂飙AGI】第5课：前沿技术-文生图（系列1）

目录 （一）绘画本质（二）国内外AI转绘展（三）创作思路（四）美学理论（1）不可能美学（2）趋无限美学（3）反物理美学&…

阅读更多...

最新文章