AI基础概念

1、ASR和STT区别

2、流式输出

定义

原理

应用场景

优点

缺点

3、Ollama

4、mindspore和deepseek r1 v3

5、DeepSeek R1/V3 用的哪个底层AI框架

6、HAI-LLM比tensorflow、pytorch还强么

1. 核心优势对比

2. 性能表现

3. 适用场景

总结

7、openai用的什么底层AI框架

8、Transformer和PyTorch、TensorFlow的关系

1. 理论架构 vs. 实现框架

2. 依赖与实现方式

3. 技术栈中的协作关系

4. 总结

9、Hugging Face和PyTorch、TensorFlow关系

1. 核心定位差异

2. 功能对比

3. 协作关系

4. 总结

10、AI技术栈的层级架构解析

1. 基础设施层（硬件与算力）

2. 框架层（开发工具）

3. 模型层（算法核心）

4. 接口与工具层（高阶抽象）

5. 应用技术层（增强能力）

6. 应用层（业务落地）

层级关系总结

补充说明

11、AWS AI分层架构

1. 基础设施层（Infrastructure Layer）

2. 能力层（Capability Layer）

3. 编排层（Orchestration Layer）

4. 体验层（Experience Layer）

分层协同的价值

12、大模型幻觉

一、定义与分类

二、产生原因

三、风险与影响

四、治理与缓解措施

五、未来挑战

13、Agent是什么

Agent 与 AI Agent 对比表格

关键差异总结

应用场景示例

14、Agentic AI 与 AI Agent

15、AI项目开发和实施流程

1. 需求分析与规划

2. 数据准备（占AI项目60%+工作量）

3. 模型开发与训练

4. 系统集成与测试

5. 部署与交付

6. 持续优化与运营

AI项目 vs 传统软件项目差异

典型AI项目流程图

16、AI技术问题分析

一、AI基础概念题

二、模型与技术细节题

三、数据处理与工程题

四、场景应用题

五、陷阱题（考察深度）

回答技巧总结

1、ASR和STT区别

以下是ASR和STT的区别对比表格：

对比项目	ASR（Automatic Speech Recognition）	STT（Speech to Text）
中文名称	自动语音识别	语音转文本
本质	一种技术或系统	一种功能或应用
强调重点	强调识别的自动化过程，侧重于将语音信号转化为文字的技术实现，涉及到语音信号处理、声学模型、语言模型等复杂的技术领域，以实现对语音的准确识别。	强调从语音到文本的转换结果，更关注将语音内容准确地转换为可读的文本形式，通常作为一种功能为其他应用或服务提供支持。
应用场景	广泛应用于语音助手、智能家居、语音交互系统等领域，用于实现人机语音交互，让设备能够理解和执行用户的语音指令。	常用于语音转写、会议记录、语音搜索等场景，主要是将语音内容快速、准确地转换为文本，方便用户进行编辑、存储和检索。
技术难度	技术难度较高，需要处理各种语音变体、噪声环境、不同口音等问题，以提高识别的准确率和鲁棒性。	相对来说，更注重转换的准确性和效率，需要在不同的语音场景下，快速将语音转化为准确的文本，技术难度也不低，但重点在于文本输出的质量。
对语言理解的要求	需要理解语音中的语义和意图，以便准确执行相应的操作或提供相关的信息。	主要是准确转写语音内容，对语义的理解要求相对较低，但在一些特定应用中，也可能需要一定的语言理解能力来提高转写的准确性。

2、流式输出

定义

流式输出（Streaming Output）是一种数据传输和处理的方式，它允许数据在生成的同时就开始传输和处理，而不是等整个数据集完全生成后再一次性传输。就像水流一样，数据以连续的、小块的形式进行传输和处理，这些小块数据通常被称为“流”。

原理

流式输出的核心原理基于数据的分块处理和传输。在数据源端，数据被按照一定规则（如时间间隔、数据量大小等）分割成多个小块。每生成一个数据块，就立即通过网络或其他通信渠道发送给接收端。接收端在接收到数据块后，可以立即对其进行处理，而不必等待所有数据块都到达。这种处理方式依赖于底层的流式传输协议和数据处理框架，确保数据的顺序性和完整性。

应用场景

语音识别：在语音识别系统中，当用户说话时，语音数据会实时地被采集。采用流式输出技术，系统可以在用户说话的过程中就开始对已采集到的语音片段进行识别，并逐步输出识别结果，而不需要等用户说完一整段话才开始处理。例如，智能语音助手在用户说话时就开始显示识别的文字，能让用户更及时地了解系统是否准确理解了自己的意图。
视频直播：直播平台在进行视频直播时，视频数据是不断生成的。通过流式输出，视频数据会被实时编码并传输给观众，观众可以在直播开始后立即观看，而不需要等待整个视频文件生成。这样可以实现低延迟的观看体验，让观众感觉与现场同步。
大数据处理：在处理海量数据时，如日志分析、金融交易数据处理等，数据量可能非常大，无法一次性加载到内存中进行处理。流式输出允许数据以流的形式不断输入到处理系统中，系统可以实时对数据进行分析和处理，及时发现异常情况或提取有价值的信息。

优点

实时性：能够显著减少数据处理和反馈的延迟。例如在实时监控系统中，流式输出可以让监控人员第一时间获取到最新的监控数据，及时发现潜在的问题。
资源效率高：不需要一次性存储和处理大量数据，降低了对系统内存和存储的要求。对于资源有限的设备或系统来说，这一点尤为重要。
可扩展性强：可以方便地处理不断增长的数据。随着业务的发展，数据量可能会不断增加，流式输出可以适应这种变化，无需对系统进行大规模的改造。

缺点

数据完整性挑战：由于数据是分块传输和处理的，可能会出现数据丢失或乱序的情况，需要额外的机制来确保数据的完整性和顺序性。
系统复杂度增加：实现流式输出需要更复杂的系统架构和算法，增加了开发和维护的难度。例如，需要设计专门的流式处理框架和数据同步机制。

3、Ollama

由 Ollama Labs 开发的开源项目，旨在简化本地大语言模型（LLM）的部署和运行。该项目专注于提供轻量化的命令行工具和 API，支持多种主流开源模型（如 Llama、Mistral 等），并通过量化技术优化本地资源使用。

### 补充说明：

1. **开发背景**： Ollama 的诞生源于对隐私保护和本地化运行的需求，解决了云端依赖和高成本问题。

2. **技术特点**： • 支持跨平台（macOS/Linux/Windows）和 Docker 容器化部署。 • 提供类 OpenAI 的 API 接口，便于集成到现有工具链（如 LangChain）。

目前公开资料未提及具体创始人姓名，但项目由 Ollama Labs 团队主导维护。

4、mindspore和deepseek r1 v3

**MindSpore 和 DeepSeek R1/V3 是**互补协作**的关系。以下是关键分析：

MindSpore 是 AI 框架，DeepSeek 是大模型• MindSpore 是华为推出的开源 AI 计算框架（类似 TensorFlow、PyTorch），用于模型训练和推理。• DeepSeek R1/V3 是基于此类框架开发的大模型，其训练和部署依赖底层框架支持。例如，昇思 MindSpore 提供了 DeepSeek-V3 的“模块化使能套件”，实现从训练到推理的全流程开箱即用。

技术协同案例• 昇腾（华为硬件）与 MindSpore 共同优化了 DeepSeek 的部署效率，例如通过静态图动态 Shape 技术、多维混合并行优化释放硬件算力。• DeepSeek-V3 的昇思 MindSpore 版本已上线开源社区，支持开发者直接调用。

生态定位差异• MindSpore 的目标是构建 AI 开发框架生态，支持多种模型（包括 DeepSeek 和其他大模型）。• DeepSeek 专注于大模型本身的算法创新和应用落地，其竞争力体现在模型性能（如 R1 的逻辑推理、V3 的 MoE 架构）。

综上，两者是**技术栈不同层级的合作关系**：MindSpore 提供底层框架支持，DeepSeek 在此基础上实现模型创新。这种协同模式在 AI 领域很常见（如 PyTorch 与 Meta 的 Llama 模型）。

5、DeepSeek R1/V3 用的哪个底层AI框架

根据检索结果，**DeepSeek R1/V3 的底层框架是自研的 HAI-LLM 训练框架**，并结合了多种并行策略和软硬件协同优化技术。以下是关键信息总结：

HAI-LLM 框架DeepSeek 为 V3/R1 开发了专用的 HAI-LLM 框架，支持混合精度训练（如 FP8）、高效的流水线并行（DualPipe 算法）以及跨节点通信优化（如 All-to-All 通信内核）。该框架实现了以下并行策略：• **专家并行（EP）**：将 MoE 模型的专家分散到不同 GPU，通过动态负载均衡提升效率。• **流水线并行（PP）**：通过计算-通信重叠隐藏通信开销。• **数据并行（DP）与张量并行（TP）**：优化显存使用和计算效率。

与 MindSpore 的关系尽管 DeepSeek 主要依赖自研框架，但部分优化（如昇腾硬件适配）可能与华为 MindSpore 生态协作。例如，昇思 MindSpore 提供了 DeepSeek-V3 的模块化支持，但核心训练仍基于 HAI-LLM。

技术优势• **FP8 训练**：减少 GPU 内存占用并加速计算。• **动态负载均衡**：通过 EP 策略（如预填充阶段路由专家 EP-32）避免长尾效应。• **低成本集群架构**：采用两层 Fat-Tree 拓扑降低互连成本。

综上，**DeepSeek R1/V3 的核心框架是自研的 HAI-LLM**，同时结合了硬件层（如昇腾）和开源生态（如 MindSpore）的优化支持。

根据检索结果，**HAI-LLM 目前尚未开源**。以下是关键信息总结：

HAI-LLM 是 DeepSeek 自研的大模型训练框架HAI-LLM 由幻方（DeepSeek 背后的技术团队）开发，用于高效训练 DeepSeek-V3 和 R1 等大模型，支持混合精度训练（如 FP8）、专家并行（EP）等优化技术。

开源状态确认根据 2025 年 1 月 8 日的消息截图，HAI-LLM **仍未开源**，且短期内开源可能性较低（除非 DeepSeek 推出更先进的新框架）。相比之下，同系列的 **HAI-Platform**（深度学习训练平台）已于 2023 年 10 月开源。

技术生态协作DeepSeek 部分优化（如昇腾硬件适配）可能与华为 MindSpore 生态协作，但核心训练框架仍依赖自研的 HAI-LLM。

如需进一步验证，可关注 DeepSeek 官方公告或幻方 AI 的 GitHub 仓库更新。

6、HAI-LLM比tensorflow、pytorch还强么

HAI-LLM 是 DeepSeek（幻方 AI）自研的大模型训练框架，专为高效训练超大规模语言模型（如 DeepSeek-V3 和 R1）而设计。与 TensorFlow 和 PyTorch 这类通用深度学习框架相比，HAI-LLM 在**特定场景**下具有显著优势，但两者的定位和功能并不完全相同，因此直接比较“强弱”需结合具体需求分析：

1. 核心优势对比

维度	HAI-LLM	TensorFlow/PyTorch
设计目标	专为万亿参数级大模型训练优化，支持混合并行（数据/流水线/专家/张量并行）。	通用深度学习框架，覆盖从研究到生产的全流程，但大模型训练需额外扩展（如 Megatron-LM）。
并行效率	内置 DualPipe 流水线并行和 FP8 训练，显存利用率更高。	需依赖第三方库（如 DeepSpeed）实现类似优化，配置复杂度较高。
硬件适配	深度优化国产硬件（如昇腾）及 NVIDIA GPU，支持超大规模集群调度。	主要适配主流 GPU（NVIDIA/AMD），TensorFlow 对 TPU 支持更佳。
开源状态	未开源（截至 2025 年 3 月），仅部分生态工具（如 HAI-Platform）已开源。	完全开源，社区生态成熟（如 PyTorch 的 Hugging Face 集成）。

2. 性能表现

• **大模型训练**：HAI-LLM 在训练 **MoE 架构**（如 DeepSeek-V3）时，通过专家并行（EP）和动态负载均衡，显存占用比传统框架低 30% 以上。

• **通用任务**：TensorFlow/PyTorch 在中小模型训练、推理部署和跨平台支持上更灵活，且工具链（如 TensorBoard、TorchScript）更完善。

3. 适用场景

• **选择 HAI-LLM**：需训练 **千亿/万亿参数模型**，且拥有自研硬件或超算集群的团队。

• **选择 TensorFlow/PyTorch**：需要快速原型开发、社区支持或生产级部署（如移动端、边缘计算）。

总结

HAI-LLM 在**超大规模模型训练**领域确实比 TensorFlow/PyTorch 更高效，但后者凭借通用性和生态优势仍是大多数场景的首选。若 HAI-LLM 未来开源，可能进一步改变竞争格局。

7、openai用的什么底层AI框架

根据检索结果，OpenAI 的底层 AI 框架和技术栈主要包括以下几个方面：

Transformer 架构OpenAI 的核心模型（如 GPT 系列）基于 Transformer 架构，依赖自注意力机制和并行计算处理序列数据。例如，GPT-4 的预训练和推理均围绕 Transformer 的变体优化。

自研框架与工具• **HAI-LLM（未开源）**：DeepSeek 自研的框架（如 HAI-LLM）虽未确认被 OpenAI 直接采用，但 OpenAI 类似地开发了专用工具链（如 Swarm 和 **Agents SDK**）用于多智能体系统编排。• **Responses API**：结合了搜索、文件检索和任务执行功能，底层依赖 GPT-4o 系列模型。• **Operator 的 CUA 技术**：基于强化学习和视觉感知的浏览器操作框架。