AI要掌握的知识

AI（人工智能）是一个跨学科的复杂领域，其知识体系涵盖理论基础、技术工具和实践应用等多个层面。以下从核心知识模块、技术工具、实践方向等角度，详细梳理 AI 从业者需要掌握的知识体系：

分类算法：
- 线性模型：逻辑回归（二分类 / 多分类）、支持向量机（SVM，核函数技巧）。
- 树模型：决策树（ID3、C4.5 算法）、随机森林（Bagging 集成学习）、XGBoost/LightGBM（Boosting 集成学习）。
- 神经网络：多层感知机（MLP）、卷积神经网络（CNN，图像分类）、循环神经网络（RNN/LSTM，序列数据）。
回归算法：线性回归、岭回归（L2 正则化）、Lasso 回归（L1 正则化）。
应用场景：图像识别、文本分类、预测模型（如房价预测）。
2. 无监督学习
聚类算法：K-means、DBSCAN（密度聚类）、层次聚类。
降维算法：PCA（线性降维）、t-SNE（非线性降维，可视化高维数据）。
生成模型：自编码器（AE）、变分自编码器（VAE）、生成对抗网络（GAN）。
应用场景：用户分群、异常检测、图像生成（如 AI 绘画）。
核心概念：智能体（Agent）、环境（Environment）、状态（State）、动作（Action）、奖励（Reward）。
算法框架：
- 表格型方法：Q-learning、Sarsa（适用于状态空间有限的场景）。
- 函数近似方法：深度 Q 网络（DQN，结合深度学习）、策略梯度（Policy Gradient）、演员 - 评论家（Actor-Critic）。
应用场景：游戏 AI（如 AlphaGo）、机器人控制、资源调度。

评估指标：
- 分类：准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1 分数、ROC-AUC 曲线。
- 回归：均方误差（MSE）、平均绝对误差（MAE）。
优化技巧：
- 正则化：L1/L2 正则、Dropout（防止过拟合）。
- 数据增强：图像旋转、平移、噪声添加（扩充训练数据）。
- 超参数调优：网格搜索、贝叶斯优化。

基础网络：
- CNN：LeNet（手写数字识别）、AlexNet（ImageNet 夺冠模型）、ResNet（残差连接解决梯度消失）。
- RNN/LSTM/GRU：处理时序数据（如语音识别、文本生成）。
- Transformer：自注意力机制（Attention），BERT/GPT 等大模型的基础。
前沿架构：
- 多模态模型：CLIP（图像 - 文本对齐）、Stable Diffusion（扩散模型生成图像）。
- 生成式模型：GPT 系列（语言生成）、Diffusion Models（图像生成质量超越 GAN）。

主流框架：
- TensorFlow：Google 开发，适合生产部署，支持静态图优化。
- PyTorch：Facebook 开发，动态图机制便于调试，科研领域更流行。
- 其他：Keras（高层 API 封装）、MindSpore（华为开发，国产化替代）。
框架使用：自定义层开发、模型加载与保存、分布式训练（多 GPU / 多节点）。

预训练 - 微调范式：
- 预训练：在大规模无标注数据上学习通用特征（如 BERT 的掩码语言模型训练）。
- 微调：在特定任务上优化模型（如问答、翻译）。
提示工程（Prompt Engineering）：设计高效的输入提示，提升大模型的推理能力（如少样本学习、链式思维 CoT）。
模型压缩与部署：量化（浮点转定点）、剪枝（删除冗余连接）、知识蒸馏（用小模型学习大模型输出），部署到边缘设备（如手机端 AI 应用）。

部署方式：
- 服务器端：通过 REST API 提供服务（Flask/Django 框架）。
- 边缘端：TensorFlow Lite/ONNX Runtime 部署到手机、IoT 设备。
监控与优化：模型性能监控（延迟、吞吐量）、在线学习（实时更新模型）、A/B 测试（对比不同模型效果）。