预测效果
代码主要功能
该代码实现了一个结合CNN(卷积神经网络)、LSTM(长短期记忆网络)和KAN(Kolmogorov-Arnold Network)的混合模型,用于时间序列预测任务。主要流程包括:
数据加载:加载预处理的训练/测试集(特征和标签)。
模型构建:
自定义KANLinear层(基于样条函数的非线性激活)
构建CNNLSTMKANModel(CNN提取特征 → LSTM处理序列 → KAN层预测)
模型训练:使用MSE损失和Adam优化器,记录训练/验证损失。
模型评估:加载最佳模型预测测试集,计算R²、MSE、RMSE、MAE指标。
结果可视化:绘制损失曲线和预测效果对比图。
算法步骤
数据准备
使用joblib加载标准化后的训练/测试数据(train_set/test_set等)
封装为PyTorch的DataLoader(批处理大小batch_size=64)
模型定义
KANLinear层:
CNN-LSTM-KAN模型:
CNN模块:多层卷积(Conv1d)+ ReLU + 最大池化
LSTM模块:多层LSTM处理时序特征
KAN输出层:替换传统全连接层做最终预测
用样条基函数(B-splines)替代传统激活函数
实现curve2coeff(样条系数计算)、regularization_loss(正则化)
模型训练
优化器:Adam(学习率0.0003)
损失函数:均方误差(nn.MSELoss)
每epoch记录训练/验证损失,保存最佳模型
评估与可视化
加载最佳模型预测测试集
反归一化预测结果(使用StandardScaler)
计算评估指标(R²、MSE等)并绘制损失曲线
技术路线
数据流
原始数据 → 预处理(标准化)→ DataLoader → 模型输入
模型结构
Input → CNN(特征提取)→ LSTM(时序建模)→ KAN(非线性预测)→ Output
关键创新
KAN层:通过样条插值增强模型表达能力(优于传统ReLU)
混合架构:CNN捕捉局部模式,LSTM学习长期依赖,KAN提供灵活映射
评估方法
使用R²(解释方差)、MSE(均方误差)、RMSE(均方根误差)、MAE(平均绝对误差)
反归一化后对比预测值与真实值
完整代码
- 完整代码订阅专栏获取
运行环境
Python库依赖
torch, joblib, numpy, pandas # 数据处理与模型构建
sklearn.metrics, matplotlib # 评估与可视化
硬件要求
自动检测GPU(优先使用CUDA):
device = torch.device(“cuda” if torch.cuda.is_available() else “cpu”)
若无GPU则退化为CPU运行
数据预准备
训练/测试集需预先保存为train_set、train_label等文件(通过joblib)
补充说明
KAN的优势:
样条函数提供更高阶非线性拟合能力,适合复杂时间序列模式。
混合架构意义:
CNN提取空间特征 → LSTM捕获时间依赖 → KAN增强预测灵活性。
关键文件:
最佳模型保存为best_model_cnn_lstm_kan.pt
标准化器保存为scaler(用于结果反归一化)
此模型适用于单变量时间序列预测(如风速、股价等),通过混合架构平衡特征提取与序列建模能力,KAN层进一步提升非线性拟合性能。