🌾 农产品价格预测模型

基于 LightGBM + XGBoost 集成学习的大豆期货价格预测系统

24年
历史数据
236维
特征工程
4.23%
平均MAPE
15轮
优化迭代

📊项目概览与关键指标

本项目构建大豆期货价格预测模型,针对最高价、最低价、结算价均值三个目标进行预测,全部达到MAPE ≤ 5%的目标要求。

最高价预测 (High)
4.08%
MAPE
✓ 达标
最低价预测 (Low)
4.58%
MAPE
✓ 达标
结算价预测 (Close)
4.03%
MAPE
✓ 达标
平均性能
4.23%
平均MAPE
✓ 全部达标

🏗️模型架构流程

1

原始数据

241个字段
2000-2024年
6,563条样本

2

特征工程

236维最简特征
差异化标签变换
RobustScaler标准化

3

模型训练

LightGBM + XGBoost
集成学习
早停+正则化

4

预测输出

High/Low/Close
MAPE ≤ 5%
全部达标

🔧特征工程方案

采用"最简特征"哲学,从321维精简至236维,减少27%特征数,提升模型泛化能力。

📈

基础特征 (225维)

  • 期货合约数据(大豆、玉米、小麦等)
  • 宏观经济指标
  • 产业供需数据
  • 进出口数据

时间特征 (3维)

  • 年份 (year)
  • 月份 (month)
  • 季度 (quarter)
📊

衍生特征 (8维)

  • 日内波动率 (daily_range)
  • 波动率比率 (range_ratio)
  • 1日滞后特征 (lag_1)
  • 5日移动平均 (ma_5)
🔄

数据预处理

  • 缺失值填充(中位数)
  • RobustScaler标准化
  • 时序数据严格划分
  • 防泄露处理

🎯核心创新:差异化标签变换策略

突破传统统一变换思路,根据目标变量分布特性采用差异化处理,实现关键性能提升。

目标变量 分布特性 变换策略 核心原因 优化效果
next_month_high 右偏分布 log1p对数变换 压缩极端值动态范围 MAPE 5.46% → 4.08%
next_month_low 左偏分布 保持原始值 对数变换会恶化左偏 MAPE 4.58%
next_month_close_mean 对称分布 保持原始值 对称分布原始值最优 MAPE 4.03%

📈预测效果可视化

最高价 (High) - 预测 vs 真实

最低价 (Low) - 预测 vs 真实

结算价 (Close) - 预测 vs 真实

时间序列预测趋势(2023.06 - 2025.04)

最高价 - 散点图

最低价 - 散点图

结算价 - 散点图

🚀15轮优化历程

经过15轮迭代优化,从基线模型到最终方案,平均MAPE从4.96%优化至4.23%。