本文来自“农业科学与工程前沿”,文章仅代表作者观点,与“环球科学科研圈”无关。 智慧农业 Smart Agriculture 专 辑 文 章 介 绍 ·第三篇· ▎论文ID An improved deep learning model for soybean future prices prediction with hybrid data preprocessing strategy改进的基于混合数据预处理策略的大豆期货价格预测深度学习模型文章类型:Research Article发表年份:2025年第一作者:陈鼎亚通讯作者:刘辉Email: csuliuhui@csu.edu.cn作者单位:中南大学 Cite this article : Dingya CHEN, Hui LIU, Yanfei LI, Zhu DUAN. An improved deep learning model for soybean future price prediction with hybrid data preprocessing strategy. Front. Agr. Sci. Eng., 2025, 12(2): 208‒230 https://doi.org/10.15302/J-FASE-2024599
大豆作为全球主要农产品之一,其期货价格波动对国际贸易、食品安全和经济稳定具有重要影响。然而,由于金融市场的高度非线性、非平稳特性及多种宏观因素的复杂交互,准确预测大豆期货价格一直是农业金融领域的挑战性问题。本文提出了一种新的混合大豆期货价格预测模型,该模型包括数据预处理和深度学习预测两个阶段。在数据预处理阶段,采用ICEEMDAN (改进的带自适应噪声的完全集合经验模态分解) 方法将期货价格序列分解为子序列;然后采用Lempel-Ziv复杂度确定方法识别并重构高频子序列;最后,采用白鲸优化算法优化的变分模态分解对高频成分进行二次分解。在深度学习预测阶段,采用麻雀搜索算法优化的深度极限学习机对所有子序列进行独立预测并重构,得到最终的大豆期货价格预测结果。基于中国、意大利、美国大豆期货价格市场的实验结果发现,所提出的混合方法在预测精度和稳健性方面具有优异的性能。 · 文 章 亮 点 · 1. 构建多阶段融合的混合预测模型,实现对大豆期货价格的高精度建模。2. 引入白鲸优化算法,自动调参提升变分模态分解算法的分解质量与稳定性。3. 基于麻雀搜索算法的预测器优化机制,全面提升序列预测精度与模型鲁棒性。 · Graphical abstract · · 研 究 内 容 · 引言 大豆作为全球最具战略意义的农作物之一,其期货价格不仅直接影响农业生产者的收益预期,也对国家粮食安全、国际贸易格局以及金融市场稳定性产生深远影响。然而,由于大豆期货价格受全球商品市场波动、投资者情绪变化、地缘政治事件以及货币政策等多重因素影响,呈现出高度非线性、强噪声和显著波动性的特征,从而大大增加了准确预测的难度。 尽管已有研究广泛采用统计模型 (如ARIMA) 和深度学习模型 (如LSTM、GRU) 对农产品价格进行预测,并在一定程度上提升了预测精度,但单一模型在面对复杂非平稳时间序列时仍存在鲁棒性差、过拟合严重、对局部极值敏感等问题。此外,目前多数研究往往忽视了对原始时间序列进行充分的数据预处理,导致模型难以从高噪声数据中提取有效特征,预测性能受限。特别是在多市场、复杂波动特征背景下,如何构建具有普适性与泛化能力的高精度预测模型,依然是当前农业金融智能预测领域亟待解决的关键问题。 本研究提出了一种基于混合数据预处理策略的深度学习模型,通过二次分解方法和优化预测算法的结合,显著提高大豆期货价格预测的准确性和鲁棒性。 材料与方法 本研究使用了来自中国、意大利和美国三个典型大豆市场的期货价格时间序列数据进行验证,数据分辨率为单日,每个市场包含1500个数据值,分为训练集 (1–1200) 和测试集 (1201–1500)。中国数据集选自大连交易所黄大豆1号期货主力合约收盘价,美国数据集选自芝加哥期货交易所大豆期货收盘价,意大利数据集为WisdomTree大豆ETF价格。其中,ETF作为一种在交易所交易的基金,可以像股票一样实时买卖,而且与期货合约直接挂钩,能够充分展示模型的泛化能力。本研究提出的混合预测模型ICEEMDAN-LZC-BVMD-SSA-DELM包含以下关键组成部分 (图1):
实验结果表明,所提出的ICEEMDAN-LZC-BVMD-SSA-DELM模型在中国、意大利和美国的三个典型大豆期货市场中均取得了优于传统方法的预测性能。与未使用数据预处理方法的DELM模型相比,本研究通过引入ICEEMDAN初步分解和Lempel-Ziv复杂度评价机制,有效识别并重构了原始时间序列中的高频复杂成分。 进一步地,采用BWO优化的VMD对重构后的高复杂度子序列进行二次分解,显著降低了序列的非平稳性与噪声干扰。这种分层分解策略不仅增强了模型对潜在趋势与周期成分的识别能力,也有效提升了各子序列预测的准确性。实验中,最终模型在三个市场的MAPE分别降至0.042%、0.058%和0.065%,验证了混合预处理策略在捕捉非线性波动特征方面的强大优势 (图2)。
本研究提出了一种新型的混合深度学习模型ICEEMDAN-LZC-BVMD-SSA-DELM,融合了多阶段时序分解、复杂度驱动的数据重构机制与参数优化策略。该模型能够有效降低原始大豆期货价格序列的非线性与噪声干扰,从而提取出更具可预测性的信息模式。其中,SSA优化策略在几乎不增加训练负担的情况下显著提升了模型的鲁棒性与泛化能力。相比标准神经网络模型,所提出的框架在结构上进行了有效改进,实现了更高的精度。 在三个主要市场(中国、意大利、美国)的大豆期货数据集上进行的对比实验中,ICEEMDAN-LZC-BVMD-SSA-DELM在预测精度方面均优于包括LSTM、GRU、DELM等13种基准模型,其中在MAPE和R²指标上分别实现了超过88%的误差优化和接近完美拟合的表现。此外,研究还对不同的分解策略及优化算法进行了系统评估,证明了组合式预处理与优化方法在复杂金融时间序列预测中的有效性与先进性。 未来的研究可进一步扩展到更广泛的农产品市场和更大规模的多源数据集,探索该模型在不同经济背景与市场结构下的适应性与稳定性,为农业金融智能预测系统的发展提供理论支持与技术支撑,推动智慧农业与大宗商品市场的深度融合。
刘 辉 中南大学二级教授、教育部长江学者特聘教授、升华学者领军岗教授,长期从事人工智能及机器人智能装备关键技术研究。入选全球高被引科学家、中国工程院“中国工程前沿杰出青年学者”、英国皇家工程院“杰出国际工程师奖”。获中德双博士学位、德国教授文凭 (机器人),曾任德国联邦教育与研究部冠名BMBF Junior Group Leader、德国生命科学自动化重点实验室机器人研究所所长。以第一完成人获世界互联网大会领先科技奖、施普林格-自然“中国新发展奖”、教育部技术发明二等奖、教育部自然科学二等奖、吴文俊人工智能科技奖等奖励,参与获国家科技进步一等奖。 陈鼎亚 刘辉教授团队成员,中南大学研究生,研究方向为人工智能与时间序列预测、农业金融研究等。 供稿 | 陈鼎亚 编辑 | 唐静月 李云舟 审稿 | 许建香 |