• 欢迎访问3777金沙娱场城在线官方网站
货物查询

全国咨询热线400-663-9099
3777金沙娱场城在线

基于模糊认知图和LSTM混合方法的H公司物流需求预测研究

字号:T|T
文章出处:作者:人气:-发表时间:2024-09-03 11:53:00

 

0引言

物流公司作为一种重要的物流服务提供商,承担着对国内外快递、包裹和信件进行运输、分拣和投递的重任。随着电子商务的兴起和物流业务的增长,H公司正面临着日益增长的物流需求。而需求预测作为物流领域备受关注的课题,更是迎来了诸多挑战。该任务受到全球贸易量、经济指标和季节变化等各种因素的动态影响而变得愈发复杂。为应对这一挑战,需要创新方法,能够捕捉货运需求预测固有的复杂性和非线性[1]

物流需求预测基于过去的销售数据、运输数据及其他相关因素,利用数学和统计方法预测未来一段时间的物流需求量。准确的需求预测可以帮助H公司优化资源配置,减少运输成本,提高客户满意度。

物流需求预测的目的是对物流资源进行合理配置,因此在物流系统规划中占据着重要地位。目前的物流需求预测研究许多都集中于单一的预测方法,并取得了丰富的研究成果。然而面对需求预测数据机理的复杂性,以及物流需求相关影响因素的多样性,若沿用传统的单一预测方法,将难以保证预测的精准性。

随着研究的深入,物流需求预测将涉及复杂和动态的性质、物流运作的不确定性,以及不精确的需求因素等问题,组合模型的优势将得以显现。如黄建华等运用ARIMA和PCR的组合模型将自回归移动平均法和主成分分析推广到非线性序列中,提升了模型预测的灵活性;曹志强等通过遗传算法优化支持向量回归机,采用最优参数构造SVR模型,证明GA-SVR与灰色预测方法相比,预测效果更优;黄敏珍等在灰色模型的基础上应用马尔科夫链,构建灰色-马尔科夫链组合模型,以此确定系统状态转移概率矩阵,有效提高了预测精度;Gao等提出了一种集成PROPHET和SVR模型的方法来预测季节性的制造业需求,通过预测季节波动和SVR的输入变量,提高组合模型的精确性;刘智琦等将k-均值、随机森林和分位数回归森林算法进行结合,提出了组合机器学习方法[2][3][4][5][6][7][8][9]

本文根据物流公司货运量的特点,综合考虑货运量的关键影响因素,建立组合预测算法模型。利用模糊认知图算法分析物流公司货运量各影响因素之间的关系权值和状态量,借助LSTM神经网络算法结合物流公司历史货运量数据来预测未来货运量。

1 相关工作

1.1 模糊认知图

模糊认知图具有神经网络和模糊集理论的特点,适用于获取目标概念的因果关系并对其进行表达。因此,据此构建的神经模糊系统可以用于解决决策问题。模糊认知图作为带有符号的模糊有向图,由各概念及各概念之间的关系组成。而各概念之间的联系存储于概念之间的关系中。概念用节点来表示,各概念之间的有向弧反映概念之间的关系,有向弧上的数值大小代表概念之间的关系强弱,而数值的正负代表了概念之间的影响方向。

图1的模糊认知图具有四个节点:D1,D2,D3,D4,代表了四个概念。节点之间的关系由有向弧标志。D1和D4之间的w14和w41代表D1与D4之间有逻辑传递。模糊认知图通过层层迭代,计算各个概念对彼此的影响。模糊认知图的概念属于非线性函数,概念节点采用模糊数值表示各自的状态,每个路径利用激活函数sigmoid和一个逐点乘法操作来实现过滤作用。sigmoid激活层负责决定哪些信息要更新,数值将转换成[-1,1]或者[0,1]之间的一个值。这个数值将作为节点的输入值。当概念节点的状态发生改变时,就会影响到存在因果依赖的节点。模糊认知图中的各个概念节点反复反馈循环,通过非线性的方式传播,使模型最终达到一个稳定的极限,从而得到各个概念节点之间关系权值的解。

图片

图1 模糊认知图

1.2 关系权值的求解

模糊认知图的迭代过程是随时间进行逐步推理迭代的,每个节点的状态值是由上一个节点的状态值通过因果关系矩阵得出的。如图2所示。

图片

图2 模糊认知图推理过程

在模糊认知图中,各个节点t时刻的状态值可以表示为X(t)=[X1(t),X2(t),X3(t),...,Xn(t)],同理,在t+1时刻,各个节点的状态值可以表示为X(t+1)=[X1(t+1),X2(t+1),X3(t+1),...,Xn(t+1)][10]。因此,模糊认知图的迭代机制由如下公式表示。

图
图

模糊认知图用Wij代表概念Xi和Xj之间的权值,W={W11,W12,W13,...,Wnn}表示各个节点之间所有权值的矩阵集合。因此模糊认知图的权值矩阵表示如下。

图

1.3 物流需求预测

近年来,众多学者对物流需求预测进行了广泛的研究,涉及的方法和模型也日益多样化。其中,一些传统统计模型如回归模型、时间序列模型等被广泛应用于物流需求预测领域。这些方法通过分析历史数据的趋势和模式来预测未来的物流需求,具有一定的准确性。然而,传统统计模型存在对数据分布和关系的假设限制,且无法处理非线性、非稳定和非平稳等问题。为了克服这些问题,近些年来,一些新兴技术和方法被引入物流需求预测中,如逻辑回归、人工神经网络、随机森林和梯度增强等方法[11]

本文选择将模糊认知图与LSTM神经网络相结合作为预测物流需求的方法,旨在提高模型预测的精准性和鲁棒性。通过选择对物流需求影响相关性较高的方面,形成概念节点,然后通过模糊认知图迭代概念节点,得到各节点的状态值。最后结合物流公司的历史货运量数据,利用LSTM神经网络进行迭代选择,得到最终结果。这种组合模型能够有效处理高复杂性、高维度的物流需求数据,并且针对多种影响概念可以做到有效建模。

2 FCG-LSTM组合算法

2.1 模型概述

本文提出的FCG-LSTM模型包含两层结构,首先对影响物流需求的相关节点及历史物流数据进行迭代,得到各节点的状态值。其次将得到的结果和历史物流数据作为LSTM神经网络的输入数据进行预测。最后对预测结果进行评估分析,得到最终预测结果。

2.2 LSTM神经网络算法

LSTM,即长短期记忆神经网络算法(Long Short-Term Memory),该算法存在单元状态和多种“门”。单元状态能够提供信息传输路径,用于传递序列中的相关信息,即LSTM神经网络的记忆。单元状态通过传输序列中的相关信息,实现长短时记忆。sigmoid函数图像如图3所示。

sigmoid函数由上式表示,能够帮助“门”对传输信息进行更新或遗忘,当“门”的输出接近0时,表明传递的信息接近于遗忘,即丢失;同理,当“门”的输出接近于1时,则表明传递的信息已被记住。LSTM神经网络中存在三种“门”结构,即输入门、遗忘门、输出门。这些“门”决定着传递信息是否被存储或遗忘。LSTM结构图如图4所示。

图
图片

图3 sigmoid函数图像

图片

图4 LSTM结构图

输入门具有控制当前时刻的输入并更新单元状态的作用,输入门将前一时期传递的隐藏状态和当前的输入传输到sigmoid函数中,得到的结果将决定更新哪些信息。此外,前一个时期传递的隐藏状态和当前的输入也会被传到tanh函数中,产生新的候选值向量。最后,将两个函数的输出结果相乘,在相乘的过程中,sigmoid函数的输出将决定哪些输出值中的信息会被保留。

输入门的计算公式为:

图

输入状态的计算公式为:

图

tanh的函数公式为:

图

当前的单元状态是遗忘门的输出向量与前一层的单元状态点乘,并形成新的记忆。其计算公式为:

图

当单元状态值接近于0时,新的单元状态便会遗忘这些信息,同理,当单元状态的值越来越接近于1时,传输的信息就越会被新单元状态记住。此时,新的值与输入门的值相加则可以得到下一个神经元的记忆[12]

输出门的主要作用是确定下一个单元的隐藏状态。首先将前一个单元的隐藏状态和当前的输入传输到sigmoid函数中,得到新的单元状态,随后将其传到tanh函数中。并将两者的输出相乘,得到下一单元的隐藏状态所包含的数据信息,这时形成的隐藏状态便是当前单元新的隐藏状态,新的隐藏状态和新的单元状态共同传到下一时期。输出门的计算公式为:

图

输出门输出的结果之后再与新的记忆单元点乘计算后得到下一个阶段的隐藏状态:

图

3 模型参数设置

3.1 模型参数

本节将详细介绍研究中使用的模型参数设置。模型参数的选择和调整对于预测模型的性能和准确性至关重要。在进行模型参数设置之前,首先需要了解所使用的模型框架。本研究采用的是基于模糊认知图和LSTM混合方法的物流需求预测模型。

首先,需要确定LSTM模型的各个参数,包括隐藏层的数量、每个隐藏层的神经元数量以及学习率等。这些参数的选择需要根据实际问题和数据集加以调整。使用网格搜索方法在一系列可能的参数值中寻找最优组合。具体而言,我们在隐藏层的数量中尝试了1到5个隐藏层,并在每个隐藏层中尝试了50~200个神经元。对于学习率,我们尝试了0.001~0.1[13]

其次,需要确定模糊认知图模型的参数。模糊认知图模型的参数包括隶属度函数的选择和模糊推理方法的确定。在本研究中,采用了较为常见的隶属度函数,如三角隶属度函数和高斯隶属度函数。对于模糊推理方法,选用模糊推理的经典方法,如最大值法和平均值法。

再次,还需要确定模型的其他参数,如训练轮数、批次大小等。本研究将训练轮数设置为100,且每个批次包含32个样本。

最后,在确定模型参数后,使用H公司的物流需求数据进行模型训练和评估。将数据集分为训练集和测试集,其中70%的数据用于训练模型,30%的数据用于评估模型的性能。将方根误差(RMSE)和平均绝对百分比误差(MAPE)作为评估指标,以衡量模型预测的准确性。

在模型参数设置方面,还需要对LSTM模型的一些关键参数进行调整和优化。这些参数包括隐藏层的大小、时间步的长度、学习率等[14]

隐藏层的大小是一个重要参数,控制着模型的复杂度和表达能力。隐藏层较小可能会导致欠拟合的问题,隐藏层较大则可能导致过拟合问题。因此,我们需要通过交叉验证等方法来确定最合适的隐藏层大小。

时间步的长度决定了模型对历史信息的记忆能力。较短的时间步可能无法捕捉长期的依赖关系,而较长的时间步则可能导致信息混淆。因此,需要在一定的时间步长度范围内进行尝试和优化,以寻找最合适的时间步长度。

学习率是控制模型在训练过程中的参数更新速度。较低的学习率可能会导致训练过程缓慢,较高的学习率则可能导致训练不稳定。因此需要通过实验和反复调整,选择一个适中的学习率,以保证模型的训练效果和稳定性。

3.2 模型训练相关数据部分展示

数据集描述的主要目的是对所使用的数据集进行详细的介绍和描述。本文将从数据来源、数据清洗与预处理以及特征选择与工程化三个方面入手对数据集展开描述和分析。H公司物流需求预测研究的数据主要来源于湖北省邮政公司的内部数据和外部相关数据,数据内容如表1所示。内部数据主要指的是公司本身产生的各类物流数据,包括快递运单信息、仓储信息、配送信息等。外部相关数据则涵盖了相关的宏观经济数据、物流市场数据以及天气数据等。在对数据分析之前,对数据进行清洗和预处理必不可少。在数据清洗过程中,我们可以处理数据集中的缺失值、异常值和重复值。使用合适的统计方法和算法,能使我们更好地补全缺失值,剔除异常值,并削减重复值。此外,对数据格式进行转换和归一化处理也是数据清洗的一部分。

表1 模型实验数据

表格图

在数据预处理过程中,通过对数据进行分离、划分和重组等操作,可以使数据更适用于后续的建模和分析。此外,还开展了特征选择和特征工程的工作,从原始数据中提取具有代表性的特征,对其进行处理,以提高模型的准确性和鲁棒性。

3.3 性能评估指标

为了评估本文所提出的基于模糊认知图和LSTM混合方法的物流需求预测模型的性能,使用以下指标对其进行评估。

均方根误差(RMSE):用于衡量预测值与真实值之间的差异程度。计算公式如下:

RMSE=sqrt(1/n*∑(y_pred-y_true)^2),其中n表示样本数量,y_pred表示预测值,y_true表示真实值。

平均绝对百分比误差(MAPE):用于衡量相对误差的大小。计算公式如下:

MAPE=1/n*∑(|(y_pred-y_true)/y_true|*100%),其中n表示样本数量,y_pred表示预测值,y_true表示真实值[15]

3.4 模型训练与评估

针对H公司物流需求预测的问题,本文提出了基于模糊认知图和LSTM混合方法的模型框架。该框架的主要思想是将模糊认知图与LSTM相结合,利用LSTM模型对时间序列数据进行建模,同时引入模糊认知图来处理不确定性和模糊性问题。

具体而言,我们首先构建了一个基于LSTM的时间序列预测模型,通过该模型可以捕捉到时间序列数据的长期依赖性。然后,引入模糊认知图对预测结果进行修正和调整,以降低数据的模糊性和不确定性。

在模糊认知图的构建过程中,我们需要考虑多个影响因素,并将它们表示为模糊集。然后,使用经验法推导出与模糊集相关的模糊规则。最后,我们将这些模糊规则应用于LSTM模型的预测结果上,得到了修正后的最终预测结果。

在模型训练与评估阶段,我们首先将H公司的历史物流需求数据作为训练集,通过反向传播算法来优化模型参数。然后,我们使用一部分未知的数据作为测试集,通过计算预测结果与实际结果之间的误差来评估模型的性能。

在训练过程中,我们采用批量梯度下降法来更新模型的参数,并使用适当的损失函数来度量模型预测结果与实际结果的差异。通过迭代训练和优化,可以逐渐提高模型预测的准确性。

在评估过程中,我们计算了模型的均方根误差(RMSE)和平均绝对百分比误差(MAPE)。这些指标可以有效评估模型对未知数据的预测能力和稳定性。此外,还需要进行对比实验,将我们的模型与其他常用物流需求预测方法进行比较。

4 实证结果分析

在实验中,我们将模型应用于H公司的物流需求预测任务,并评估其性能。表2显示了本文所提出的模型在不同时段的预测结果及其性能评估指标(RMSE和MAPE)。

表2 实证结果分析

表格图

5 研究局限与展望

虽然本研究基于模糊认知图和LSTM混合方法进行了H公司的物流需求预测,但仍存在一定的局限性。首先,预测研究的数据来源主要依赖于H公司的内部数据,虽然该数据具有一定的代表性,但可能无法完全覆盖相关物流市场的整体情况。因此,研究结果可能会受到数据局限性的影响。其次,本研究所使用的模型框架设计和参数设置是基于当前的研究背景和数据条件进行的,还存在一定的改进空间。例如,可以尝试使用其他深度学习算法或结合其他技术方法来提高物流需求预测的准确性和稳定性。最后,本研究在特征选择和工程化方面仍存在一些不足之处。虽然开展了一定的特征选择和处理工作,但在特征的选取和处理方法上还存在一定的局限性。未来的研究需要进一步探索更有效的特征选择和处理方法,以增强模型的预测性能。

推荐产品

同类文章排行

最新资讯文章

您的浏览历史

    正在加载...