机械专业外文文献翻译-外文翻译--基于中国多阶段短期食品价格预测的最优方法的神经网络模型
《机械专业外文文献翻译-外文翻译--基于中国多阶段短期食品价格预测的最优方法的神经网络模型》由会员分享,可在线阅读,更多相关《机械专业外文文献翻译-外文翻译--基于中国多阶段短期食品价格预测的最优方法的神经网络模型(25页珍藏版)》请在装配图网上搜索。
附录 英文文献 附录:英文文献翻译 基于中国多阶段短期食品价格预测的最优方法的神经网络模型 摘要 许多研究表明 ,经网络可以有效地用来揭示非线性金融市场。不幸的是, 法受到收敛速度慢,效率低下以及本身缺乏稳定性的影响。本文介绍了一种多阶段的优化方法( 法用于培养形成神经网络来预测中国的粮食价格。鉴于最近的观察资料较老的更重要这一事实,我们将训练样 本分为两部分。首先,我们使用第一个训练样本来训练神经网络,获得网络结构。其次,在第一步的基础上,我们继续使用第二个训练样本来进一步优化神经网络系统结构。实证结果表明, 某种程度上克服了传统 法的弱点。此外,基于 法的神经网络可以显著的改善的测量误差和定向评价方面的预测绩效。该文件还证明准确的价格估计也许不是在食品市场的价格水平变化的方向的很好的预报。基于 法的神经网络可以作为一个未来的中国粮食价格预测方法的替代者。 司版权所有, 2006 1、 介绍 型已广 泛普及,应用广泛,不仅应用于经济时间序列预测,而且 (1998)而,线性相关结构是假定在时间序列价值当中的。因此,型所无法捕捉的非线性模式。近似的线性模型对复杂的现实世界中的问题并不总是令人满意。 最近,伴随着人工神经网络从简单的模式识别移动到应用领域的不同范围,人工神经网络( 加频繁的应用于金融时间序列分析。据了解,由于 能强大和灵活的性能,其映射过程能够涵盖很大范围的问题的复杂性和在实际执行中优越的通用性 ( 1996)。包括几个大型预测比赛的许多实证研究表明,对时间序列应用 一种有效的方法。 要进行培训或授课。培训涉及弧权数的确定这样输出值尽可能的接近经过一系列输入模式后期望要得到的数值。这是一个非线性优化问题。事实上,这是一个非线性网络流问题。目前最普遍使用的训练方法是 法,它本质上是一种梯度最速下降法。大家都知道,最速下降法有收敛速度慢,效率低下,以及缺乏稳健性的缺点。此外,它对学习率的选择是非常敏感的。规模较小的学习率往往放慢学习进程,而规模较大的学习率可能造成在权空间的网 络震荡。鉴于传统的 法,对 许多变化或修改已提议指出了 1998)提出了在这方面最近进行的检讨。在本文中,我们介绍了一个多阶段的优化方法来克服传统的 法的缺点。实证结果表明, 一种有效的方法使神经网络的收敛速度加快,效率提高和更好的坚固性。 本文的主要观点集中在对中国粮食市场的小麦价格进行样本预测。获得的预测准确度超出训练数据是其工作性能的最终和最重要的方面。在大部分的文献中定量评价经常作为测量精度,例如均方误差,平均绝对误差,平均绝对百分比误差,根均方误 差等,然而,这些措施的转折点总是被忽略。事实上,定向预测在鉴定和买卖交易行为时机以及投资决策支持系统方面发挥了基础性的作用。近年来,在宏观经济进度预测做了相当数量的调查研究。例子包括 :1987), 1999), 2000), 2000), 2000), 2003) 1998)。为了测 量它们预测运动方向或者转折点的能力, 1981)提出了一个方法来评估这种能力,即 1987)提出了一个先进的评估方法来评估其能力,这是一个测试版的 试。 2000)提出了一个统计方法来评价预测方向变化的动力。2005)应用马可夫转换原则制定了一个动态双因子模型来测量和预测转折点。 2005)提 出了审查判断汇率的变动方向概率的预测绩效的不同方面的程序。以前发表的预测研究比较了不同模型的方向和点的精确度。1996) 2002)证明使用试神经网络模型能够捕捉到大量的转折点。 2005) 2005)实施统计方法来证明神经网络能够更好的预测转折点的能力。但是, 2002)总结它们的模拟研究表明,前馈神经网络表现不佳,而且普遍不如 周期性的模型。其预测能力较差,有较低的转折点检测能力。因此,没有足够的实验性或理论性的研究来验证非线性方法在预测转折点性能的改善的效率(例如 型)。另一方面,在实施不同的预测精度测量(定量评价和转折点的评估)的情况下我们怀疑是否预测的结果是相同的来评估线性和非线性方法的性能。 我们的目标是双重的。首先,我们提出了多级优化方法来评估三种方法的预测性能,型预测性能模型,传统的 经网络模型和 型,来 预测我国粮食市场的粮食价格。在中国,粮食是食物安全的最重要的部门。粮食销售数据对任何未来的农业发展项目是至关重要的,尤其是价格数据,因为他们可以影响潜在的供应和需求,以及粮食和农业经济学的分销渠道。因此,价格预测可能减少粮食市场的不确定性和风险,可以用来确定两视频的消费,可用于识别并适当的政府政策和可持续的粮食数量。本研究通过无数的实验观察进行严格的出样来对价格预测神经网络的作用提供更多的证据。具体说来,我们使用三种模式分别来预测中国郑州粮食批发市场的小麦价格,并与 型的结果为基准来比较。 其次 ,我们的目标是调查上述三个转折点预测预报方法的测量点。价格预测是商品交易和价格分析的组成部分。当评估预测模型时,转折点的预测能力和定量精度的误差一样重要。该文件的其余部分如下。第二节中,对 多级优化方法惊醒描述。第三节中,对比了三个评价方法的数据和预测方法。第四节中,对预测过程进行了讨论,其中包括型的选择和神经网络结构的设计,传统的 法和 法之间的比较也在此节中有所体现。第五节中对从 型, 型, 型的整体评价和比较中获得实验结果进行了讨论。最后 ,第六节中给出了总结发言。 2、 方法论 间序列模型 1970)提出, 型一直是最流行的预测方法之一。在一个型中,一个变量的未来值应该是其过去值和误差的线性组合。一般说来,一个固定的时间序列可以对过去值和误差的组合进行建模,可记为 p,d,q)或者可以表述成以下形式: 该 型基本上是一个面向数据的方法,它是对数据本身结构的调整。 工神经网络模型 该神经网络的主要优点是其灵活的非线性建模能力。 有了 有必要制定一个特定的模型形式。相反,该模型根据数据所提供的特征相应的形成的。此数据驱动的方法适合许多实证数据集,在没有理论指导的情况下,是可以提供一个适当的数据生成过程。人工神经网络模型将过去的观察数据 (. . .,进行了非线性映射功能从而得到未来值 ( , w) + (其中, w 是一个向量的所有参数和 , 是一个由网络结构和连接重量决定的函数。 因此,神经网络相当于一个非线性自回归 模型。 培训网络是神经网络成功的重要因素。在几种可用的算法中,反向传播是最受欢迎且广泛应用的学习算法的神经网络的范例。在本文中,反向传播算法用于之后的实验。 该神经网络的时间序列建模的重要任务是选择一个适当数量的隐藏节点, n,以及输入向量维(滞后性数据), m。但是,实际上, m 和 n 的选择是困难的且没有可用于指导选择的理论。 因此,通常通过实验选择一个适当的 m 和 n。 种多级优化方法 神经网络预测中的主要问题之一是神经网络中需要多少数据来捕获时间序列中基础过程的动态性。虽然模型发展中通常推荐较大的样本容量 ,即较长的时间序列,然而实证结果表明,较长时间序列并不总是产生提供最佳性能的模型预测。例如, 2001 年) 调查金融时间序列预测中的神经网络数据要求的问题。他发现采用较小的时间序列样本或样本区间外及时的数据关闭能够产生更加精确的神经网络。 建模时确定合适的样本容量不是一件容易的事,特别是在时间序列建模中,较大的样本容量不可避免地意味着要使用早期的数据。理论上讲,如果时间序列中基础数据生成过程是平稳的,更多的数据应该能帮助减少数据中固有噪声的影响。然而,如果这个过程不平稳,或者其结构或特性随 时间而变化,更长的时间序列对模型的预测性能不仅无益反而有害。在这种情形下,更多的近期观察数据在反映数据中可能的结构特性变化方面应该会更加重要,而早期的观察数据对预测模型的建立不仅无益反而有害。可是早期的观察数据被认为在神经网络结构体系的建立方面有用且不能被简单地丢弃。实际上,早期的观察数据对确定层间节点互相联系的初始重量向量有很大帮助,特别是重量被任意初始化的时候。 在传统的 法中,我们使用一个训练样本来训练神经网络,同时忽视近期数据比早期数据更重要的事实。因此,我们将训练样本分为 1 和 2 两部分。 首先,我们应用第一个训练样本 1 来训练神经网络且获得网络结构。其次,我们继续用第二个训练样本 2 来在第一步的基础上进一步优化神经网络的结构。这个过程叫做多级优化方法( 在预测中近期的观察数据比早期的观察数据更重要。 我们通常任意选择神经网络的初始重量。选择的随机性在很大范围内影响神经网络的泛化能力,因为 法很容易遇到局部优化的问题。不同的初始重量可能会导致不同的结果。如何初始化重量是提高网络泛化能力的决定性因素。 早期观察数据在建立体系结构方面有用。我们可以用早期的 观察数据来训练网络结构和获得节点间的重量向量。 第一步可以被认为是重量初始化过程。因此,这种方法在培训到某种程度前避免了网络中重量向量选择的盲目性和随机性。 3、 数据描述及预测评价准则 本篇研究报告中所用的小麦价格(白小麦,三等)数据是中国郑州粮食批发市场每月的现货价格,时间从 1996 年 1 月到 2005 年 7 月,总的观察数据 n=115,如表 1 所示。虽然没有就如何分配神经网络应用的数据达成共识,一般的做法是在建模和选择方面分配更多的数据。大多数研究文献在样本区间内和样本区间外的分配比率上采用方便的 70% 30%,80% 20%,或 90% 10%。本文采用最后一种。我们把 1996 年 1 月到 2004 年 7 月的月度数据作为区间内样本数据(包括 20 个确认数据),这 103 个数据用于培训和确认目的;其余的 12 个数据作为区间外样本,用于测试目的。因为空间原因,原始数据不再列举,细节的数据可从 站获得。 为了评估和比较预测性能,介绍一种预测评估标准很有必要。本文介绍两种评估标准:定量评价和转折点评价。定量评价包括三个总误差措 施:均方误差( 绝对平均误差( 平均绝对百分比误差( 当上述规范 图 1 小麦价格数据; 1996 年 1 月到 2005 年 7 月中国郑州粮食批发市场每月价格 是从实际值而来的预测值之偏离的度量时,它们并不能反映模型预测转折点的能力。方向变化预测经常被用于财政和经济决策中。如何评估模型在预测转折点方面的能力是另一项重要的任务。对于贸易商和分析师市场,方向和转折点与价值预测本身同样重要。 模型预测转折点的能力可以用 987)提出的评估标准来衡量,这个标准是 测试版。 准是定义一个预测变量 一个实际方向 下: 1 如果 0, 0 如果 0 ( 1 如果 0, 如果 0 (其中 实变量在时间 t 间的变动量, 在预测变量 化方向之上的有条件实值预测方向变化的随机矩阵是: 换句话说,( ( 预测的方向发生的概率,( ( 预测错误的概率。 通 过假设 变化量是相互独立的, 1981)告诉我们市场时间选择能力的必要充分条件是: 需要检验的假设是: 1987)显示前述假设可以通过衰退方程检验: 其中, ( 定义的已预测价格方向二进制变量, 测价格是( 定义的实际价格方向二进制变量, 1 是此线性方程的斜率, t 是误差项, 这里,为了证明 线性相关的, 1 应该为正数且不等于 0。这反映了捕获时间序列转折点的预测模型的能力。 另外,为了直接查看模型预 测变化趋势的能力,特别是当我们不能证明 1不等于 0时,我们引入方向变动的数据( (2000)。其计算公式如下所示: 这里, 如果( P t P t),则 =1 ; 其余情况 =0。 然而,很多期货商采用的主要策略是应用趋势作为做出交易决定的辅助。此行为基于一种假设,一旦一种趋势启动,它将继续进行。商人们想要紧跟趋势,以便他们采取尽早在趋势中占据有利地位并且在趋势的继续过程中保持这一地位。商人们也有可能在预测到趋势或市场方向发生变化时改变他们的立场。因此, 预测的真正目的是在预测结果的基础之上获得利润。这里平均每月的回报率被介绍作为另一个评价判据,利润准则 ( 不考虑其他成本,每年的回报率以复利原则计算。 这里 是对该 如果 则“买进”,否则“卖出”, 是 t+1时刻的预测值。也就是说,我们应用预测值和实际值之间的区别来指导交易。 4、 预测步骤 4 型的选择 使用 们可以看到时间序列倾向于随机游动模式,如线图 1 中的随机上下游动。此外,在相关图中, 相关函数)受线性下滑的影响,而且 相关函数)只有一个尖峰。因此,时间序列是一阶差分以消除这一趋势。我们发现一阶差分序列变平稳而且是白噪音因为“相关图”表格中没有明显的模式。单根检验亦证实一阶差分变得平稳。有确凿的证据支持 , 1, 0) 对时间序列是合适的。然后,我们可以构建型。 型是确定的,统计结果比较如表 1 所示。 表 1 型统计结果比较 判断最佳模型的标准是:( 1)相对小的 2)相对小的 此, 1,1,0)是一个相对较好的模型。 4 拟合神经网络与数据 这项调查中我们只考虑一步提前预测的情况,然后可以指定一个输出的人工神经网络的节点。这项研究中我们只处理人工神经网络的一个隐藏图层 (通常情况),因此,体系结构的选择主要是关于隐藏图层中神经元数目的选择。 4 模型选择的标准 在培训过程开始之前经常执行数据规范化。在本文中,如下公式 (线性变换为 0, 1)被应用 ( 998): 在时间序列预测问题中,与滞后的观察值相对应的输入节点数用来发现时间序列的基础模式,并预测未来值。确定隐藏节点数的最常见方式是通过实验或通过 不断的尝试 。因此,实验设计确定输入和隐藏的节点,这些节点实现某些准则以选择“最佳”模型。这些准则包括根均方误差 (平均绝对误差 ( 列 一般公式在本次研究中得到应用: 这里 是模型中参数的数目。 T 是观察数据的数目。 ( (的第一部分衡量模型和数据的拟合良度,第二部 分设定 过度拟合 的 不利后果 。有 n 个隐藏节点的神经网络的参数总数目( p)为 p=m( n+2) +1。太多或太少的输入节点会影响网络的学习或预测能力( et 1998)。隐藏节点的选择同样如此。因此,我们设置滞后期的最高限额为 6 ,隐藏节点的数量会从 1 到 6 变化。然后人工神经网络模型建立过程中总共有 36 个不同的模型。在如下 36 种神经网络以从 1 到 36的数字简单表示。 4 实验条件 应用 练数据被随机分成包括 70%范例的第一系列( 1)和包括 30%范例的第二系列( 2)。训练用的收敛标准是均方差小于或等于 高 1000 次迭代,高 500 次迭代。隐藏层和输出层的传输函数分别为正切函数和线性函数。偏置项在隐藏层和输出层中都有应用。功能函数是均方差( 人工神经网络模型已 的配置为 腾处理器。所有的神经网络模型是用通过培训系列的反向传播算法训练,然后在测试系列上测试。实验重复 10 次,之后计算 平均值。 就选择如上提到的最佳模型的准则而言, 2 4 1 的神经网络结构被用来模拟小麦价格序列。 4 传统 法的比较 4 培训时间与收敛性 生成实验结果,应用传统 法我们发现大部分神经网络存在慢收敛性问题而且几乎所有神经网络都达不到 1000 纪后( 培训目标,如图 2。 图 2 应用传统 法的培训过程中的 例神经网络结构为 3 6 1) 另一方面,应用 们可以发现大部分神经网络在培训的第一阶段遇到了慢收敛性的问题(见图 3)。 图 3 应用 法的培训过程(第一阶段) 中的 例神经网络结构为 3 6 1) 然而,在第二阶段神经网络却很快地收敛(见图 4)。 图 4 应用 法的培训过程(第二阶段)中的 例神经网络结构为 3 6 1) 良好收敛性能可以被很简单的观察到。两种算法的培训时间如图 5 所示(神经网络结构是 3 6 1,对其他神经网络可以得到同样结果),表 2 描述了更多的细节。根据上一节中提到的培训参数设置,每一个训练用 练时间大大低于传统的 法。使用 常规 法,平均培训时间分别为 s 和 。结果表明,使 用 表 2 两种算法 10 次培训过程的比较 图 5 每一次培训的培训时间(此例神经网络结构为 3 6 1) 4 预测精度 应用两种算法的每一个神经网络(应用不同结构)的预测结果如图 6 所示,其中 12 个月的价格)的平均值。正如我们从图 6 看到的,在精确性上 P 算法要好。 P 算法 10 10图 6 所示,对 说 标准偏差要低得多。而且 大值也比 图 6 36 个神经网络应用两种算法后预测精度的比较。 在转换回原始域前绘制。 法低得多(分别为 10 10结果可能意味该 来更好的通用性和比传统的 法更好的鲁棒性。 5、 结果 图 7 和表 3 中汇总了对应的预测性能和比较评价结果。图 7 中可以看出, 型能很好地预测小麦价格。与 结果相比, 预测性能更好些。三种模型的对比和结果如表 3 所示。 5 定量评价 表 3 列出了四个应用 三种方法预测小麦价格的样本内和样本外整体摘要数据。至于定量预测,表 3表明 用 P 模型上的 来的提升很明显。 至于样本内的小麦价格时间序列的误差比较,该 型和 型的均方差分别是 样本内时期, 型的 别为 型在同样误差测试中明显减少到 型 (分别为 相比, 显减少。 型的 在三者之中最小(只有 这比起其它模型来要好整整一个百分点。 在样本外时期,应用 起 P 模型(分别为 可以实现 减少。 图 7 样本外小麦价格预测性能 表 3 小麦价格预测结果 至于 用 型后也有 减少。 型的 比其他模型好 。实际上,在样本外时期比起 型来 型可使 有 百分点的提高(从 高至 。如果有 型比 型的提升可达 考虑到 型在小麦价格方面预测比 精确度更好,如上所示为分别为 5 转折点计算 两种模型转折点的正式统计检验如公式( 示,结果见表 4。边坡系数 t, 1 显示它不等于 0。这意味着,在样本外时期 4 关于 神经网络模型转折点预测能力的莫顿测试结果 小麦模型只有非常有限的转折点预测能力。 型能够捕获大量统计学上意义上的转折点,其比率为 一方面,对神经网络预测, 1 是有意义的且不为 0。除了使价格水平预测更精确外,此分析使神经网络预测转折点的能力更强大。 对 言,我们也发现 是 型比 型中 明显超出 80%,这表明非线性模型能很好地预测小麦价格而 型中 为 从实际应用的角度来看, 莫顿测试比 加重要。其原因为前者能够反映小麦价格的运动轨迹且能够帮助商人们回避风险和提前做出交易决定。从莫顿测试的角度考虑, 型要比 型好,标志着非线性预测方法在反复无常的小麦市场中有着非常强大的预测能力。 此外,我们从表 3 和表 4 中注意到较小的 不必然意味着更高的 莫顿测试中有意义的测试。这可能意味着 有意义的莫顿测试与 不同时间序列预测中并不 相同。当应用不同预测标准时(点和定向测量精度)我们会得到不同的结果。这意味着精确的价格估计,正如其偏离时间观测值所决定的那样,或许不是金融层面上价格水平变化方向好的指示器。 至于利润标准( 根据经验得到的结果显示 型能被用于期货预测。与本文中提及的其它模型相比, 型性能是最好的,这一点类似点精度的计算结果。如表 5 所示, 型最好的月平均回报率为 表 5 不同模型平均月回报率比较 均月回报率 因此,我们可以从表 3得出结论,对上述模型分析可知 型在 面要比 型和 型表现好。另一方面,我们不能否认 型是提高预测精度的有效方法。非线性模型是模拟中国批发市场食品价格的有效方法。更进一步地,型的整体预测性能是令人满意的,因为:( 1) 最小的,( 2)过 80%, (3)莫顿测试在 有意义的,而且( 4) 最高的。 6、 结论 该论文提出了一个多级优化方法 (克服传统 法的缺点。比较三种模型 分析实验结果,可知 建立中国食品价格模型预测是一种有效的方法。从先前以人工神经网络模型来进行时间序列预测的研究可知非线性模型即使在信噪比信号很小的情况下也能工作良好。 本文比较了预测中国郑州粮食批发市场小麦价格的 型。结果表明 P 模型精确度明显要高。后者作为基准,用在误差测量方面,比如 一方面,考虑到转折点评价(莫顿测试和 利润准则( 型比 对要好转折点和利润准则证明了多变的小麦市场中非线性模型的预测能力。同时 型能够捕获统计学意义上大量的小麦价格的转折点。而 型却不能。本文亦证明在金融市场中精确的价格估计可能并不能很好的预测价格水平转折点。 再者,我们可从实验结果中得出结论,即全局收敛能力和大多数网络的收敛速度在应用 得到显著提升。预测结果表明,比起传统 法 来了更高的通用性和鲁棒性。 作为总结,我们的研究结果表明,基于只有一个隐藏层的多级优化策略的人工神经网络可 以精确和圆满地逼近任意连续函数,并且可以被为财务经理和业务实践者用做一种替代方法来预测小麦价格。 7、 致谢 该研究由中国国家科学基金和中国教育部博士项目基金支持,20040006023- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机械 专业 外文 文献 翻译 基于 中国 阶段 短期 食品 价格 预测 最优 方法 神经网络 模型
装配图网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文