1、 摘要本文主要介绍我们在人工神经网络(Artificial Neural Network)ANN在电力系统短期负荷预测中进行的研究工作。电力系统短期负荷预测的电力调度中十分重要的一个环节,其结果将对发电机生产计划的制定、水火发电的合理配置、燃料配置和安全分析设备的短期维修及电网能量的传播等产生很大的影响。在信息化建设蓬勃发展的今天,传统的人工预测已经越来越不能满足电力工业发展的需要,而以ANN为代表的预测方法则越来越显示出其巨大的优越性。准确的负荷预测有助于提高系统的安全性和经济性,能够减少发电成本。因此,寻求合适的负荷预测方法以最大限度的提高预测精度具有重要的应用价值。本文在进行短期负荷预测
2、的过程中,主要进行以下的工作:介绍和分析国内外现有的负荷预测技术现状;简要说明ANN;几种流行BP网络算法的理论介绍和算法的选取;根据负荷组成成分的分析及主要成分的变化规律,决定神经网络的输入以及训练样本数量的选取和处理;比较不同隐含层神经元数量对预测结果的影响,然后选取最优值;检验新的预测模型在实际的使用效果;根据实际应用情况提出存在的问题和后续的研究的见解。关键词:短期负荷预测,人工神经网络,BP算法AbstractThis paper mainly presents our work on the research of short term load forecasting by us
3、ing Artificial Neural Network(ANN).The short-term electric load forecasting is a very important link in the electric power dispatch ,resulted in a great improvement in the establishment of the production plan of generators,the reasonable deployment of fire and water generate electricity and fuel ,th
4、e short-term maintenance of safe analysis equipments and the spread of the energy of electrical network.Nowadays informatization construction is developing so vigorously that traditional artificial forecast can not yet satisfy the needs of electric power industrial development more and more.However,
5、the forecast method for representative ,which is ANN,shows its huge superiority.Accurate load forecasting is advantageous to improveing the security and economic effect of power system and can reduce the cost of generating electricity.Finding an appropriate load forecasting method to improve the acc
6、uracy of precision has important applicationg value.This paper mainly introduced the topic as the following in the short-term load forecasting:The introduciong of and analysis of existing short-term load forecast technology both domestic and overseas.The brief introduction on ANN.The main popular BP
7、(Error Back Propagation Network)training function and the choice in this function.According to the annlysis of composition of the load and the change rule of the main factor,decide the input of the arrificial neural network as well as the choice and manipulantion of the tiaining samples.Some formula
8、s on choice of the number of hidden layer,the comparison on different code number of hidden layer and their influence on the forecast result after that get the best choice.Test the new module through a sample .The improvement to further study and the solution according to the problem appeared in the
9、 pratice.Key words: short-term load forecasting, artificial neural network,BP training function1 绪论11.1负荷预测的背景11.2 负荷预测概述11.2.1 负荷预测的特点11.2.2 负荷预测的基本原理21.2.3 负荷预测的意义31.3 国内外负荷预测的研究现状42 负荷预测方法综述62.1 传统的预测方法62.1.1 时间序列法62.1.2 回归预测法72.1.3 趋势外推法72.2 负荷预测技术的新进展82.2.1 模糊控制法82.2.2 人工神经网络预测法82.2.3 优选组合预测技术8
10、2.3 本章小结93 人工神经网络介绍103.1 人工神经网络综述103.1.1 人工神经网络的基本模型103.1.2 人工神经网络的特征143.1.3 人工神经网络的分类143.1.4 神经网络的发展概况153.2 BP神经网络163.2.1 BP网络模型与结构173.2.2 BP神经网络的学习规则183.2.3 BP网络的局限性及改进223.3 本章小结244 基于BP网络负荷预测建模及其仿真研究254.1 仿真工具MATLAB的简介254.2负荷预测建模的一般步骤264.3负荷预测神经网络结构模型的分析274.4 短期负荷预测的BP网络建模及仿真27结论35参考文献36致谢38附录 本文
11、仿真程序391 绪论1.1负荷预测的背景电力系统的作用是为各类用户尽可能经济地提供可靠而合乎标准要求的电能,随时满足各类用户的要求,也就是满足负荷要求。由于电力的生产和使用具有特殊性,即电能是不能储存的,这样就要求系统发电出力随时和系统负荷的变化动态平衡,否则,就会影响供用电的质量,重则危及系统的安全与稳定。电力系统负荷预测因此而发展起来,电力系统负荷预测是实现电力系统安全、经济运行的基础,尤其是在电力市场条件下,负荷预测不仅对电力系统操作人员、电力市场规划者、供电者有着重要的作用,而且对其他的电力市场参与者也很重要。当负荷预测的差额造成大量运行成本和利润损失时,高精度和快速的负荷预测就成为电
12、力系统可靠运行和电力市场供求平衡的保证, 因此对先进的智能预测方法进行研究是很有必要的。近几年,我国极其严重的电力紧张,说明了电力建设必须具有前瞻性,而对符合的预测就是其中一个关键环节。目前电力系统负荷预测已成为工程科学中重要的研究领域,是电力系统自动化中一项重要内容。 短期负荷预测在电网运行实时控制和发电规划中具有重要地位, 提高负荷预测精度对于合理安排电网运方式、制定机组检修和进行电力需求管理意义重大。且随着电力系统的逐步发展和完善,负荷预测己成为能量管理系统(EMS)中一项独立的内容。而且,在当前电力系统市场化的必然趋势下,负荷预测己成为电力市场交易管理系统中必不可少的一部分。1.2 负
13、荷预测概述1.2.1 负荷预测的特点由于负荷预测是根据电力负荷的过去推测它的未来数值,所以负荷预测工作所研究的对象是不确定事件。只有不确定事件、随机事件,才需要人们采用适当的预测技术,推知负荷的发展趋势和可能达到的状况。这就是负荷预测具有以下明显的特点:1、准确性:因为电力负荷未来的发展是不确定的,它要受到多种多样复杂因素的影响,而且各种影响因素也是发展变化的。人们对于这些发展变化有些能够预先估计,有些却很难事先预见到,加上一些临时变化的影响,因此就决定了预测结果的不准确性或不完全准确性;2、条件性:各种负荷预测都是在一定的条件下做出的,对于条件而言,又可分为必然条件和假设条件两种;3、时间性
14、:各种负荷预测都有一定的时间范围,因为负荷预测属于科学预测的范畴,因此,要求有比较确切的数量概念,往往需要指明预测的时间;4、多方案性:由于预测的不准确性和条件性,所以有时要对负荷在各种可能的发展情况下进行预测,就会得到各种条件下不同的负荷预测方案。1.2.2 负荷预测的基本原理电力负荷预测是根据现在和过去时刻的用电负荷情况,估计未来时刻用电负荷的大小。因此它的研究对象是不确定事件、随机事件。而电力负荷预测要预知负荷的发展趋势和可能达到的状况,以下介绍负荷预测的一些基本原理,用于指导负荷预测工作。1、可知性原理也就是说预测对象的发展规律、其未来的发展趋势和状况是可以为人们所知道的,这是人们在进
15、行预测活动的基本依据。2、可能性原理因为事物的发展变化是在内因和外因共同作用下进行的,内因的变化及外因作用大小不同,因此事物的发展变化会有很多种可能。对某一具体指标的预测,往往是按照某发展变化的多种可能性,进行多方案预测的。3、连续性原理又称惯性原理,连续性原理是指预测对象的发展是一个连续统一的过程,其未来发展是这个过程的继续。该原理认为事物发展变化过程中会将某些原有的特征保持下来,延续下去。电力系统负荷的发展变化同样存在着惯性,这种惯性正是进行负荷预测的主要依据。4、相似性原理在很多情况下,作为预测对象的一个事物,其现在的发展过程和发展状况可能与过去一定阶段的发展过程和发展状况相类似,因此可
16、以根据已知发展过程和状况来预测所预测对象的未来发展过程和状况,这就是相似性原理。目前,预测技术中使用的类推法或类比法,就是这个原理的预测方法。5、反馈性原理反馈就是利用输出返回都输入端,再调节输出结果。人们在预测活动实践中发现,当预测的结果和经过一段实践所得到的实际值存在差异时,可利用这个差距,对远期预测值进行反馈调节,以提高预测的准确性。在进行反馈调节时,实质上就是将预测的理论值也实际相结合,首先认真分析预测值和实际值之间的差距及产生差距的原因。然后根据查明的原因,适当改变输入数据及参数,进行反馈调整,使预测质量进一步提高。6、系统性原理系统性原理认为预测对象是一个完整的系统,它本身有内在的
17、系统,又因与外界事物的联系形成它的外在系统。预测对象的未来发展是系统整体的动态发展,而整个系统的动态发展与它的各个组成部分和影响因素之间的相互作用相互影响密切相关。系统性原理强调整体最佳,只有系统整体最佳的预测,才是高质量的预测,才能为决策者提供最佳的预测方案。1.2.3 负荷预测的意义随着电力市场化改革的深入,各电力公司作为电力市场的主体,一切经济活动都以经济效益为中心,都要立足于电力市场,深入研究电力市场的供需形势及其发展是公司经营活动的基础,而电力负荷预测工作是准确把握市场脉搏、分析未来电力需求走势的必要工具。短期负荷预测的重要意义可以归纳如下:(1)短期负荷预测是电力系统优化调度(如机
18、组最优组合、经济调度、最优潮流计算等)的基础工具,是电力企业日常经营管理工作的重要组成部分,准确的短期负荷预测是电网调度机构制定供电计划和做电网供需平衡的关键,它有助于系统运行人员的高效地预估电能的生产、输送、分配以及消费情况,制定出经济、合理的发电方案。对一个大电网,根据短期负荷预测提供的信息,即可以实现发电容量的合理调度,对运行中的发电厂的出力要求提出预告,从而可以对发电机组出力变化的情况先得以估计,又可以经济合理地安排本网内各发电机组的启停机,从而可以使系统在安全范围内,保持必要的旋转储备容量的耗费为最小,使发电机成本为最小,确保电网安全、稳定、优质、经济地运行。(2)随着我国电力市场的
19、进一步发展,短期负荷预测在电力系统的经济运行方面的影响越来越明显,对于发电公司,短期负荷预测是制定发电计划和报价的依据;对于供电公司,短期负荷预测为供电方制定订购计划提供依据;对于输电公司,短期负荷预测也是制定发电计划及安全、可靠、经济运行的基础。(3)电价是电力市场的杠杆和核心内容,体现了电力市场的竞争性和开放性,而电价的制定是在未来给定电价计算期的负荷预测的基础上完成的。因此,发电企业要保证其电价的竞争能力并且盈利,就必须获得精确的短期负荷预测值,才能定出既有竞争力又保证盈利的电价。(4)提供转运业务是电力市场中的一项基本功能,是电力市场平等竞争的必要条件,可以给电网带来巨大效益。而电网在
20、执行转运业务时是根据短期负荷预测的数据及各发电机的运行参数来制定发电计划和调度计划,所以准确的短期负荷预测才能有效地促进供、运、用电三方的协调。(5)系统充裕性评估(Projected Assessment of System Adequacy)PASA由电力调度中心负责,主要内容是分析预测中短期系统供需平衡和系统安全情况,目的是让市场成员正确了解信息。PASA是发电市场得以顺利进行的基础。这也体现了准确的短期负荷预测对系统及发电市场的重要影响和作用。因此,电力负荷预测工作的水平已成为衡量一个电力企业的管理是否走向现代化的显著标志之一,尤其在我国电力事业空前发展的今天,电力负荷预测问题的解决已
21、经成为面临的重要而艰巨的任务。如何提高预测精度是目前研究短期负荷预测理论与方法的中心和重点,准确的短期负荷预测已成为实现电力系统管理现代化的重要内容之一。1.3 国内外负荷预测的研究现状长期以来,国内外对电力的预测工作进行了长期研究。产生了许多电力负荷预测的理论和方法。一类是电力弹性系数、综合电耗法、产值单耗法和增长速度法。另一类是一元相关法、多元相关法、回归分析法和灰色系统法等。如果使用前一类方法,则需要先预测出产值、产量和增长速度等数据。目前我国经济正处于转型时期,很多数据无法测出或无法侧准。而且已有的用电系数、用电定额等如今也会发生变化,用两种准确度不高的数据来计算,得到的预测值也不会很
22、准确。如果使用后一类方法,首先要用统计分析方法找出用电量、负荷与时间、各行业总产值、国内生产总值等数值之间的关系和变化的规律,从而建立数学模型,然后用数学模型来进行预测。整个预测的过程也是对数学模型不断的进行校验和调整的过程。这个过程一般来说也不是短时间就可以完成的。有些学者已开始将各种智能化算法,如遗传算法、最小绝对值滤波算法等用于在受到诸如气息变化、经济变化等随机因素干扰情况下的电力系统负荷准确预测。由于电力系统的负荷受众多不确定因素的影响,是典型的灰色系统,运用灰色系统来分析众多不确定因素与电力负荷预测的关联度已经运用广泛,但如何准确定量描述,以何种准则来进行不确定因素的人工修正仍是较为
23、困难。同时,科学家们正在研究新的预测方法,最有代表性的方法有:模糊预测技术和利用人工神经网络的预测方法。国内外关于 发表的论文很多。但对这些方法人们还尚未获得统一认识,还没形成公认的预测数学模型,所以,在生产实际中推广应用还有一定的距离。然而,它们的发展前景却是不可估量的.2 负荷预测方法综述由于电力负荷预测的重要性和自身的特点,人们在理论和实践上展开了广泛的研究,希望找到使用方便、精度高、计算快的预测方法。目前,国内外发表的电力系统负荷预测的文献很多,所采用的预测方法和预测精度各有不同,应用于工程实际的预测方法也很多。按负荷预测方法的参考体系来看,预测方法可分为确定性和非确定性预测法两类。前
24、者把电量和电力负荷用一个或一组方程来描述,电力和电力负荷与影响其变化的因素之间有着明确的对应关系。这类方法采用的模型多达几十种,如弹性系数法、时间序列法、回归分析法等。所谓非确定性预测法是认为电力负荷的变化受众多模糊的、不确定的因素影响,它不可能用精确的是数学方程来描述。近年研究的并已使用于实际工程的不确定性预测有灰色预测法、模糊预测法(如模糊聚类分析法、模糊贴近度法等)、专家系统预测法。人工神经网络方法等.2.1 传统的预测方法2.1.1 时间序列法所谓时间序列法,就是根据目前为止的历史资料数据,即时间序列所呈现出来的发展趋势和规律,用数学的方法进行延伸、外推,估计出今后各时期的指标值。时间
25、序列中的预测变量是受许许多多。大大小小的因素影响、决定的,但时间序列的分析和预测方法只是从这些因素的综合影响的最终结果,即指标值本身分析、研究其发展变化趋势和规律,而不去追究其发展变化的内在原因及指标与各影响因素之间的因果关系。其主要数学模型有AR模型、MA模型和ARMA模型等,其通用表达式为: (2.1)式中:为自回归数;为自回归阶数;为滑动平均系数;q为滑动平均阶数;为时刻的负荷值;为时刻的白噪声。 该方法原理成熟应用简便,主要根据过去的负荷值及干扰值来推算未来负荷,不需要相关因素的资料,因此在一些相关因素的预测值、某些常数难以得到时比较适用。另一方面这个方法要求的历史数据少,但由于是基于
26、统计的模型,所以预测精度不高。由于中长期电力负荷受多种因素的影响,所以此方法对电力负荷的预测存在着局限性;2.1.2 回归预测法回归分析法是电力负荷预测的一种常用方法。一个地区电力需求与该地区的国内生产总值。人口数量等多个因素相关。电力负荷回归模型预测就是根据负荷过去的历史资料,建立可以进行数学分析的数学模型,对未来的负荷进行预测。从数学上看,就是用数理统计中的回归分析法,即通过对变量的观察数据进行统计分析,确定变量之间的相关关系,从而实现预测的目的。回归预测包括线性回归和非线性回归,两者都包括一元线性回归和多元线性回归两种形式。主要采用多元非线性回归模型建立负荷与影响因素之间的关系,预测值可
27、写为: (2.2)式中:为时刻的预测负荷值;为第个影响负荷变化的因素在时刻的取值;为回归系数。影响电力系统负荷的因素很多,如气象因素(如温度、气候)、时间因素(如日夜、工作日等)、季节因素以及一些随机因素等。实际负荷预测时应根据客观条件选择合适的因素建立模型。回归分析法的主要优点在于它能够通过模型来解释各变量之间的关系,它对因果关系的处理是十分有效的。同时,它也有缺点,一是要收集较多的观测值,它的预测准确度与样本含量有关,所以付出的代价一般比较大;二是计算量大;三是要经常评审模型。2.1.3 趋势外推法当电力负荷依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条适合的函数曲
28、线反映这种变化趋势时,就可以用时间为自变量,时序数值为因变量,建立趋势模型。当有理由相信这种趋势能够延伸到未来时,赋予变量所需要的值,可以得到相应时刻的时间序列未来值,这就是趋势外推法。外推法有线性趋势外推法、对数趋势外推法、二次曲线趋势外推法、指数曲线趋势外推法,生长曲线趋势外推法。应用趋势外推法有两个假设条件:(1)假设负荷没有跳跃式变化;(2)假设负荷的发展因素也决定未来的发展,其条件是不变或变化不大。选择合适的趋势模型是应用趋势外推法的重要环节,图像识别法和差分法是选择趋势模型的两种基本方法。趋势外推法的优点是只需要历史数据、所需的数据量较少。缺点是如果负荷出现变动,会引起较大的误差。
29、2.2 负荷预测技术的新进展近年来,预测理论技术取得了很大的进展,新的预测方法不断出现,这些方法为电力负荷预测问题的研究提供了有力的工具,主要包括:模糊控制法、灰色系统法、专家系统预测法、人工神经网络预测法、小波分析法、优选组合预测法等。下面对其中几种作简要介绍。2.2.1 模糊控制法模糊控制法首先将负荷预测的输入、输出空间划分为不等的模糊集合,如高、中、低等,然后用一组模糊规则来表示负荷预测输入、输出间的关系。每一条模糊规则是一个模糊IF-THEN关系,关系前件是对各个输入变量不同模糊集合,关系后件是输出变量表达式,输出变量表示为各输入变量的线性组合,第i条规则可表示为: Ri:IF is
30、AND is AND is THEN 其中,为输入变量。为输入变量的第个模糊集合,相应隶属于子函数可采用高斯子函数或三角形子函数等。是第条规则的输出部分,为规则的输出部分中输入变量的相应系数,为常数项。对于一组输入变量,模糊控制的最终输出为各规则输出的加权模糊值。2.2.2 人工神经网络预测法负荷预测是人工神经网络(ANN)在电力系统中的主要应用部分。由于其具有高度非线性泛化和并行处理能力,不依赖于人工的经验,通过学习获得系统输入和输出之间的子函数连接关系。神经网络不是首先确定一个子函数形式,而是通过训练历史数据,得出天气变量和预测负荷的关系。它具有信息记忆、自主学习、知识推理和优化计算的特点
31、,其自学习和自适应功能是常规算法和专家系统所不具备的。用于负荷预测的人工神经网络主要有反向传播(BP)网络、径向基函数(RBF)网络、反馈性神经(Elma)网络等。在第三章将对ANN作详细介绍。2.2.3 优选组合预测技术优选组合预测有两类概念,一指将几种预测方法得到的预测结果,选取适当的权重进行加权平均的一种预测方法;二是指在集中预测方法中比较,选择拟合度最佳或差标准最小的预测模型作为最优模型进行预测。组合预测方法是建立在最大信息利用的基础上,它集结了多种单一模型所包含的信息,进行最优组合。因此,在大多数情况下,通过组合预测可以达到改善预测结果的目的。组合预测是在单个预测模型不能完全正确地描
32、述预测量的变化规律时发挥其作用。一个能够完全反映实际发展规律的模型进行预测完全可能比用组合预测效果好。如果可以找到一个能够很好地反映经济发展过程规律的模型,则用这个模型预测是很合适的,如果这个模型不易找到,或者把握不大,则采用不同预测角度建立多种模型进行组合预测是一种有效的补偿方法,特别是简单平均组合预测更是一种较为简便、稳健的实用方法。组合预测理论认为:对同一预测问题而言,多个不同预测模型的线性组合在一定条件下能够有效地改善模型的拟合能力和提高预测的精度因此,应用优化组合预测方法进行电力负荷预测,能将各个模型有机地组合在一起,综合各个模型的优点,获得更为准确的预测结果,优化组合预测方法从理论
33、上可以求得最佳的组合权系数。如果这个权系数能保持稳定,应用优化组合预测方法将取得很好的效果。但实际上优化组合预测方法得出权值常常不稳定,从而影响预测结果精度。其优点是预测精度较高,确定性较好.缺点是受到两方面的限制:一个是不可能将所有在未来起作用的因素全包含在模型中;另一个是很难确定众多参数之间的精确关系在各个部门间转换模型。2.3 本章小结 本章只是介绍了电力系统负荷预测的传统方法中的几种,还有其他方法,这里就不作介绍,如最小二乘拟合方法、卡尔曼滤波法、专家系统法等。传统的短期负荷预测方法存在一些缺陷,如数值不稳定,未能考虑温度和气象因素,在预测精度和速度上未能取得满意的效果,这也就是为什么
34、在人工神经网络方法出现后,人工神经网络首先在电力系统负荷预测上取得成功的原因。3 人工神经网络介绍人工神经网络(Artificial Neural Networks, ANN),一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果。神经网络技术作为智能科学的领头羊,是今年来发展起来的一门十分活跃的交叉学科。它涉及生物、电子、计算机、
35、数学、物理等学科,有着广泛的应用前景。3.1 人工神经网络综述3.1.1 人工神经网络的基本模型美国神经网络学家 Hecht Nielsen 给出的定义是:神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算机系统,该系统是靠其状态对外部输入信息的动态响应来处理信息。人工神经网元的研究源于脑神经元学说19世纪末,在生物、生理学领域,Waldeger等人创建了神经元学说。人们开始认识到,复杂的神经系统是由数目繁多的神经元组合而成。大脑皮层神经元的类型有多种,它的基本结构如图3.1所示。 图3.1 神经元结构示意图对于这样一种多输入、单输出的基本单元可以进一步从生物化学、电生物学、
36、数学等方面给出描述其功能的模型。从信息处理观点考察,为神经元构造了各种形式的数学模型。下面介绍经典的McCulloch-Pitts模型,图3.2给出这种模型的示意结构图。对于第个神经元,接受多个其他神经元的输入信号。各突触强度以实系数表示,这是第个神经元对第个神经元作用的加权值。利用某种运算把输入信号的作用结合起来,给出它们的总效果,称为“净输入”,以或表示。净输入表达式有多种类型,其中最简单的一种形式是线性加权求和,即: (3.1)此作用引起神经元的状态变化,而神经元的输出是其当前状态的函数。 图3.2 McCulloch-Pitts模型结构示意图McCulloch-Pitts模型的数学表达
37、式为: (3.2)式中,为阈值,是符号函数,当净输入超过阈值时,取+1输出,反之为-1输出。如果考虑输出与输入的延时作用,表达式可修正为: (3.3)利用大量神经元相互连接组成的ANN将显示出人脑的若干特征,ANN也具有初步的自适应与自组织能力。在学习或训练过程中改变突触权重值,以适应周围环境的要求。同一网络因学习方式及内容不同可具有不同的功能。ANN是一个具有学习能力的系统,可以发展知识,以至超过设计者原有的知识水平。通常,它的学习(或训练)方式可分两种,一种是有监督或称有导师的学习,这时利用给定的样本标准进行分类或模仿;另一种是无监督学习或无导师学习,这时,只规定学习方式或某些规则,而具体
38、的学习内容随系统所处的环境(即输入信号情况)而异,系统可以自动发展环境特征和规律性,具有更近似人脑的功能。ANN的模型主要有反向传播网络,径向基函数(RBF,Radial Basis Function)神经网络,PID(比例,积分,微分)神经网络,连续型Hopfield网络等等。其中,基于误差反向传播理论的前馈网络方法(BP模型)是一种比较成熟又比较简单和有效的方法。BP算法概念简单,形式对称,理论基础坚实,所得网络误差曲线较平滑,用BP算法进行负荷预测,应用最为广泛,本文就是用BP算法进行负荷预测的。这里重点讨论一下激活函数,因为它是神经网络及神经元的核心。激活函数的基本作用是:(1)控制输
39、入对输出的激活作用;(2)对输入、输出进行函数转换;(3)将可能无限域的输入变换成指定的有限范围内的输出。下面是几种常见的激活函数:1、阈值型这种函数将任意输入转化成0或1的输出,函数为单位阶跃函数。如图3.3,图3.4所示,具有此函数的神经元的输入、输出关系为: (3.4) 图3.3 不带偏差的阈值型激活函数 图3.4 带偏差阈值型激活函数2、线性型线性激活函数使网络的输出等于加权输入与偏差之和,如图3.5,图3.6所示,此函数的输入输出关系为: (3.5) 图3.5 不带偏差的线性激活函数 图3.6 带偏差的线性激活函数3、Sigmoid型Sigmoid型激活函数将任意输入值压缩到(-1,
40、1)的范围内,如图3.7,图3.8所示,此种激活函数常用对数或双曲线正切等一类S开头的曲线来表示,如对数S型函数关系为: (3.6)而双正切S型曲线的输入输出函数关系为: (3.7) Af10-110-1Af 图3.7 对数S型激活函数 图3.8 双曲线正切S型激活函数3.1.2 人工神经网络的特征ANN吸取了生物神经网络的许多优点,因而有其固有的特点:(1)高度的并行性ANN是由许多相同的简单处理单元并联组合而成,虽然每个单元的功能简单,但大量简单处理单元的并行活动,使其对信息的处理能力与效果惊人。(2)高度的非线性全局作用ANN每个神经元接受大量其他神经元的输入,并通过并行网络产生输出,影
41、响其他神经元。网络之间的这种相互制约和相互影响,实现了从输入状态到输出状态空间的非线性映射。从全局的观点看,网络整体性能不是网络局部性能的简单迭加,而表现出某种集体性的行为。(3)良好的容错性与联想记忆功能ANN通过自身的网络结构能够实现对信息的记忆。而所记忆的信息是存储在神经元之间的权值中。从单个权值中看不出所储存的信息内容,因而是分布式的存储方式。这使得网络具有良好的容错性,并能进行聚类分析、特征提取、缺损模式复原等模式信息处理工作;又宜于模式分类、模式联想等识别工作。(4)十分强的自适应、自学习功能ANN可以通过训练和学习来获得网络的权值与结构,呈现出很强的学习能力和对环境的自适应能力。
42、3.1.3 人工神经网络的分类经过多年的发展,目前的神经网络模型已经有40多种。这些模型按照网络拓扑结构可以分为两类:前向网络和反馈网络。输入输出输入输出 图3.9 前向神经网络 图3.10 反馈神经网络前向神经网络中,网络中各个神经元接受前一级的输入,并输出到下一级,网络中没有反馈,可以用一个有向无环路图表示,如图3.9所示。这种网络实现信号从输入空间到输出空间的变换,它的信息处理能力来自于简单非线性函数的多次复合。网络结构简单,易于实现。反馈网络中,输出信号通过与输入连接而返回到输入端,从而形成一个回路,如图3.10所示。这种神经网络的信息处理是状态的变换,可以用动力学系统理论处理。系统的
43、稳定性与联想记忆功能有密切关系。在前向网络中,有单层感知器、自适应线性网络和BP网络。在反馈网络中,有离散型和连续型霍普菲尔德网络。在实际的应用中,BP网络应用最为广泛,本文中将采用的也是这种网络模型。3.1.4 神经网络的发展概况神经网络的研究始于20世纪40年代,半个世纪以来,它经历了一条又兴起到衰退,又由衰退到兴盛的曲折发展历程,这一过程大致可以分为以下阶段:1、起步阶段1943年,心理学家W.S.McCulloch和数学家W.Paitts在研究生物神经元的基础上提出了“MP模型”,虽然该模型过于简单,且只能完成一些简单的逻辑运算,但它的出现开创了神经网络研究的先河,并为以后的研究提供了
44、依据。1949年,心理学家D. O. Hebb发表了论著行为自组织,首先提出了一种调整神经网络连接权值的规则著名的Hebb学习律。直到现在,Hebb学习律仍然是神经网络中一个极为重要的学习规则。1957年,FRosenblant提出了著名的感知器(Perceptron)模型,这是第一个真正的人工神经网络。这个模型由简单的阈值神经元构成,初步具备了诸如并行处理、分布存储和学习等神经网络的一些基本特性,从而确立了从系统角度研究神经网络的基础。1960年,BWidrow和MEHoff提出恶浪自适应线性单元(Adaline)网络,不仅在计算机上对该网络进行了模拟,而且还做成了硬件。同时,他们还提出了B
45、Widrow学习算法,改进了网络公值的学习速度和精度,后来这个算法被称为LMS算法,即数学上的最速下降法,这种算法在以后的BP神经网络及其他信号处理系统中得到了广泛的应用。2、低潮阶段1969年,美国麻省理工学院著名的人工智能专家MMinsky和SPapert共同出版了名为感知器的专著,指出单层的感知器网络只能用于线性问题的求解,而对于像XOR(异或)这样简单的线性问题却无法求解。他们还指出,能够求解非线性问题的网络,应该是具有隐层的多层神经网络,而将感知器模型扩展到多层网络是否有意义,还不能从理论上得到有力的证明。Minsky的悲观结论对当时神经网络的研究是一个沉重的打击。由于当时计算机技术
46、还不够发达,VLSI尚未出现,神经网络的应用还没有展开,而人工智能和专家系统正处于发展的高潮,因而很多人放弃了对神经网络的研究,致使在这以后的十年中,神经网络的研究进入一个缓慢发展的低潮时期3、快速发展阶段美国加州理工学院生物物理学家JohnJHopfield博士在1982年和1984年先后发表了两篇十分重要的论文,在他所提出的Hopfield网络模型中首次引入了网络能量的概念,并给出了网络稳定性判据。Hopfield网络引起了许多科学家的理解和重视,也引起了半导体工业界的重视。1984年,AT&T Bell实验室宣布利用Hopfield理论研究成功了第一个硬件神经网络芯片。尽管早期的Hopfield的研究才点亮了神经网络复兴的火把,从而掀起了神经网络研究的热潮。倘若说Hopfield的研究成果打破了神经网络理论10年徘徊的局面,那么1986年DERumelhart和JLMcCella