《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 多性能指标系统的控制器自设计方法及其应用
NI-LabVIEW 2025
多性能指标系统的控制器自设计方法及其应用
来源:电子技术应用2010年第10期
石 雷
湖南大学 电气与信息工程学院, 湖南 长沙 410082
摘要: 针对具有多指标的被控对象,提出一种基于神经网络的控制器自设计方法。算法利用并行遗传算法按照被控对象各项性能指标进化神经网络控制器,在遗传算法每代结束时利用适应性权重法根据各项指标数据计算综合适应度值,选择综合适应度最佳个体进行遗传操作,从而获得综合性能指标最佳的控制器。将算法应用于异步电机矢量控制系统的速度控制器自设计中,通过仿真实验验证了本方法的有效性。
中图分类号: TP273
文献标识码: A
文章编号: 0258-7998(2010)10-0076-04
Self-design method and application of multi-performance-index system controller
SHI Lei
College of Electrical and Information Engineering, Hunan University, Changsha 410082, China
Abstract: This paper proposes a method of designing controller for multi-performance-index system based on neural networks reinforcement learning. It uses parallel genetic algorithm to evolve the neurocontroller according to the different performance index. At the end of each generation during the evolution, it uses adaptive weight approach to calculate the synthetical fitness of the system and selects elitists to execute evolutionary operation. With the synthetical fitness function, it will design the optimal neurocontroller. Through applying the method to design a speed controller for an asynchronous drive system, the simulation results validate the feasibility of the proposed method.
Key words : genetic algorithm; neural network; vector control; controller self-design

   传统的控制器设计方法是基于被控对象的数学模型而进行的,而对于一些复杂未知系统,被控系统往往难于或不能得到其精确数学模型,此时需要借助于智能控制的思想来解决系统控制问题。在解决未知对象的控制器设计问题上,已有研究人员采用神经网络技术,根据环境的变化而设计控制器,如Hoskins[1]等的大时滞化工系统最优控制器,ASADA M[2]等的机器人射门控制系统,LIN C J[3-5] 和CARPENTER G A[6-7]的模糊神经网络控制器自学习方法等。
 然而,传统神经网络再励学习方法多采用预先确定结构的BP网络进行在线学习,且学习一般针对单个目标而进行,对具有多性能指标的系统则不能兼顾各方面性能。为了使被控系统具有最佳性能,提出一种再励学习方法,它针对被控系统的多个性能指标,将遗传算法和适应性权重法相结合,在遗传算法进化神经网络过程中,利用适应性权重法构造综合适应度函数以确定学习方向,遗传算法按照此学习方向执行进化操作,从而设计出兼顾多性能指标的神经网络控制器。
1 多指标控制器自设计方法
 本文提出的基于神经网络的未知对象控制器自设计方法原理如图1所示,算法首先根据被控对象的输出评估各项性能指标值,以此性能指标值作为进化算法的适应度。在遗传算法每代进化结束时,利用适应性权重法根据种群中各个体的各项指标值构建综合适应度函数,遗传算法根据综合适应度函数的变化进行全局搜索以设计未知对象的最优控制器,保证被控对象的各项性能指标综合最优。          
 算法包括指标评估、神经网络初始化设计、并行遗传算法设计、适应性权重计算四部分,以下分别介绍各部分设计规则。
1.1 指标评估

1.2 神经网络初始化
    为了实现神经网络设计的完全自主化,本文采用一种全自主设计的网络结构,包括网络连接和传递函数的自主设计,其结构图如图2 所示。首先,在这种全连接的网络结构中,每一个神经元之间都是互相连接,而且每个神经元的输出都作为同一隐层单元其他神经元的输入,如果用矩阵out1、out2…outn来表示每一层的网络输出,每层之间的连接权重用矩阵wij来表示,每层的反馈与该层的连接权重为矩阵feed_wi,则第m层的网络在k时刻的输出可以表示为:

 
    这里矩阵trans_wi将第i层每个神经元输出的传递函数进行加权组合,因此整个网络控制器的输出取决于wij、feed_wi、biasi、trans_wi等因素。算法根据各项适应度函数的变化来增加网络层数和神经元个数。如果各项指标最佳值变化很小且指标很差,则增加网络层数和神经元个数,继续进化以搜索最佳结构。
1.3 并行遗传算法
    针对多指标的进化,为了提高遗传算法的收敛速度,本文采用并行搜索方法[8],按照各项指标和综合适应度函数对系统进行并行进化。另外,为了提高算法收敛速度,本文还采用了精英迁移法[9]分别从各项指标中选择优秀个体进行遗传操作,如图3所示。各项单指标之间的混合交叉、变异如同瓜果嫁接原理,可以很好地利用优秀基因的组合功能实现个体的进化,从而起到加快收敛速度和避免陷入局部极小的作用。

1.4 适应性权重计算
    按照式(2)进行综合适应度计算时,由于各项性能指标数量级之间存在差异,不能直接进行相加,必须先进行归一化处理。适应性权重计算法按照归一化的思想,根据各项指标的数据按照下式计算指标权重[10]。

2 仿真实验与结果分析
2.1 被控对象简介

    为了验证本文提出的控制器自设计方法的有效性,本文对基于矢量控制的异步电机调速系统进行控制器设计,在进化算法的搜索作用下利用神经元自主组合构建速度环控制器,以实现精确的速度控制。
 控制器自主设计在电机调速系统中应用的原理如图4所示。交流电机数学模型具有高阶非线性特点,为实现交流电机的高性能控制,一般借助于交流电机矢量控制理论[11]将其分解为类似直流电机的励磁调节子系统和速度调节子系统两部分,以分别进行控制。这里,在速度调节子系统中利用神经元构建速度环控制器,图4虚线框中为自设计速度控制器,进化算法根据系统的性能指标来在线逐步进化神经网络控制器的权值、阈值、传递函数,通过全局搜索得到最优控制器以保证未知参数的交流电机稳定运行。

   调速系统中速度的稳定性和快速性是评估系统好坏的重要指标,因此本文选择如下指标来评估系统的性能优劣:
   
其中e(t)是速度误差,ce(t)按照式(8)计算:
   
式(7)中f1用来评估速度的误差,f2评估速度响应的快速性,f3在f1的基础上评估系统的速度静差。按照此三项指标对系统进行控制器自设计,能使调速系统具有良好的快速性与稳定性。
2.2 仿真试验
   按照上节提出的再励学习算法,本文对交流电机调速系统速度控制器自设计进行仿真试验,利用MATLAB软件中simulink工具箱建立交流电机矢量控制仿真平台,仿真实验中电机参数为:励磁电感Lm=0.102 4 H,转子电感Lr=0.108 8 H,定子电感Ls=0.1 063 H,转子电阻Rr=0.531 Ω,定子电阻Rs=0.813 Ω,转动惯量J=0.02 kgm2,额定功率Pn=5.5 kW。具体的仿真算法实施步骤如下:
 (1)根据神经元个数及其层数建立wij、feed_wi、biasi、trans_wi等矩阵,按照整数型编码方式将以上变量组建染色体个体,随机产生40组个体,形成染色体种群;
 (2)设置交叉概率Pc=0.8,变异概率Pm=0.01,采样时间T=0.001 s,将式(7)设置为各项指标适应度函数,个体作用时间为500个采样点,采用轮盘赌选择法,停机条件为综合适应度函数最佳值变化率小于0.01;
 (3)将40个染色体个体分别代换神经网络控制器的参数进行电机速度控制,每一个体作用时间为0.5 s,在每一代个体作用于电机测试结束之后,利用适应性权重法计算个体的综合适应度值,再对各项指标分别排序;
 (4)利用轮盘赌法分别选择各单项指标和综合指标的2个最优个体,将三组单指标最优个体相互混合进行交叉、变异操作,综合指标最优2个体间进行交叉、变异操作,四项指标共产生8个子代个体;
 (5)将步骤(4)生成的子个体替换种群中适应度最低的8个个体,形成新的种群;
 (6)判断最佳综合适应度是否满足停止进化的条件,如果满足则执行步骤7,否则执行步骤3;
 (7)将综合指标最佳的个体对应的数值代换到神经网络控制器中,使调速系统稳定运行。
 经过70代的进化计算,进化算法搜索到了能够保证电机稳定运行的神经网络控制器结构与参数,实验得到的进化过程速度变化曲线如图5(a)所示,最佳适应度值变化曲线如图5(b)所示。

 进化结束后,对自设计的最优控制器进行性能测试,测试中在0.5 s时速度给定从0变为1 000 r/min,观测调速系统的动态和静态性能。另外,以稳定性作为单指标设计调速系统速度控制器,得到的结果也进行上述测试,两种控制器动静态响应曲线如图6所示。

 由以上仿真结果可知,进化算法通过全局搜索,在测试各种控制性能不同的网络结构后,最终获得了满足电机稳定运行的速度控制器。由于进化目标不同,最终获得的控制器性能也具有很大差异。由于本文考虑了动态性能和静态性能等多个指标,获得的控制器比按单指标设计的控制器能更好地保证系统的动静态性能。由于稳定性单指标没有考虑快速性问题,获得的控制器虽然能够保证系统稳定,但是快速性却很差。
    本文提出了一种基于神经网络的多性能指标系统的控制器设计方法,利用适应性权重法和遗传算法相结合,遗传算法按照适应性权重法确定的进化方向进行遗传操作以设计兼顾各项性能指标的神经网络控制器。将该算法应用于交流电机矢量控制系统速度控制器自设计中,仿真实验验证了本文提出的控制器自设计方法的可行性。基于神经网络的控制器自设计方法能够增强系统的环境适应能力,特别适合太空探测器等人类不易维修、设备环境和故障无法预料的复杂系统容错控制,具有十分重要的应用价值。
参考文献
[1] HOSKINS J C. Process control via ANN and RL[J].Computers & Chemical Engineering, 1992(16):241-251.
[2] ASADA M. Purposive behavior acquisition for a real robot by vision-based RL[J].Machine Learning. 1996(22):163-187.
[3] LIN C J. Reinforcement learning for an ART-Based fuzzy adaptive learning control network[J]. IEEE Trans NN,1996(7):709-730.
[4] LIN C J. An ART-based fuzzy adaptive learning control network[J]. Proc IEEE Intconf on Fuzzy systems,1994:1-6.
[5] LIN C J. Reinforcement structure/parameter learning for NN-based fuzzy logic control systems[J].IEEE Trans Fuzzy systems, 1994(2):46-63.
[6] CARPENTER G A. Fuzzy ART: Fast stable learning and categorization of analog patterns[J].Neural Network, 1991(2):759-771.
[7] CARPENTER G A.Fuzzy ARTMAP[J]. IEEE Trans NN.1992(3):698-712.
[8] QIN Yong Fa, ZHAO Ming Yang. Research on a new multiobjective combinatorial optimization algorithm. Proceedings of the 2004 IEEE International Conference on Robotics and Biomimetics, 2004:187-191.
[9] 祁荣宾,钱锋,杜文莉等. 基于精英选择和个体迁移的多目标遗传算法. 控制与决策, 2007,22(2):164-168.
[10] MITSUO G, CHEN Run Wei.Genetic algorithms and engineering optimization. Beijing, Tsinghua University Press, 2003.
[11] BOSE B K.现代电力电子学与交流传动[M].王聪,赵金,于庆广,等译.北京:机械工业出版社,2005.

此内容为AET网站原创,未经授权禁止转载。