机器人神经网络控制汇总.docx
- 文档编号:5012350
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:14
- 大小:204.28KB
机器人神经网络控制汇总.docx
《机器人神经网络控制汇总.docx》由会员分享,可在线阅读,更多相关《机器人神经网络控制汇总.docx(14页珍藏版)》请在冰豆网上搜索。
机器人神经网络控制汇总
第一部分机器人手臂的自适应神经网络控制
机器人智能控制的研究非常热门,并已取得相当丰富的成果。
使得
机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,
机器人的位置、速度等状态变量跟踪给定的理想轨迹。
与一般的机械系统一样,
当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。
因此,可采用经典控制理论的设计方法一一基于数学模型的方法设计机器人控制器。
但是在实际工程中,由于机器人模型的不确定性,使得研究工作者很难得到机器人精确的数学模型。
采用自适应神经网络,可实现对机器人动力学方程中未知部分的精确逼
近,从而实现无需建模的控制。
下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov)方法设计机器人手臂跟踪控制的问题。
1、控制对象描述:
选二关节机器人力臂系统(图1),其动力学模型为:
图1二关节机器人力臂系统物理模型
M(q)q+V(q,d)q+G(q)+F(q)+t
其中
M(q)屮1"P;"2P3COSq2P2+P3COSq2],V(q,q)斗一Pqq2Sinq2
LP2+P3cosq2P2」L9361Sinq2
6计鶯:
鶯®],FZsgnq…W0.2血。
其中,q为关节转动角度向量,M(q)为2乘2维正定惯性矩阵,V(qq)为
2乘2维向心哥氏力矩,G(q)为2维惯性矩阵,F(q)为2维摩擦力矩阵,T为
未知有界的外加干扰,T为各个关节运动的转矩向量,即控制输入。
已知机器人动力学系统具有如下动力学特性:
ET(M(q)-2C(q,q))E=0
我们取P=〔Pi,P2,P3,P4,P>〔2.9,0.76,0.87,3.04,,两个关节的位置指令分别为qid=0.1sin(t),q2d=0.1coSt),即设计控制器驱动两关节电
机使对应的手臂段角度分别跟踪这两个位置指令。
2、传统控制器的设计及分析:
定义跟踪误差为:
e(t)=qd(t)—q(t)
定义误差函数为:
(4)
r=e+Ae
其中八=at>0。
贝U
q=-r+qd+Ae
MH=M(qd-q十八e)=M(qq
=M(Md+八e)+vq+G+F+Td-T
=M(qd+八*)—Vr+V(qd+A©)+G+F+Td-
=-Vr-Tf+T
(6)
f(x)=M(dd+M)+V(qd+Ae)+G+F
在实际工程中,M(q),V(q,q),G(q)和F(q)往往很难得到精确的结果,
导致模型不确定项f(X)为未知。
为了设计控制器,需要对不确定项f(x就行逼近,假设?
为f的逼近值。
设计控制律为
将控制律式(7)代入式(5),得
Mr|=VrKvHTd
=-(Kv+V)rfT=-(Kv+V)r+?
其中f为针对f的逼近误差,f=f-?
?
厂"+T
如果定义Lyapunov函数
L二1rTMr
L=rTMr)+1rTMr
2
L=rT?
o-rTKvr
2
=—rTKvr+-rT(M-2V>+rT?
o
2
这说明在Kv固定条件下,控制系统的稳定依赖于?
0,即*对f的逼近精度
及干扰T的大小。
3、基于RBF神经网络逼近的机器人手臂控制
1).基于RBF网络的逼近算法
已经证明,采用RBF网络可以实现对任意连续函数的精确逼近。
因此,可以采用RBF网络实现对不确定项f的逼近。
在RBF网络结构中,取X=X1,x2,....xnr为网络的输入向量。
设RBF网络的
径向基向量H=h,…,hmT,其中hj为高斯基函数:
其中网络第j个结点的中心矢量为Cj=Cj1,…,Cjn】,i=1,2,…,n。
假设存在权值W,逼近函数f(x)的理想RBF网络输出为:
(11)
其中W网络的权向量,h=th1,hj||hn],dx)为逼近误差,
考虑式(6),针对f(x)中包含的信息,逼近函数f(x)的RBF网络输入取:
2).基于RBF网络的控制器和自适应律设计
定义RBF神经网络的实际输出为:
其中F为对称正定阵,F=FT>0。
将式(11)、式(13)和式(15)代入式(5),得
Mri=-(KVm)r+WT机x)+(dt)+v=-(KVm)r+£(17)
其中?
=WTh(x)+(£+t)+v,v为用于克服神经网络逼近误差£和干扰T的鲁
L=rTMr|+1rTMr+tr(WTF'W)
将式(17)代入上式,得
有界,且跟踪误差et)及其导数et)的收敛值随神经网络逼近误差上界扰上界bd的增大而增大,并可通过增大Kv的值达到任意小。
(2)考虑鲁棒项,v取式(18),则
rT(尹T+v)=rT(&+T)+rTv=rT(&+t)Tr|(名n+bd)兰0
L<-rTKvr<0
由于L>0,且M(q)有界,则r(t)、W和W为有界。
由于L=-2rTKvr,
又由于式(17)的右边信号都有界,贝打有界,L有界,贝肪根据Barbalat引理,
L趋近于零,即r(t)趋近于零,从而可得出e(t)和@(t)趋近于零。
4、SIMULINK仿真验证
仿真图如下:
input
S-Function
Clock
Ctrl
S-FLjnction3
angles
ToWorkspgcel
>plant
*
S-Function2
j~anglel~|
ToWorkspace
norfunc
Workspace^
ToWorkspaces
Ictrl_valde1
.1TpWofkcpaca3
]►ctr_value2
ToVVc「kspace4
Scope
由于系统比较复杂,直接采用模块搭建比较麻烦,所以本设计中采用S_function动态函数来实现前面推导的算法公式,实现了三个动态函数:
input.m产生输入、ctrl.m为控制器实现、plant.m表示控制对象:
其中控制器实现函数ctrl.m
RBF神经网络的中心矢量及近似标准差分
别设置为:
c=0.1*[-L5
-1
-0,5
Q
0.5
1
h5.
-L5
-1
-0.5
0
0.5
1
h5:
-1,5
-1
-0.5
0
0.5
1
1・5:
-k5
-1
-0.5
0
0.5
1
1-5-
-k5
-1
-0.5
0
O'.5
1
1*5]:
b=0.20:
这两个值的取值对神经网络控制的作用很重要,如果参数取值不合适,将使高斯基函数
无法得到有效的映射,从而导致
RBF网络无效。
网络输入取z=eeqdqdqd],初始状态设置为零,控制参数取
KV=diag{50,50},F=diag{25,25}。
高斯基函数的m语言实现如下:
z=[e;de:
qd;dqd:
ddqd]:
forj=l:
1:
nod*
hl(j)=exp(-nar3ii(z(l)-c(:
j))*2/'(b#b));
h2(j)=exp(-nor3a(z
(2)-c(:
j))"2/):
end
IF=25*eye
(2):
□for1=1U;node
Isys(i)=F(l,l)*hl(iUr
(1);
sys(i+node)=J:
(2,2)*h2(i)#r
(2);
RBF网络
end
逼近效果如下图,由图可以看岀开始阶段拟合误差较大,但随着时间的增大,能够较好地拟合原函数,即使原函数很复杂,通过调整参数,逼近效果会更好。
||
——-I***
/
*
1
■
■
■
■
■
原函数
RBF逼近函数
4
P\
1
45
40
35
30
25
20
15
10
5
5
10
20
25
15
时间(S)
50
数函的近一MnnR与数函原
30
对两个关节的位置指令分别为
qd=0.1sin(t),q2d=0.1cos(t)跟踪效
果如下图所示,开始时有一定的误差,
但稳定后能无静差跟踪,效果很好。
位置指令
跟踪曲线
0.1
0.05
一一q踪跟置节关
-0.05
-0.1
-0.15
-0.2
1
■■WF
位置指令
“跟踪曲线
/
■
■iT/
■
f
h
*■
■
■
■1-
J
■/Ify
八、、
■
\
:
1
TJ
r■
1h
1
\
T
■
+/+
■
1
J/
■
■
■
■
:
\
c
B
J
I
■
1?
■
r
\
■\
1
1
■
■
■
X
*
■
*
■/L
T
f
f
J
■
■
■
卜
■
t
;
■
I
/
JR:
\/
/r
丿
F
■J/f
10
12
14
第二部分对《自适应神经网络》的理解与体会
本门课程是继《线性系统》后的一门比较理论的关于控制理论的课程,与线性系统不同的是自适应神经网络控制研究的对象更多的是非线性、参数未
知、模型未知的复杂系统,经典的控制方法在面对这样的系统时显得非常乏力,于是,自适应控制、学习控制、智能控制如神经网络遗传算法等就大有用武之地了。
通过本门课程的学习我学到了backstepping方法,神经网络控制方法,
通过严格的公式推导出神经网络的控制思想还是挺有趣味与吸引力的,循序渐
进的过程让我懂得了虚拟控制、匹配条件、延迟参数设计等概念,不管以后自己是否走理论研究这条道路,我感觉在这么短的时间内学到的这些知识还是很
有价值的。
下面对我学到的一些知识进行简要的总结:
自适应控制的研究对象是具有不确定性的系统,这里所指的“不确定性”是指被控对象及其环境的数学模型不是完全确定的。
对于具有较强不确定性的被控系统,如何设计一个满意的控制器,就是自
适应控制所要研究的问题。
参照在日常主活中生物能够通过自觉调整自身参数改变自己的习性,以适应新的环境特性,从而提出了自适应控制器的设想。
自适应控制器应能够及时修正自己的特性以适应对象和扰动的动态特性变化,使
整个控制系统始终获得满意的性能。
因此,自适应控制方法就是依靠不断采集
的控制过程信息,确定被控对象的当前实际工作状态,根据一定的性能准则,产生合适的自适应控制规律,从而实时地调整控制器结构或参数,使系统始终
自动地工作在最优或次最优的运行状态下。
自适应控制是现代控制的重要组成都分,它同一般反馈控制相比具有如下
特点:
(1)一般反馈控制主要适用于确定性对象或可以预知的对象,而自适应控制主要研究具有不确定性的对象或难以确知的对象。
(2)—般反馈控制具有较强的抗干扰能力,能够消除状态扰动所引起的系
统误差;而自适应控制由于具有辨识对象和在线修改参数的能力,因而不仅能
消除状态扰动引起的系统误差,而且还能消除系统结构扰动引起的系统误差。
(3)一般反馈控制系统的设计必须依赖系统特性的数学模型及其环境变
化状况,而自适应控制系统设计则对数学模型的依赖很小,仅需要较少的验前
知识,但自适应控制的实现往往更多地依靠计算机技术。
(4)自适应控制是较为复杂的反馈控制,它在一般反馈控制的基础上增加
了自适应控制环节或系统参数辨识器,另外还附加了一个可调系统。
Backstepping设计方法是针对不确定性系统的一种系统化的控制器综合
方法,是将Lyapunov函数的选取与控制器的设计相结合的一种回归设计方法。
在处理线性和某些非线性系统时,该方法在改善过渡过程品质方面展现出较大的潜力,应用在机器人控制、电机控制、液压控制、船舶控制等许多控制领域。
Backstepping的具体的基本设计思想是将复杂的非线性系统分解成不
超过系统阶数的子系统,然后单独设计每个子系统的部分Lyapunov函数,在
保证子系统具有一定收敛性的基础上获得子系统的虚拟控制律,在下一个子系
统的设计中,将上一个子系统的虚拟控制律作为这个子系统的跟踪目标。
相似
于上个子系统的设计,获得该子系统的虚拟控制律;以此类推,最终获得整个闭环系统的实际控制律,且结合Lyapunov稳定性分析方法来保证闭环系统的收敛性。
Backstepping可用来设计控制方案以满足三角结构单输入单输出非线性系统的匹配条件。
Backstepping设计方法之所以受到国内外学者的极大关注,主要原因为该方法取消了系统不确定性满足匹配条件的约束,从而解决了相对
复杂的非线性系统的控制问题。
在现实世界中,存在大量非线性系统具有者可以经过微分同胚变换成)严格反馈等规范型;该方法为复杂非线系统的
Lyapunov函数设计提供了较为简单的结构化、系统化方法,解决了一直以来具有严格反馈等结构的非线性系统稳定性分析和控制器设计的难题。
自适应backstepping设计方法发展的初级阶段,要求系统不确定性能够线性参数化。
随着神经网络与模糊系统等智能控制技术的不断发展,很好地取消了自适应backstepping设计所需的该约束条件,从而使得backstepping技术获得了
很大的发展空间。
特别是神经网络和自适应技术的引入,极大地推广了backstepping方法的应用。
下图
人工神经网络利用物理器件来模拟生物神经网络的某些结构和功能。
是最典型的人工神经元模型,它是大多数神经网络模型的基础。
Wji---代表神经元i与神经元j之间的连接强度(模拟生物神经元之间突
触连接强度),称之为连接权;
Ui---代表神经元i的活跃值,即神经元状态;
Vi---代表神经元j的输出,即是神经元i的一个输入;
3---代表神经元的阐值。
该网络结构一般
人工神经网络是一个并行与分布式的信息处理网络结构,
由许多个神经元组成,每个神经元由一个单一的输出,它可以连接到许多其他的神经元,其输出有多个连接通路,每个连接通路对应一个连接权系数。
严格来说,神经网络是一个具有如下性质的有向图。
对于每个结点有一个状态变量xj;
结点i到结点j有一个连接权系数wji;
对于每个结点有一个阈值Bj;
对于每个结点定义一个变换函数fi[x,Wji,日j(iHj)],最常见的情形
为f(送WjjXj-日j)。
i
下图表示了一个典型的前馈神经网络结构。
神经网络的应用已经涉及到各个领域,且取得了很大的进展。
机器人控制:
对机器人轨道控制,操作机器人眼手系统,用于机械手的故障诊断及排除,智能自适应移动机器人的导航,视觉系统。
自动控制领域:
主要有系统建模和辨识,参数整定,极点配置,内模控制,
优化设计,预测控制,最优控制,滤波与预测容错控制等。
处理组合优化问题:
成功解决了旅行商问题,另外还有最大匹配问题,装箱问题和作业调度问题。
模式识别:
手写字符,汽车牌照,指纹和声音识别,还可用于目标的自动识别,目标跟踪,机器人传感器图像识别及地震信号的鉴别。
第三部分对研究的认识和感想
麻省理工大学人工智能实验室关于做研究的看法告诉我们如何做研究,为我们提供的对做研究本身(阅读、写作和程序设计)、理解研究过程以及开
始热爱研究(方法论、选题、选导师和情感因素)建议都很有参考意义的。
想想自己的学习研究方法,颇感差距与惋惜。
我将自己的研究方向定位为应用型
研究,认为阅读参考文献、写作不那么重要,但真的是这样的吗!
现在不培养好的研究习惯甚至连研究总结都不重视的话,这条路能走多远?
阅读书籍进行
的是基础性的、系统性的学习,这是本科生该干的,对于研究生,除非为了拓宽知识面,决不应该停留在书本上,我们应该走出去,密切关注领域动态、领略大牛风采,多看近期发表的期刊论文,开拓思维以便灵感的喷发,否则,作为研究生就落伍了,说明只停留在本科水平,需奋起直追!
选择自己的问题取向,不忘创新。
作为一个研究生要认清自己不再是个容器,等着老师把某些东西倒在茶杯里,而是要开始逐步发展和开发自己。
要重视问题取向的安排,所有的精力、所有修课以及读的书里面都应该要有一个关注的焦点,而不能像大学那般漫无目标。
循序渐进地练习论文写作。
如何才能有条不紊、条理清楚,并把整体架构组织得通畅可读?
首先,必须要循序渐进的训练,先从少的慢慢写成的,而且要在很短的时间内训练到可以从一万字写到十万字。
这么大规模的论文谁都
写得出来,问题是写得好不好,因为这么大规模的写作,有这么许多的脚注,还要注意首尾相映,使论述一体成型。
为了完成一个大的、完整的、有机的架构模型,必须要从小规模的篇幅慢慢练习,这是一个最有效的办法。
尝试接受挑战,勇于克服。
每隔一段时间就给自己一个挑战,当然我说的是关于研究课题的挑战而非游戏,挑战一个自己做不到的东西,不一定要求自己每次都能顺利克服那个挑战,但是要努力去尝试,敢于挑战是勇气,克服困难主要靠强大的内心。
记得给自己保留一些思考的时间。
真切去了解自己的研究领域,自己所看到的东西是什么?
整体意义是什么?
整体的轮廓是什么?
千万不要被枝节淹没,虽然枝节是最重要的开始,但是一天总也要留一些时间好好思考、慢慢沉淀。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器人 神经网络 控制 汇总