专利 一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210637360.7 (22)申请日 2022.06.07 (71)申请人北京航空航天大学地址 100191 北京市海淀区学院路37号 (72)发明人郑联语　周健　王艺玮　樊伟　曹彦生　 (51)Int.Cl. B25J 9/16(2006.01) (54)发明名称一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法 (57)摘要本发明公开了一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，首先研究机器人位姿与定位误差之间的定性关系并确定不同误差等级下机器人位姿坐标阈值，接着提出机器人定位误差在线补偿方法，利用增量模型重构算法自动生成表征机器人末端实际位姿与目标位姿对应关系的深度学习映射模型，将误差提前补偿至规划路径中。在线补偿算法执行过程中，根据机器人位姿变化判断误差等级变化并触发对映射模型的精度验证，当模型精度不满足要求时则依次触发增量学习和模型重构机制，直至映射模型满足精度要求。以上特点使得本发明方法能有效实现工业机器人定位误差的在线补偿与实时校准。权利要求书3页说明书10页附图6页 CN 114800529 A 2022.07.29 CN 114800529 A 1.一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，包括以下步骤： S1、创建机器人误差分布图，建立误差等级与机器人位姿空间的对应关系； S2、利用模型重构算法创建建立机器人末端实际位姿和目标位姿对应关系的映射模型，并利用映射模型补偿机器人定位精度； S3、触发映射模型自适应优化机制，利用增量学习算法优化映射模型； S4、验证优化后的映射模型，当精度不满足要求时利用模型重构算法重新创建映射模型，直至达到目标精度要求。 2.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S1具体为： S11、将机器人常用工作空间划分为不同区块，驱动机器人末端运动到不同区块； S12、采集末端的目标位姿和实际位姿数据，计算末端定位误差； S13、创建末端位姿的误差分布图，建立误差等级与末端位姿空间的对应关系。 3.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S13中建立的误差等级与末端位姿空间对应关系表示如下：式中表示根据第i个定位误差等级确定的位姿空间，而位姿空间又包含不同位姿坐标的阈值范围机器人末端位姿由六维坐标确定，确定位姿空间的坐标维数m≤ 6。 4.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S2中的模型重构算法是基于神经结构搜索技术并结合增量学习机制创建的；所述神经结构搜索技术包含三个要素：控制器、搜索空间和候选模型；所述候选模型即为映射模型，最深九层结构，前部分由卷积神经网络搭建，是为稳定块，最多包含五层；后部分由全连接网络搭建，是为塑性块，最多包含四层；所述搜索空间提供了五种卷积神经网络层和五种全连接网络层供控制器决策搜索；所述控制器由并行连接的卷积神经网络层构成，输入是(9,1)的随机向量，表示候选模型9个网络层待搜索；选用五层小尺寸的卷积网络层进行特征提取，将五层卷积网络提取的特征合并在一起，构成深度为5的混合特征，紧接着将特征平均池化得到(9,5)的决策矩阵；输出激活函数选用SoftMax， 9行表示确定候选模型需要9维决策，分别对应候选模型的9个网络层，前5维决策确定稳定块，后4维决策确定塑性块； 5列表示每维决策有5个可选项；所述增量学习机制表示设置三个连续的学习周期，按照增量学习范式训练并验证候选模型，表示为：权　利　要　求　书 1/3 页 2 CN 114800529 A 2式中表示t时刻的模型重构算法，表示待确定的映射模型， (xt‑2,yt‑2)、 (xt‑1, yt‑1)、 (xt,yt)分别表示t ‑2、 t‑1和t时刻下的末端位姿对数据，分别表示t ‑2、 t‑1和t时刻下的重构映射模型， Mt‑2、 Mt‑1、 Mt则分别表示存储在记忆中的t ‑2、 t‑1和t时刻的部分样本数据。 5.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S2具体为： S21、将机器人末端位姿数据对划分为三个学习周期的数据流； S22、根据控制器输出的决策矩阵创建候选模型； S23、在增量学习范式下训练、验证候选模型，从前进性、正确性和效率三个维度评价候选模型； S24、计算控制器的决策奖励，进而计算控制器的训练损失梯度； S25、朝着损失梯度下降的方向优化控制器，直至控制器决策创建最优的映射模型。 6.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S23中的前进性旨在评价不同学习周期之间映射模型的精度变化；所述步骤S23中的正确性旨在评价不同重构周期之间映射模型的精度变化；所述步骤S23中的效率旨在评价不同重构周期之间映射模型的训练时间变化。 7.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S24中计算控制器的决策奖励表示如下：式中分别表示重构周期e下映射模型在第1、 2、 3学习周期中的映射损失，分别表示重构周期e ‑1下映射模型在第1、 2、 3学习周期中的映射损失，分别表示重构周期e下映射模型在第1、 2、 3学习周期中的训练时间，分别表示重构周期e ‑1下映射模型在第1、 2、 3学习周期中的训练时间；所述步骤S24中计算控制器的训练损失表示如下：式中θ泛指控制器的权值参数， ae,i表示重构周期e时控制器决策序列中的第i个决策分量， Re表示周期e时控制器的决策奖励， N为样本批量。 8.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S3中的映射模型自适应优化机制即通过监测机器人末端位姿坐标是否超阈判断末端定位误差是否发生变化并触发对映射模型的精度验证程序，以此确保模型长期稳定运行。 9.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法，其特征在于，所述步骤S3中的增量学习算法表示为：权　利　要　求　书 2/3 页 3 CN 114800529 A 3

专利 一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法

专利一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法