(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210637360.7
(22)申请日 2022.06.07
(71)申请人 北京航空航天大 学
地址 100191 北京市海淀区学院路37号
(72)发明人 郑联语 周健 王艺玮 樊伟
曹彦生
(51)Int.Cl.
B25J 9/16(2006.01)
(54)发明名称
一种基于定长记忆窗口增量学习和增量模
型重构的工业机 器人定位 误差在线补偿方法
(57)摘要
本发明公开了一种基于定长记忆窗口增量
学习和增量模型重构的工业机器人定位误差在
线补偿方法, 首先研究机器人位姿与定位误差 之
间的定性关系并确定不同误差等级下机器人位
姿坐标阈值, 接着提出机器人定位误差在线补偿
方法, 利用增量模型重构算法自动生成表征机器
人末端实际位姿与 目标位姿对应关系的深度学
习映射模型, 将误差提前补偿至规划路径中。 在
线补偿算法执行过程中, 根据机器人位姿变化判
断误差等级变化并触发对映射模 型的精度验证,
当模型精度不满足要求时则依次触发增量学习
和模型重构机制, 直至映射模型满足精度要求。
以上特点使得本发明方法能有效实现工业机器
人定位误差的在线补偿与实时校准。
权利要求书3页 说明书10页 附图6页
CN 114800529 A
2022.07.29
CN 114800529 A
1.一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿
方法, 其特 征在于, 包括以下步骤:
S1、 创建机器人误差分布图, 建立 误差等级与机器人位姿空间的对应关系;
S2、 利用模型重构算法创建建立机器人末端实际位姿和目标位姿对应关系的映射模
型, 并利用映射模型补偿机器人定位精度;
S3、 触发映射模型自适应优化机制, 利用增量学习算法优化映射模型;
S4、 验证优化后的映射模型, 当精度不满足要求时利用模型重构算法重新创建映射模
型, 直至达到目标精度要求。
2.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特 征在于, 所述 步骤S1具体为:
S11、 将机器人常用工作空间划分为 不同区块, 驱动机器人末端运动到不同区块;
S12、 采集末端的目标位姿和实际位姿数据, 计算末端定位 误差;
S13、 创建末端位姿的误差分布图, 建立 误差等级与末端位姿空间的对应关系。
3.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特征在于, 所述步骤S13中建立的误差等级与末端位姿空间对应 关系
表示如下:
式中
表示根据第i个定位误差等级确定的位姿空间, 而位姿空间又包含不同位姿
坐标的阈值范围
机器人末端位姿由六维坐标确定, 确定位姿空间的坐标维数m≤
6。
4.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特征在于, 所述步骤S2中的模型重构算法是基于神经结构搜索技术
并结合增量学习机制创建的;
所述神经 结构搜索技 术包含三个要素: 控制器、 搜索空间和候选模型;
所述候选模型即为映射模型, 最深九层结构, 前部分由卷积神经网络搭建, 是为稳定
块, 最多包 含五层; 后部分由全连接网络搭建, 是为塑性 块, 最多包 含四层;
所述搜索空间提供了五种卷积神经网络层和五种全连接网络层供控制器决策搜索;
所述控制器由并行连接的卷积神经网络层构成, 输入是(9,1)的随机向量, 表示候选模
型9个网络层 待搜索; 选用五层小尺 寸的卷积网络层进 行特征提取, 将五层卷积网络提取的
特征合并在一起, 构成深度为5的混合特征, 紧接着将特征平均池化得到(9,5)的决策矩阵;
输出激活函数选用SoftMax, 9行表示确定候选模型需要9维决策, 分别对应候选模型的9个
网络层, 前5维决策确定稳定块, 后4维决策确定塑性 块; 5列表示每维决策有5个可选项;
所述增量学习机制表示设置三个连续的学习周期, 按照增量学习范式训练并验证候选
模型, 表示 为:
权 利 要 求 书 1/3 页
2
CN 114800529 A
2式中
表示t时刻的模型重构算法,
表示待确定的映射模型, (xt‑2,yt‑2)、 (xt‑1,
yt‑1)、 (xt,yt)分别表示t ‑2、 t‑1和t时刻下的末端位姿对数据,
分别表示t ‑2、
t‑1和t时刻下的重构映射模型, Mt‑2、 Mt‑1、 Mt则分别表示存储在记忆中的t ‑2、 t‑1和t时刻的
部分样本数据。
5.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特 征在于, 所述 步骤S2具体为:
S21、 将机器人末端位姿数据对划分为 三个学习周期的数据流;
S22、 根据控制器输出的决策矩阵创建候选模型;
S23、 在增量学习范式下训练、 验证候选模型, 从前进性、 正确性和效率三个维度评价候
选模型;
S24、 计算控制器的决策 奖励, 进而计算控制器的训练损失梯度;
S25、 朝着损失梯度下降的方向优化控制器, 直至控制器决策创建最优的映射模型。
6.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特征在于, 所述步骤S23中的前进性旨在评价不同学习周期之间映射
模型的精度变化;
所述步骤S23中的正确性旨在评价 不同重构周期之间映射模型的精度变化;
所述步骤S23中的效率旨在评价 不同重构周期之间映射模型的训练时间变化。
7.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特 征在于, 所述 步骤S24中计算控制器的决策 奖励表示如下:
式中
分别表示重构周期e下映射模型在第1、 2、 3学习周期中的映射损失,
分别表示重构周期e ‑1下映射模型在第1、 2、 3学习周期中的映射损失,
分别表示重构周期e下映射模型在第1、 2、 3学习周期中的训练时间,
分别表示重构周期e ‑1下映射模型在第1、 2、 3学习周期中的训练时间;
所述步骤S24中计算控制器的训练损失表示如下:
式中θ泛指控制器的权值参数, ae,i表示重构周期e时控制器决策序列中的第i个决策分
量, Re表示周期e时控制器的决策 奖励, N为样本批量。
8.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特征在于, 所述步骤S3中的映射模型自适应优化机制即通过监测机
器人末端位姿坐标是否超阈判断末端定位误差是否发生变化并触发对映射模型的精度验
证程序, 以此确保模型长期稳定运行。
9.如权利要求1所述的基于定长记忆窗口增量学习和增量模型重构的工业机器人定位
误差在线补偿方法, 其特 征在于, 所述 步骤S3中的增量学习算法表示 为:
权 利 要 求 书 2/3 页
3
CN 114800529 A
3
专利 一种基于定长记忆窗口增量学习和增量模型重构的工业机器人定位误差在线补偿方法
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:19:11上传分享