安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210468964.3 (22)申请日 2022.04.29 (71)申请人 广东工业大 学 地址 510090 广东省广州市越秀区东 风东 路729号 (72)发明人 陈韦池 曾超 郭靖 刘远 蔡述庭 熊晓明 (74)专利代理 机构 广州粤高专利商标代理有限 公司 44102 专利代理师 刘俊 (51)Int.Cl. B25J 9/16(2006.01) (54)发明名称 一种基于多源信息深度强化学习的机械臂 控制方法及系统 (57)摘要 本发明涉及机械臂控制技术领域公开了一 种基于多源信息深度强化学习的机械臂控制方 法及系统, 包括以下步骤: S1.采集机械臂的图像 数据及机械臂的本体数据; S2.采用示教学习初 始化力控策略的参数; S3.解析图像数据及机械 臂本体信息数据, 得到图像的联合特征, 并通过 强化学习模型获得实时力控策略; S4.通过初始 化的力控策略的参数更新实时力控 策略, 并通过 更新后的实时力控策略下达运动控制指令给机 械臂进行工作, 采集工作中的图像数据和机械臂 本体信息数据; S5.更新图像数据、 机械臂 本体信 息数据, 回到步骤S3, 不断优化机械臂力控策略。 本发明解决了现有机械臂控制技术获取外界信 息的途径很有限的问题, 且具有采用多源信息输 入, 方便训练的特点。 权利要求书2页 说明书6页 附图3页 CN 114789443 A 2022.07.26 CN 114789443 A 1.一种基于多源信息深度强化学习的机 械臂控制方法, 其特 征在于: 包括以下步骤: S1.采集机 械臂的图像数据及机 械臂的本体数据; S2.采用示教学习初始化力控策略的参数; S3.解析图像数据及机械臂本体信息数据, 得到图像的联合特征, 并通过强化学习模型 获得实时力控策略; S4.通过初始化的力控策略的参数更新实时力控策略, 并通过更新后的实时力控策略 下达运动控制指令给机 械臂进行工作, 采集工作中的图像数据和机 械臂本体信息数据; S5.更新图像数据、 机 械臂本体信息数据, 回到步骤S3, 不断优化机 械臂力控策略。 2.根据权利要求1所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 所述的图像数据包括深度相机采集到的深度图像数据和RGB相机采集到的RGB图像数据。 3.根据权利要求1所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 所述的本体数据包括机械臂各个关节的力/力矩传感器的感知数据、 机械臂末端执行器的 状态参数; 所述的状态参数包括末端坐标、 关节角度和角速度。 4.根据权利要求1所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 所述的力控策略的参数包括机 械臂位姿和线性 二次调节器中的系数矩阵。 5.根据权利要求4所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 步骤S2, 具体为: S201.通过拖曳机 械臂进行示教学习的数据采集; S202.通过高斯混合模型对获得的示教学习的数据进行建模, 并计算出模型的协方差 与均值, 得到模型的协方差矩阵; S203.通过高斯混合模型的协方差矩阵初始化 二次型调节器的系数矩阵; S204.通过高斯混合模型的均值初始化机 械臂位姿。 6.根据权利要求5所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 所述的示教学习的数据包括机 械臂的位姿信息、 关节角度信息、 角速度信息 。 7.根据权利要求5所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 步骤S203, 具体为: 通过高斯混合模型的协方差矩阵初始化 二次型调节器的R矩阵和Q矩阵。 8.根据权利要求5所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 步骤S3, 具体为: S301.将机械臂的图像数据及本体数据输入卷积神经网络得到若干个模态特 征表示; S302.各个模态特征表示分别通过其对应的神经网络层后统一通过隐藏层, 将通过 隐 藏层后得到的模态映射到联合空间, 得到统一联合特 征; S303.将统一联合联合特 征通过隐藏层得到初始预测; S304.将初始预测输入强化学习模型中得到 机械臂的力控策略。 9.根据权利要求8所述的基于多源信 息深度强化学习的机械臂控制方法, 其特征在于: 通过初始化的力控策略的参数更新实时力控策略, 具体为: 通过初始化的力控策略的二次 型调节器的系数矩阵和机 械臂位姿更新实时力控策略的二次型调节器和机 械臂位姿。 10.一种基于多源信 息深度强化学习的机械臂控制系统, 其特征在于: 包括用于采集机 械臂的图像数据及机械臂的本体数据的感知 模块、 用于采用示教学习初始 化力控策略的参 数的初始 化模块、 用于解析图像数据及机械臂本体信息数据, 得到图像的联合特征, 并通过权 利 要 求 书 1/2 页 2 CN 114789443 A 2强化学习模型获得实时力控策略的学习模块、 用于通过初始 化的力控策略的参数更新实时 力控策略, 并通过更新后的实时力控策略下达运动控制指令给机械臂进行工作, 采集工作 中的图像数据和机 械臂本体信息数据的控制模块。权 利 要 求 书 2/2 页 3 CN 114789443 A 3
专利 一种基于多源信息深度强化学习的机械臂控制方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:19:07
上传分享
举报
下载
原文档
(570.3 KB)
分享
友情链接
DB5301-T 79-2022 计量器具监督抽查工作规范 流通领域 昆明市.pdf
YD-T 2698-2014 电信网和互联网安全防护基线配置要求及检测要求 网络设备.pdf
T-GDC 19—2019 埋地用双高筋增强聚乙烯 HDPE 缠绕管.pdf
DB1408-T005-2020 果园植保器械农药有效沉积率评价技术规程 运城市.pdf
T-SZWA 001—2017 高分子益胶泥.pdf
绿盟 IoT机顶盒恶意软件应急处置手册.pdf
GB-T 24421.3-2023 服务业组织标准化工作指南 第3部分:标准编制.pdf
DB42-T 633.1-2023 双季稻栽培技术规程 第1部分:早晚稻机械化直播 湖北省.pdf
DB4403-T 422.1—2024 诚信计量管理规范 第1部分:通则 深圳市.pdf
GB-T 35547-2017 乡镇消防队.pdf
DB4403-T 12-2019 物业服务要求 商务写字楼 深圳市.pdf
GB-T 19568-2017 风力发电机组 装配和安装规范.pdf
GB-T 30279-2013 信息安全技术 安全漏洞等级划分指南.pdf
GB-T 22102-2008 防腐木材.pdf
OWASP-Top-10-for-LLMs-2023-v05.pdf
GB-T 33172-2016 资产管理 综述、原则和术语.pdf
DB34-T 3703.5-2022 长大桥梁养护指南 第5部分:健康监测报警阈值设定 安徽省.pdf
云原生安全白皮书中文版第二版.pdf
GB-T 2694-2018 输电线路铁塔制造技术条件.pdf
GB-T 39552.2-2020 太阳镜和太阳镜片 第2部分:试验方法.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(570.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。