专利 基于交互学习的多模态融合机械臂控制方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210578157.7 (22)申请日 2022.05.25 (71)申请人桂林电子科技大学地址 541004 广西壮族自治区桂林市七星区金鸡路1号 (72)发明人强保华　贾清玉　谢武　 (74)专利代理机构桂林文必达专利代理事务所 (特殊普通合伙) 45134 专利代理师白洪 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/762(2022.01) G06V 10/764(2022.01)G06V 10/778(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 40/16(2022.01) G06V 40/20(2022.01) G10L 15/14(2006.01) B25J 9/16(2006.01) (54)发明名称基于交互学习的多模态融合机械臂控制方法 (57)摘要本发明公开了一种基于交互学习的多模态融合机械臂控制方法，该方法利用深度学习相关技术对多模态信息进行分析和处理，从而使得系统可以获取用户完整且精确的意图。通过隐马尔科夫模型(HMM)对语音命令进行准确识别处理；使用动态时间规整算法(DTW)实现对动态手势识别的研究；利用基于特征融合的表情识别算法来提取表情图像特征并进行特征融合，通过对表情进行识别达到对心理状态的判定，获取其心理意图。此外，本方法以人机交互为基础，通过决策树和Q‑Learning算法学习新命令和新知识，同时利用学习到的正确信息对原有的知识进行更新，实现机械臂自身知识的智能增长，从而实现对机械臂控制的优化。权利要求书1页说明书9页附图2页 CN 115114975 A 2022.09.27 CN 115114975 A 1.一种基于交互学习的多模态融合机械臂控制方法，其特征在于，所述方法包括以下步骤： (1)麦克风采集语音信号，通过基于HMM的语音识别算法进行语音识别，确定标签信息并进行特征提取，得到特征向量； (2)深度摄像头采集表情数据，通过基于特征融合的表情识别算法进行特征提取，得到特征向量； (3)深度摄像头采集手势图像数据，通过基于DTW的手势识别算法进行特征提取，得到特征向量； (4)将采集到的语音、表情和手势信息进行融合编码； (5)使用长短期记忆网络将输入的特征信息映射成一个输出的语言序列，完成人机交互对话； (6)对步骤(1)中所述语音信号产生的标签进行判断，在已构建的决策树模型中是否存在此标签，如果没有对应的标签，则决策树自我更新模型； (7)使用Q －Learning算法使机械臂进行学习，并观察机械臂当前状态S； (8)通过公式选择一个动作a，用来确定随机策略的随机度，其中 T称作温度值； (9)观察机械臂新的状态s'； (10)从环境中获得即时回报r； (11)根据公式Q(s,a)＝(1 ‑β )Q(s,a)+β(r+γmaxQ(s ′,a′))，对状态S和动作a相应的Q 值进行更新，如果新的状态s'满足结束条件，一局结束；否则S →s'返回到第二步；其中， β 是学习率， 0 ≤β <1， γ是折扣参数， (0 ≤γ<1)； (12)使用基于改进FC M方法对机械臂学到的新知识数据增量进行更新； (13)使用基于密度峰值聚类算法对机械臂学到的新知识数据类别进行更新。权　利　要　求　书 1/1 页 2 CN 115114975 A 2基于交互学习的多模态融合机械臂控制方法技术领域 [0001]本发明涉及自动控制技术领域，具体涉及一种基于交互学习的多模态融合机械臂控制方法。背景技术 [0002]随着工业自动化的发展，机械臂控制的研究和应用得到了极大的关注，同时随着计算机技术的发展，一直希望能够找到一种简单快捷的方式控制机械臂以完成相关动作，而不是依靠大量复杂又繁琐的编程任务。目前虽然有部分依靠模式识别控制机械臂操作的方法，但这些方法由于单模态输入及机械臂自身对操作者指令学习程度不同的影响，经常导致机械臂完成的动作与操作者设想其完成的动作存在较大的偏差。发明内容 [0003]本发明的目的是提供一种更简便和准确的机械臂控制方法，所述方法以人机交互为基础，通过决策树算法和Q ‑Learning算法学习操作者传授的新命令和新知识，同时利用学习到的正确信息对原有的知识进行更新，实现机械臂自身知识的智能增长，更好地完成对机械臂的控制任务。 [0004]本发明所提供的基于交互学习的多模态融合机械臂控制方法，主要包括如下步骤： [0005](1)麦克风采集语音信号，通过基于HMM的语音识别算法进行语音识别，确定标签信息并进行特征提取，得到特征向量。 [0006](2)深度摄像头采集表情数据，通过基于特征融合的表情识别算法进行特征提取，得到特征向量。 [0007](3)深度摄像头采集手势图像数据，通过基于DTW 的手势识别算法进行特征提取，得到特征向量。 [0008](4)将采集到的语音、表情和手势信息进行融合编码。 [0009](5)使用长短期记忆网络将输入的特征信息映射成一个输出的语言序列，完成人机交互对话。 [0010](6)对步骤(1)中所述语音信号产生的标签进行判断，在已构建的决策树模型中是否存在此标签，如果没有对应的标签，则决策树自我更新模型。 [0011](7)使用Q －Learning算法使机械臂进行学习，并观察机械臂当前状态S。 [0012](8)通过公式选择一个动作a，用来确定随机策略的随机度，其中T称作温度值。 [0013](9)观察机械臂新的状态s'。 [0014](10)从环境中获得即时回报r。说　明　书 1/9 页 3 CN 115114975 A 3

专利 基于交互学习的多模态融合机械臂控制方法

专利基于交互学习的多模态融合机械臂控制方法