安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210460455.6 (22)申请日 2022.04.24 (71)申请人 湖南大学 地址 410000 湖南省长 沙市岳麓区麓山 南 路麓山门 (72)发明人 肖德贵 魏钰麒 李健芳 (74)专利代理 机构 长沙朕扬知识产权代理事务 所(普通合伙) 43213 专利代理师 何湘玲 (51)Int.Cl. G06V 10/80(2022.01) G06K 9/62(2022.01) G06V 40/20(2022.01) G06V 20/64(2022.01) G06V 10/82(2022.01)G06N 3/08(2006.01) (54)发明名称 用于3D人体姿态估计的多视角特征融合方 法及系统 (57)摘要 本发明公开了用于3D人体姿态估计的多视 角特征融合方法及系统, 该方法包括: 获取需要 姿态估计的不同视角的目标图像; 将目标图像经 过图像预处理后, 输入到训练好的MVP ‑att姿态 估计模型中, 输出3D人体姿态估计的结果; 所述 MVP‑att姿态估计模型通过以下步骤训练得到: 通过编码器对多视角输入的多个目标图像分别 进行采样, 提取得到多个单视图的2D人体姿态表 达的深度特征图; 输入特征转换模块, 实现多视 图的深度特征图与相机姿态的解耦; 使用基于混 合注意力机制的多视角特征融合机制模块从解 耦后的深度特征中自动选择有效深度特征, 按照 视角融合成统一的3D人体姿态表征。 本发明能够 将任意数量的多视图深度特征聚合成3D人体姿 态表征。 权利要求书2页 说明书7页 附图2页 CN 114758205 A 2022.07.15 CN 114758205 A 1.一种用于 3D人体姿态估计的多视角特 征融合方法, 其特 征在于, 包括以下步骤: 获取需要 姿态估计的不同视角的目标图像; 将目标图像经过图像预处理后, 输入到训练好的MVP ‑att姿态估计模型中, 输出3D人体 姿态估计的结果; 所述MVP‑att姿态估计模型通过以下步骤训练得到: 通过编码器对多视角输入的多个目标图像分别进行采样, 提取得到多个单视图的2D人 体姿态表达的深度特 征图; 采用特征转换模块, 将相机投影矩阵条件作用于每个深度特征图的图像坐标, 映射转 换为世界坐标, 实现多视图的深度特征图中的深度特征进行标准化以及与相机姿态的解 耦; 使用基于混合注意力机制的多视角特征融合机制模块从解耦后的深度特征中自动选 择有效深度特 征, 按照视角融合成统一的3D人体姿态 表征。 2.根据权利要求1所述的用于3D人体姿态估计的多视角特征融合方法, 其特征在于, 所 述MVP‑att姿态估计模型的训练步骤, 还 包括: 将3D人体姿态表征输入到使用相机投影矩阵条件作用的特征转换模块, 输出特征融合 后各个视角的深度特 征; 将特征融合后各个视角的深度特 征输入到解码器中获得关节点 二维热图; 使用可微直接线性变换方法将多视角的关节点二维热图映射到三维空间, 生成表征人 体关节点在三维空间位置的三维人体骨架。 3.根据权利要求1所述的用于3D人体姿态估计的多视角特征融合方法, 其特征在于, 所 述自动选择有效深度特 征, 包括以下步骤: 先通过混合注意力 机制建模解耦后的深度 特征之间的相关性, 然后深度 学习每个通道 的深度特征的注意力得分, 自动在不同视角的深度特征集合中选择注意力得分符合要求的 深度特征作为有效深度特 征。 4.根据权利要求2所述的用于3D人体姿态估计的多视角特征融合方法, 其特征在于, 所 述MVP‑att姿态估计模型在训练过程中, 通过最小化二维关节点的平均误差来监督模型的 训练, 损失函数如下: 其中, 表示第k个视角的第j个关节的真实二维坐标; 是模型预测的第k个视角第j 个关节的二维坐标。 5.根据权利要求4所述的用于3D人体姿态估计的多视角特征融合方法, 其特征在于, 所 述MVP‑att姿态估计模型在训练过程中, 再通过以下损失函数公式微调多视角3D人体姿态 估计模型: 权 利 要 求 书 1/2 页 2 CN 114758205 A 2其中, L3D‑MPJPE是所有关节点的预测 位置与地面真值位置的平均欧氏距离, 其中 是世 界坐标系下第j个关节点的真实三维坐标, pj为模型预测的第j个关节点的三维坐标。 6.根据权利要求1至5 中任一项所述的用于3D人体姿态估计的多视角特征融合方法, 其 特征在于, 所述基于混合注意力机制的多视角特征融合机制模块包括: 级联 的通道注意力 机制单元和单通道局部注意力机制单元; 用于对不同特征通道的注意力加权计算、 同一特 征通道不同局部的注意力加权计算, 并依据计算得到的权值, 完成对应的特征通道加权求 和、 同一特 征通道局部加权求和, 得到每 个通道的深度特 征的注意力得分。 7.根据权利要求6所述的用于 3D人体姿态估计的多视角特 征融合方法, 其特 征在于, 所述单通道局部注意力机制单元, 包括: 低维嵌入全连接层、 ReLU非线性激活层、 维度 恢复全连接层三个子结构, 三者以级联 的方式连接; 低 维嵌入全连接层的神经元数目小于 或等于单通道局部注 意力机制子模块输入的特征维度, 维度恢复全连接层的神经元数目等 于单通道局部注意力机制子模块输入的特 征维度。 8.一种计算机系统, 包括存储器、 处理器以及存储在存储器上并可在处理器上运行的 计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现上述权利要求1至7任一 所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114758205 A 3
专利 用于3D人体姿态估计的多视角特征融合方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:39:30
上传分享
举报
下载
原文档
(797.2 KB)
分享
友情链接
T-CAS 600—2022 经营者公平竞争合规管理体系建设.pdf
安恒信息-GBT31168-2023 信息安全技术云计算服务安全能力要求 国家标准解读.pdf
信通院 全球数字治理白皮书 2023年.pdf
GA-T 1776-2021 警用机器人系统通用技术要求.pdf
重点网络安全:“3保1评”(分保、等保、关保、密评).pdf
GB-T 43256-2023 分布式光纤应变测试系统参数测试方法.pdf
GM-T 0112-2021 PDF格式文档的密码应用技术要求.pdf
绿盟 AISecOps智能安全运营技术白皮书 2020.pdf
DB5114-T 4-2019 杂交柑桔爱媛38号生产技术规范 眉山市.pdf
GA-T 1202-2022 交通技术监控成像补光装置通用技术条件.pdf
GB-T 41316-2022 分散体系稳定性表征指导原则.pdf
WDTA AI-STR-02-LLM security Large Language Model Security.pdf
GM-T 0102-2020 密码设备应用接口符合性检测规范.pdf
aigc安全研究分享.pdf
T-CVMA 45—2020 犬腺病毒PCR检测方法.pdf
GB 17565-2022 防盗安全门通用技术条件.pdf
DB31-T 1244-2020 冷却塔节能降噪改造技术指南 上海市.pdf
GB-T 37931-2019 信息安全技术 Web应用安全检测系统安全技术要求和测试评价方法.pdf
GB-T 31504-2015 信息安全技术 鉴别与授权 数字身份信息服务框架规范.pdf
GB-T 42570-2023 信息安全技术 区块链技术安全框架.pdf
1
/
3
12
评价文档
赞助2.5元 点击下载(797.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。