安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211022223.9 (22)申请日 2022.08.25 (71)申请人 上海大学 地址 200444 上海市宝山区上 大路99号 (72)发明人 李小毛 张婧婷 高建焘 彭艳  谢少荣  (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 万慧华 (51)Int.Cl. G06V 20/05(2022.01) G06V 10/26(2022.01) G06V 10/32(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06T 7/80(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种跨模态融合蒸馏的水面分割方法及系 统 (57)摘要 本发明涉及一种跨模态融合蒸馏的水面分 割方法及系统, 属于计算机视觉技术领域, 首先 建立点‑像素对应关系, 并根据此关系是否包含 2D像素来提取2D特征, 得到逐点2D特征; 再利用 最近邻插值法对3D特征图进行计算, 得到逐点3D 特征; 将二者融合得到融合特征; 利用逐点2D特 征 进行水面分割预测得到2D预测分数; 利用 融合特征进行水面分割预测得到融合预测分数; 计算2D预测分数和融合预测分数之间的蒸馏损 失; 最后利用降低蒸馏损失的方法调节2D预测网 络, 得到调节2D预测网络; 利用调节2D预测网络 进行水面预测分割。 本发明利用跨模态融合蒸馏 方法来迁移复杂网络所学到的知识, 简化网络, 降低计算 量且不影响 分割效果。 权利要求书3页 说明书11页 附图5页 CN 115311545 A 2022.11.08 CN 115311545 A 1.一种跨模态融合蒸馏的水面分割方法, 其特 征在于, 所述方法包括: 获取2D图像数据和3D点云数据; 所述2D图像数据和所述3D点云数据在同一视野内; 利用2D网络获取 所述2D图像数据的2D特 征图 根据获取所述2D图像数据的相机的内参矩阵和外参矩阵将所述3D点云数据透视投影 至2D平面, 得到2D平面像素; 利用所述2D平面像素与所述3D点云数据建立 点‑像素对应关系; 查找所述 点‑像素对应关系中包 含的2D特 征图 中的像素, 得到包 含像素; 将所述包 含像素所对应的2D特 征提取出来, 得到逐点2D特 征 利用3D网络获取 所述3D点云数据的3D特 征图F3D; 利用点与体素的对应关系 在所述3D特征图F3D上进行最近邻插值法计算, 得到逐点3D特 征 利用MLP网络将所述逐点2D特 征 转换为3D学习者特 征 将所述3D学习者特 征 与所述逐点3D特 征 拼接融合, 得到融合特 征 利用2D预测网络根据所述逐点2D特征 进行水面分割预测, 并利用分类器得到2D预 测分数; 利用3D预测网络根据所述融合特征 进行水面分割预测, 并利用分类器得到融合 预测分数; 利用KL散度计算所述2D预测分数和所述融合预测分数之间的蒸馏损失; 利用降低所述蒸馏损失的方法调节所述2D预测网络, 得到调节 2D预测网络; 利用所述调节 2D预测网络进行 水面预测分割。 2.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述利用2D网 络获取所述2D图像数据的2D特 征图 具体包括: 利用2D网络提取 所述2D图像数据的多尺度特 征; 利用反卷积将所述多尺度特征上采样至与所述2D图像数据的分辨率相同, 得到2D特征 图 3.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述根据获取 所述2D图像数据的相机的内参矩阵和外参矩阵将所述3D点云数据透视投影至2D平 面, 得到 2D平面像素的计算公式为: 其中, (ui,vi)表示2D平面像素坐标, K为相机的内参矩阵, T为相机的外参矩阵, (xi,yi, zi)表示3D点云坐标。 4.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述点 ‑像素 对应关系为: 其中, 表示向下取整运算操作, (ui,vi) 表示2D平面像素坐标, Opixel表示点‑像素对应关系映射图, N表示3D点的数量。权 利 要 求 书 1/3 页 2 CN 115311545 A 25.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 在所述将所述 包含像素所对应的2D特 征提取出来, 得到逐点2D特 征 之后, 还包括: 将所述逐点2D特 征 中的元素进行逐元素累加。 6.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 在所述将所述 3D学习者特 征 与所述逐点3D特 征 拼接融合, 得到融合特 征 之后, 还包括: 将所述融合特 征 中的元素进行逐元素累加。 7.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述利用KL散 度计算所述2D预测分数和所述融合预测分数之间的蒸馏损失的计算公式为: 其中, N表示3D点的数量, n是第n个点, DKL就是指KL散度, S3D2D表示融合预测分数, S2D表 示2D预测分数。 8.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述2D网络包 括: ResNet34编码器和FCN 解码器。 9.根据权利要求1所述的跨模态融合蒸馏的水面分割方法, 其特征在于, 所述3D网络包 括: PointNet++编码器和解码器。 10.一种跨模态融合蒸馏的水面分割 系统, 其特 征在于, 所述系统包括: 数据获取模块, 用于获取2D图像数据和3D点云数据; 所述2D图像数据和所述3D点云数 据在同一视野内; 2D特征图获取模块, 用于利用2D网络获取 所述2D图像数据的2D特 征图 投影模块, 用于根据获取所述2D图像数据的相机的内参矩阵和外参矩阵将所述3D点云 数据透视投影至2D平面, 得到2D平面像素; 点‑像素对应关系建立模块, 用于利用所述2D平面像素与所述3D点云数据建立点 ‑像素 对应关系; 包含像素查找模块, 用于查找所述点 ‑像素对应关系中包含的2D特征图 中的像素, 得到包含像素; 逐点2D特征获取模块, 用于将所述包含像素所对应的2D特征提取出来, 得到逐点2D特 征 3D特征图获取模块, 用于利用3D网络获取 所述3D点云数据的3D特 征图F3D; 逐点3D特征获取模块, 用于利用点与体素的对应关系在所述3D特征图F3D上进行最近邻 插值法计算, 得到逐点3D特 征 MLP转换模块, 用于利用MLP网络将所述逐点2D特 征 转换为3D学习者特 征 特征拼接模块, 用于将所述3D学习者特征 与所述逐点3D特征 拼接融合, 得到 融合特征 权 利 要 求 书 2/3 页 3 CN 115311545 A 3

.PDF文档 专利 一种跨模态融合蒸馏的水面分割方法及系统

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种跨模态融合蒸馏的水面分割方法及系统 第 1 页 专利 一种跨模态融合蒸馏的水面分割方法及系统 第 2 页 专利 一种跨模态融合蒸馏的水面分割方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:13:07上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。