安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210640202.7 (22)申请日 2022.06.07 (71)申请人 中国科学院深圳先进技 术研究院 地址 518055 广东省深圳市南 山区深圳大 学城学苑大道1068号 (72)发明人 周翊民 吴相栋  (74)专利代理 机构 深圳市威世博知识产权代理 事务所(普通 合伙) 44280 专利代理师 李庆波 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/44(2022.01) G06T 3/40(2006.01) (54)发明名称 图像分类识别方法、 识别装置以及存 储介质 (57)摘要 本申请公开了一种图像 分类识别方法、 识别 装置以及存储介质, 该图像分类识别方法包括: 对待识别图像进行特征提取, 得到第一特征图; 对第一特征图进行下采样操作, 得到第二特征 图; 对第二特征图进行旋转, 以使特征区域的边 界与目标检测区域的边界相匹配, 得到第三特征 图; 根据第三特征图, 得到待识别图像的分类识 别结果。 通过上述方式, 本申请能够提高图像分 类识别的效率和准确性。 权利要求书3页 说明书9页 附图5页 CN 115170860 A 2022.10.11 CN 115170860 A 1.一种图像分类识别方法, 其特 征在于, 所述方法包括: 对待识别图像进行 特征提取, 得到第一特 征图, 所述待识别图像包括目标检测区域; 对所述第一特 征图进行 下采样操作, 得到第二特 征图, 所述第二特 征图包括特 征区域; 对所述第二特征图进行旋转, 以使所述特征区域的边界与所述目标检测区域的边界相 匹配, 得到第三特 征图; 根据所述第三特 征图, 得到所述待识别图像的分类识别结果。 2.根据权利要求1所述的方法, 其特 征在于, 所述对所述第 二特征图进行旋转, 以使所述特征区域的边界与 所述目标检测区域的边 界相匹配, 得到第三特 征图, 包括: 确定所述第二特 征图中的目标 特征区域; 基于设定的多个旋转角度, 分别对所述目标特征区域进行旋转, 以分别得到对应的多 个候选特 征区域; 在所述多个候选特征区域中, 确定与所述目标检测区域的边界相匹配的旋转特征区 域; 基于所述第二特征图中, 多个目标特征区域分别对应的多个旋转特征区域, 确定第三 特征图。 3.根据权利要求2所述的方法, 其特 征在于, 所述基于设定的多个旋转角度, 分别对所述目标特征区域进行旋转, 以分别得到对应 的多个候选特 征区域, 包括: 确定多个角度通道, 每一角度通道对应一角度区间; 基于所述多个角度通道, 分别对所述目标特征区域进行旋转, 以分别得到对应的多个 候选特征区域; 对于每一所述候选特征区域, 利用对应的角度通道的边界, 对所述候选特征区域进行 像素插值处 理。 4.根据权利要求3所述的方法, 其特 征在于, 采用以下公式对目标 特征区域进行处 理: FOn=Int(SA(Y(p) ·RT( θ ),Cn), θ ),n=0,1,…,N‑1; 其中, Cn表示第n个角度通道, 表示在角度通道Cn下的候选特征区域, Int表示插值函 数, SA表示角度通道切换函数, Y(p)表 示第二特征图对应的特征函数, R( θ )=(co sθ,‑sinθ; sinθ,cosθ )T是旋转矩阵, 用来控制对旋转角度的切换, N 为正整数。 5.根据权利要求4所述的方法, 其特征在于, 采用以下公式对目标检测区域进行下采 样: 其中, F为第一特征图对应的特征函数, W(k)表示使用的卷积核上每个位置的权重, K表 示卷积计算的位置范围, k的取值控制对像素点的遍历过程。 6.根据权利要求2所述的方法, 其特 征在于, 所述在所述多个候选特征区域中, 确定与 所述目标检测区域的边界相匹配的旋转特征 区域, 包括:权 利 要 求 书 1/3 页 2 CN 115170860 A 2构建每一所述 候选特征区域对应多个角度通道的得分图; 确定每一所述得分图所对应的响应值; 根据所述每个候选特征区域的所述得分图和所述响应值, 确定与所述目标检测区域的 边界相匹配的旋转特 征区域。 7.根据权利要求6所述的方法, 其特 征在于, 所述构建每一所述 候选特征区域对应多个角度通道的得分图, 包括: 将每一所述 候选特征区域划分为d2个子块区域; 其中, d为 正整数; 分别对每 个所述子块区域进行池化操作; 将d2个所述子块区域池化操作后的结果拼接构成所述候选 特征区域的对应一角度通道 的得分图。 8.根据权利要求7 所述的方法, 其特 征在于, 采用以下公式对子块区域进行池化操作: 其中, 表示在角度通道Cn上第(i,j)个子块区域Bi,j中的池化输出, 表 示N×d2个得分图中的其中一个, w为学习参数, p是子块区域Bi,j中的像素数, (u,v)是特征 点Pi,j的全局坐标; 所述特征点Pi,j的全局坐标(u,v)可用以下公式定义: 其中(u′,v′)表示特征点Pi,j的局部坐标, (u0,v0)表示对齐特征区域的左 上角点坐标, 当(u,v)∈Bi,j时, 其范围由以下公式限定: 其中w, h分别为常规卷积区域的长和宽 。 9.根据权利要求8所述的方法, 其特征在于, 采用以下公式将所述子块 区域池化操作后 的结果拼接构成所述 候选特征区域的得分图: 采用以下公式计算所述角度通道的响应值: 10.根据权利要求6所述的方法, 其特 征在于, 所述根据 所述每个候选特征区域的所述得分图和所述响应值, 确定与 所述目标检测区 域的边界相匹配的旋转特 征区域, 包括: 采用以下公式获得 所述第三特 征图:权 利 要 求 书 2/3 页 3 CN 115170860 A 3

PDF文档 专利 图像分类识别方法、识别装置以及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像分类识别方法、识别装置以及存储介质 第 1 页 专利 图像分类识别方法、识别装置以及存储介质 第 2 页 专利 图像分类识别方法、识别装置以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:10:14上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。