(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210640202.7
(22)申请日 2022.06.07
(71)申请人 中国科学院深圳先进技 术研究院
地址 518055 广东省深圳市南 山区深圳大
学城学苑大道1068号
(72)发明人 周翊民 吴相栋
(74)专利代理 机构 深圳市威世博知识产权代理
事务所(普通 合伙) 44280
专利代理师 李庆波
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/44(2022.01)
G06T 3/40(2006.01)
(54)发明名称
图像分类识别方法、 识别装置以及存 储介质
(57)摘要
本申请公开了一种图像 分类识别方法、 识别
装置以及存储介质, 该图像分类识别方法包括:
对待识别图像进行特征提取, 得到第一特征图;
对第一特征图进行下采样操作, 得到第二特征
图; 对第二特征图进行旋转, 以使特征区域的边
界与目标检测区域的边界相匹配, 得到第三特征
图; 根据第三特征图, 得到待识别图像的分类识
别结果。 通过上述方式, 本申请能够提高图像分
类识别的效率和准确性。
权利要求书3页 说明书9页 附图5页
CN 115170860 A
2022.10.11
CN 115170860 A
1.一种图像分类识别方法, 其特 征在于, 所述方法包括:
对待识别图像进行 特征提取, 得到第一特 征图, 所述待识别图像包括目标检测区域;
对所述第一特 征图进行 下采样操作, 得到第二特 征图, 所述第二特 征图包括特 征区域;
对所述第二特征图进行旋转, 以使所述特征区域的边界与所述目标检测区域的边界相
匹配, 得到第三特 征图;
根据所述第三特 征图, 得到所述待识别图像的分类识别结果。
2.根据权利要求1所述的方法, 其特 征在于,
所述对所述第 二特征图进行旋转, 以使所述特征区域的边界与 所述目标检测区域的边
界相匹配, 得到第三特 征图, 包括:
确定所述第二特 征图中的目标 特征区域;
基于设定的多个旋转角度, 分别对所述目标特征区域进行旋转, 以分别得到对应的多
个候选特 征区域;
在所述多个候选特征区域中, 确定与所述目标检测区域的边界相匹配的旋转特征区
域;
基于所述第二特征图中, 多个目标特征区域分别对应的多个旋转特征区域, 确定第三
特征图。
3.根据权利要求2所述的方法, 其特 征在于,
所述基于设定的多个旋转角度, 分别对所述目标特征区域进行旋转, 以分别得到对应
的多个候选特 征区域, 包括:
确定多个角度通道, 每一角度通道对应一角度区间;
基于所述多个角度通道, 分别对所述目标特征区域进行旋转, 以分别得到对应的多个
候选特征区域;
对于每一所述候选特征区域, 利用对应的角度通道的边界, 对所述候选特征区域进行
像素插值处 理。
4.根据权利要求3所述的方法, 其特 征在于, 采用以下公式对目标 特征区域进行处 理:
FOn=Int(SA(Y(p) ·RT( θ ),Cn), θ ),n=0,1,…,N‑1;
其中, Cn表示第n个角度通道,
表示在角度通道Cn下的候选特征区域, Int表示插值函
数, SA表示角度通道切换函数, Y(p)表 示第二特征图对应的特征函数, R( θ )=(co sθ,‑sinθ;
sinθ,cosθ )T是旋转矩阵, 用来控制对旋转角度的切换, N 为正整数。
5.根据权利要求4所述的方法, 其特征在于, 采用以下公式对目标检测区域进行下采
样:
其中, F为第一特征图对应的特征函数, W(k)表示使用的卷积核上每个位置的权重, K表
示卷积计算的位置范围, k的取值控制对像素点的遍历过程。
6.根据权利要求2所述的方法, 其特 征在于,
所述在所述多个候选特征区域中, 确定与 所述目标检测区域的边界相匹配的旋转特征
区域, 包括:权 利 要 求 书 1/3 页
2
CN 115170860 A
2构建每一所述 候选特征区域对应多个角度通道的得分图;
确定每一所述得分图所对应的响应值;
根据所述每个候选特征区域的所述得分图和所述响应值, 确定与所述目标检测区域的
边界相匹配的旋转特 征区域。
7.根据权利要求6所述的方法, 其特 征在于,
所述构建每一所述 候选特征区域对应多个角度通道的得分图, 包括:
将每一所述 候选特征区域划分为d2个子块区域; 其中, d为 正整数;
分别对每 个所述子块区域进行池化操作;
将d2个所述子块区域池化操作后的结果拼接构成所述候选 特征区域的对应一角度通道
的得分图。
8.根据权利要求7 所述的方法, 其特 征在于, 采用以下公式对子块区域进行池化操作:
其中,
表示在角度通道Cn上第(i,j)个子块区域Bi,j中的池化输出,
表
示N×d2个得分图中的其中一个, w为学习参数, p是子块区域Bi,j中的像素数, (u,v)是特征
点Pi,j的全局坐标;
所述特征点Pi,j的全局坐标(u,v)可用以下公式定义:
其中(u′,v′)表示特征点Pi,j的局部坐标, (u0,v0)表示对齐特征区域的左 上角点坐标,
当(u,v)∈Bi,j时, 其范围由以下公式限定:
其中w, h分别为常规卷积区域的长和宽 。
9.根据权利要求8所述的方法, 其特征在于, 采用以下公式将所述子块 区域池化操作后
的结果拼接构成所述 候选特征区域的得分图:
采用以下公式计算所述角度通道的响应值:
10.根据权利要求6所述的方法, 其特 征在于,
所述根据 所述每个候选特征区域的所述得分图和所述响应值, 确定与 所述目标检测区
域的边界相匹配的旋转特 征区域, 包括:
采用以下公式获得 所述第三特 征图:权 利 要 求 书 2/3 页
3
CN 115170860 A
3
专利 图像分类识别方法、识别装置以及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:10:14上传分享