(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210913548.X
(22)申请日 2022.08.01
(65)同一申请的已公布的文献号
申请公布号 CN 114973386 A
(43)申请公布日 2022.08.30
(73)专利权人 成都市威虎科技有限公司
地址 610041 四川省成 都市高新区天府大
道中段530号2栋22层2202号
(72)发明人 刘杰 闫超 胡二建 赵浩然
秦文娇
(74)专利代理 机构 成都君合集专利代理事务所
(普通合伙) 51228
专利代理师 张鸣洁
(51)Int.Cl.
G06V 40/16(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(56)对比文件
CN 113869285 A,2021.12.31CN 113160058 A,2021.07.23
CN 112200161 A,2021.01.08
CN 114037833 A,2022.02.11
CN 113065402 A,2021.07.02
CN 114463800 A,2022.05.10
US 2018096457 A1,2018.04.0 5
Bingfeng Zhang 等.End-to- End Weak ly
Supervised Semantic Segmentati on with
Reliable Regi on Mining. 《Pattern
Recognition》 .2022,第1-13页.
Siyue Yu 等.Democracy Does Mat ter:
Comprehensive F eature Mi ning for Co-
Salient Object Detecti on. 《arXiv》 .202 2,第
1-12页.
Jian Wang 等.Predicti ng Arbitrary-
Oriented Objects as Po ints in Remote
Sensing Images. 《remote sensi ng》 .2021,第1-
19页.
李昊璇等.基于深度学习的自然场景 下多人
脸实时检测. 《测试技 术学报》 .2020,第34卷(第
01期),第41-47页.
审查员 李秋萍
(54)发明名称
一种深度挖掘混合特征的工地场景人脸目
标检测方法
(57)摘要
本发明涉及人脸检测技术领域, 公开了一种
深度挖掘混合特征的工地场景人脸目标检测方
法, 包括以下步骤: 步骤S1, 将工地场景下采集的
包含人脸的图像数据和标注信息按标准格式构
成训练集; 步骤S2, 构建网络模型, 网络模型包括
主干部分网络、 候选区域建议网络、 全局平等特
征增强模块和前馈神经网络; 步骤S3, 采用类别
损失函数和定位回归损失函数指导网络模型学
习; 步骤S4, 预设相关超参数, 通过不断迭代衰减
损失值达到网络参数权重优化的目的, 直到迭代
次数等于最大迭代次数, 中止对训练集的训练,最后在实际场景 下测试网络模型的性能。
权利要求书3页 说明书7页 附图2页
CN 114973386 B
2022.11.04
CN 114973386 B
1.一种深度 挖掘混合特 征的工地场景 人脸目标检测方法, 其特 征在于, 包括以下步骤:
步骤S1, 将工地场景下采集的包含人脸的图像数据和标注信息按标准格式构成训练
集;
步骤S2, 构建网络模型, 所述网络模型包括主干部分网络、 候选区域建议网络、 全局平
等特征增强模块和前馈神经网络;
所述主干部分网络从前至后由卷积层、 批归一化层、 激活函数层和多尺度聚合模块构
成, 通过调整 卷积层的步长控制下采样倍数, 构建出尺度层次性, 再由多尺度聚合模块将不
同尺度的特征信息进行有效地对齐, 聚合不同尺度特征信息的语义信息, 减弱语义差异造
成的特征退化;
多尺度聚合模块由卷积层、 批归一化层、 激活函数层、 偏移卷积层、 转置卷积层、 特征拼
接层以及特征相加层构成; 多尺度聚合模块在高层特征图和 低层特征图之 间进行特征对齐
聚合, 学习尺度级别相 邻的特征图之间差异变化, 增强特征信息的空间细节, 增强特征信息
的定位能力;
全局平等特征增强模块包括卷积层、 批归一化层、 激活函数层、 柔性最大值层、 点乘层、
特征相乘层、 掩码生成层和特 征相加层;
全局平等特征增强模块通过将激活函数层、 掩码生成层和柔性最大值层结合提炼平等
响应热力图, 把网络模型关注力扩散到更多的像素上, 平等地处理所有像素点, 利用正注 意
力的像素响应点增强特 征, 得到更 大范围的有用区域;
全局平等特征增强模块共有三个输入, f1为候选区域框对应的特征信息, 作为查询特
征, f2和f3为主干网络最后一层卷积层输出的全局特征信息, 作为关键特征, f1和f2计算出
相似性矩阵之后, 分两路进行处理, 一路是利用柔性最大值进行归一化, 生成注意力热力
图, 另一路是先利用修正性线性单元层将可能产生负注意力的点进行过滤, 再利用掩码生
成层, 增加部分像素点的权 重值, 处理公式如下:
;
;
公式中F为修正性线性单元层处理之后的特征矩阵,
代表修正性线性单元层处理之
后的特征矩阵中的元素, ij分别表示 行号和列号;
代表扩展之后矩阵中的元素, ij分别
表示行号和列号;
代表索引矩阵中的元素, ij分别表示行号和列号; sort表示排序函
数, asc表 示以升序的方式进 行排序, index表 示返回排序之后数据的索引矩阵
的函数, 为
了将柔性最大值生成的注意力图扩展到更多的特征点上, 用索引矩阵
处理得到扩展之后
的矩阵
,
主要作用是增加其他特征点的注意力权重比例, 因此, 平等响应热力图生成权 利 要 求 书 1/3 页
2
CN 114973386 B
2映射公式如下:
;
公式中
为平等响应热力图,
是柔性最大值生成的注意力图;
全局特征信息f3通过卷积层Cc3进行卷积操作后与平等响应热力图
进行特征相乘得
到特征相乘结果, 对 特征相乘结果进 行特征相加得到特征相加结果, 最后通过卷积层、 参数
修正线性单 元层、 批归一 化层对所述特 征相加结果进行处 理;
步骤S3, 采用类别损失函数和定位回归损失函数指导网络模型 学习;
所述类别损失函数采用改进后的二元交叉熵损失函数, 用于计算预测类别值与预测概
率值之间的损失值;
改进之后的二元交叉熵损失函数为焦点损失函数, 公式为:
;
;
公式中Focal_loss为焦点损失函数,
为每个样本上的焦点损失值之和,
表示预测类
别的概率值, γ为伽 马参数, 用于调节不同重要程度的样本的损失, α 为阿尔法参数, 用于调
节正样本的惩罚比例, y是类别真实标签;
所述定位 回归损失函数采用改进后的平滑L1损失函数, 计算候选区域与真实边界框之
间的损失值;
改进之后的平 滑L1损失函数公式为:
;
;
公式中improved_smoothL1是改进之后的平滑L1函数,
为改进之后的平滑L1损失函
数, m表示改进之后的平滑L1函数的输入变量值,
为索引为i的预测边界框,
为索引为i的
真实边界框;
步骤S4, 预设相关超参数, 通过不断迭代衰减损失值达到网络参数权重优化的目的, 直
到迭代次数等于最大迭代 次数, 中止对训练集的训练, 最后在实际场景下测试网络模型 的
性能。
2.根据权利要求1所述的一种深度挖掘混合特征的工地场景人脸目标检测方法, 其特
征在于, 所述 步骤S2中构建网络模型的方法包括:
首先构建具有尺度层次性的主干网络部分, 随后利用多尺度聚合模块将不同尺度的特
征信息融合成统一的特征块, 然后使用候选区域建议网络生成候选区域框, 使用全局平等
特征增强模块进一步增强特征的表达能力, 最后经前馈神经网络处理后并行计算边界框回
归和类别分类。
3.根据权利要求1所述的一种深度挖掘混合特征的工地场景人脸目标检测方法, 其特
征在于, 所述步骤S2中的前馈神经网络从前至后由感兴趣区域池化层、 全连接层、 神经元失权 利 要 求 书 2/3 页
3
CN 114973386 B
3
专利 一种深度挖掘混合特征的工地场景人脸目标检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:12:27上传分享