专利 一种深度挖掘混合特征的工地场景人脸目标检测方法

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210913548.X (22)申请日 2022.08.01 (65)同一申请的已公布的文献号申请公布号 CN 114973386 A (43)申请公布日 2022.08.30 (73)专利权人成都市威虎科技有限公司地址 610041 四川省成都市高新区天府大道中段530号2栋22层2202号 (72)发明人刘杰　闫超　胡二建　赵浩然　秦文娇　 (74)专利代理机构成都君合集专利代理事务所 (普通合伙) 51228 专利代理师张鸣洁 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 113869285 A,2021.12.31CN 113160058 A,2021.07.23 CN 112200161 A,2021.01.08 CN 114037833 A,2022.02.11 CN 113065402 A,2021.07.02 CN 114463800 A,2022.05.10 US 2018096457 A1,2018.04.0 5 Bingfeng Zhang 等.End-to- End Weak ly Supervised Semantic Segmentati on with Reliable Regi on Mining. 《Pattern Recognition》 .2022,第1-13页. Siyue Yu 等.Democracy Does Mat ter: Comprehensive F eature Mi ning for Co- Salient Object Detecti on. 《arXiv》 .202 2,第 1-12页. Jian Wang 等.Predicti ng Arbitrary- Oriented Objects as Po ints in Remote Sensing Images. 《remote sensi ng》 .2021,第1- 19页. 李昊璇等.基于深度学习的自然场景下多人脸实时检测. 《测试技术学报》 .2020,第34卷(第 01期),第41-47页. 审查员李秋萍 (54)发明名称一种深度挖掘混合特征的工地场景人脸目标检测方法 (57)摘要本发明涉及人脸检测技术领域，公开了一种深度挖掘混合特征的工地场景人脸目标检测方法，包括以下步骤：步骤S1，将工地场景下采集的包含人脸的图像数据和标注信息按标准格式构成训练集；步骤S2，构建网络模型，网络模型包括主干部分网络、候选区域建议网络、全局平等特征增强模块和前馈神经网络；步骤S3，采用类别损失函数和定位回归损失函数指导网络模型学习；步骤S4，预设相关超参数，通过不断迭代衰减损失值达到网络参数权重优化的目的，直到迭代次数等于最大迭代次数，中止对训练集的训练，最后在实际场景下测试网络模型的性能。权利要求书3页说明书7页附图2页 CN 114973386 B 2022.11.04 CN 114973386 B 1.一种深度挖掘混合特征的工地场景人脸目标检测方法，其特征在于，包括以下步骤：步骤S1，将工地场景下采集的包含人脸的图像数据和标注信息按标准格式构成训练集；步骤S2，构建网络模型，所述网络模型包括主干部分网络、候选区域建议网络、全局平等特征增强模块和前馈神经网络；所述主干部分网络从前至后由卷积层、批归一化层、激活函数层和多尺度聚合模块构成，通过调整卷积层的步长控制下采样倍数，构建出尺度层次性，再由多尺度聚合模块将不同尺度的特征信息进行有效地对齐，聚合不同尺度特征信息的语义信息，减弱语义差异造成的特征退化；多尺度聚合模块由卷积层、批归一化层、激活函数层、偏移卷积层、转置卷积层、特征拼接层以及特征相加层构成；多尺度聚合模块在高层特征图和低层特征图之间进行特征对齐聚合，学习尺度级别相邻的特征图之间差异变化，增强特征信息的空间细节，增强特征信息的定位能力；全局平等特征增强模块包括卷积层、批归一化层、激活函数层、柔性最大值层、点乘层、特征相乘层、掩码生成层和特征相加层；全局平等特征增强模块通过将激活函数层、掩码生成层和柔性最大值层结合提炼平等响应热力图，把网络模型关注力扩散到更多的像素上，平等地处理所有像素点，利用正注意力的像素响应点增强特征，得到更大范围的有用区域；全局平等特征增强模块共有三个输入， f1为候选区域框对应的特征信息，作为查询特征， f2和f3为主干网络最后一层卷积层输出的全局特征信息，作为关键特征， f1和f2计算出相似性矩阵之后，分两路进行处理，一路是利用柔性最大值进行归一化，生成注意力热力图，另一路是先利用修正性线性单元层将可能产生负注意力的点进行过滤，再利用掩码生成层，增加部分像素点的权重值，处理公式如下：；；公式中F为修正性线性单元层处理之后的特征矩阵，代表修正性线性单元层处理之后的特征矩阵中的元素， ij分别表示行号和列号；代表扩展之后矩阵中的元素， ij分别表示行号和列号；代表索引矩阵中的元素， ij分别表示行号和列号； sort表示排序函数， asc表示以升序的方式进行排序， index表示返回排序之后数据的索引矩阵的函数，为了将柔性最大值生成的注意力图扩展到更多的特征点上，用索引矩阵处理得到扩展之后的矩阵，主要作用是增加其他特征点的注意力权重比例，因此，平等响应热力图生成权　利　要　求　书 1/3 页 2 CN 114973386 B 2映射公式如下：；公式中为平等响应热力图，是柔性最大值生成的注意力图；全局特征信息f3通过卷积层Cc3进行卷积操作后与平等响应热力图进行特征相乘得到特征相乘结果，对特征相乘结果进行特征相加得到特征相加结果，最后通过卷积层、参数修正线性单元层、批归一化层对所述特征相加结果进行处理；步骤S3，采用类别损失函数和定位回归损失函数指导网络模型学习；所述类别损失函数采用改进后的二元交叉熵损失函数，用于计算预测类别值与预测概率值之间的损失值；改进之后的二元交叉熵损失函数为焦点损失函数，公式为：；；公式中Focal_loss为焦点损失函数，为每个样本上的焦点损失值之和，表示预测类别的概率值， γ为伽马参数，用于调节不同重要程度的样本的损失， α 为阿尔法参数，用于调节正样本的惩罚比例， y是类别真实标签；所述定位回归损失函数采用改进后的平滑L1损失函数，计算候选区域与真实边界框之间的损失值；改进之后的平滑L1损失函数公式为：；；公式中improved_smoothL1是改进之后的平滑L1函数，为改进之后的平滑L1损失函数， m表示改进之后的平滑L1函数的输入变量值，为索引为i的预测边界框，为索引为i的真实边界框；步骤S4，预设相关超参数，通过不断迭代衰减损失值达到网络参数权重优化的目的，直到迭代次数等于最大迭代次数，中止对训练集的训练，最后在实际场景下测试网络模型的性能。 2.根据权利要求1所述的一种深度挖掘混合特征的工地场景人脸目标检测方法，其特征在于，所述步骤S2中构建网络模型的方法包括：首先构建具有尺度层次性的主干网络部分，随后利用多尺度聚合模块将不同尺度的特征信息融合成统一的特征块，然后使用候选区域建议网络生成候选区域框，使用全局平等特征增强模块进一步增强特征的表达能力，最后经前馈神经网络处理后并行计算边界框回归和类别分类。 3.根据权利要求1所述的一种深度挖掘混合特征的工地场景人脸目标检测方法，其特征在于，所述步骤S2中的前馈神经网络从前至后由感兴趣区域池化层、全连接层、神经元失权　利　要　求　书 2/3 页 3 CN 114973386 B 3

专利 一种深度挖掘混合特征的工地场景人脸目标检测方法

专利一种深度挖掘混合特征的工地场景人脸目标检测方法