专利 一种人头检测方法和系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210599635.2 (22)申请日 2022.05.30 (71)申请人联通（广东）产业互联网有限公司地址 510000 广东省广州市黄埔区(中新广州知识城)亿创街1号 406房之555 (72)发明人邱芬鹏　邱述洪　童荪　梁华宇　甘海华　 (74)专利代理机构广州润禾知识产权代理事务所(普通合伙) 44446 专利代理师郑永泉 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种人头检测方法和系统 (57)摘要本发明涉及计算机视觉领域，更具体地，涉及一种人头检测方法和系统。本发明通过将Swin Transformer模块引入yolov5算法，使检测模型能更好地关注和融合特征图的全局信息以及上下文信息，挖掘出特征表示的潜能，提取出更有用的特征，提高了拥挤的场景下人头检测的准确率。在此基础上，还对yolov5的检测头分支进行改造，在检测模型的计算量基本不变的同时，提升了对小目标的检测能力，进一步提高人头检测的准确率。此外，选取Alpha ‑IoU Loss作为构建检测模型的损失函数，提高检测模型的检测框精度以及增强检测模型的鲁棒性。权利要求书3页说明书9页附图3页 CN 114882440 A 2022.08.09 CN 114882440 A 1.一种人头检测方法，其特征在于，包括：采集监控图像，建立监控图像样本集；所述监控图像包括：人的头部和肩部图像以及对应的标注框；所述监控图像样本集包括：监控图像训练集和监控图像测试集；对所述监控图像样本集进行预处理；基于yolov5算法和SwinTransformer模块建立初始检测模型，利用预处理后的所述监控图像样本训练检测模型，得到目标检测模型；获取监控图像集，并输入所述目标检测模型；利用所述目标检测模型对所述监控图像集进行人头检测，得到人头检测结果。 2.根据权利要求1所述的一种人头检测方法，其特征在于，基于yolov5算法和 SwinTransformer模块建立初始检测模型，利用预处理后的所述监控图像样本训练检测模型，得到目标检测模型，包括：利用所述监控图像训练集对所述初始检测模型进行迭代训练，得到训练后的检测模型；利用所述监控图像测试集对所述训练后的检测模型进行测试，根据测试结果调整检测模型中相应的模型参数，得到所述目标检测模型。 3.根据权利要求1所述的一种人头检测方法，其特征在于，所述初始检测模型包括：骨干网络、颈部网络和检测头网络；所述骨干网络包括依次相连的Focus层、第一卷积层、第一 CSP瓶颈层、第二卷积层、第二CSP瓶颈层、第三卷积层、第三CSP瓶颈层、第四卷积层、池化层和第一Swin Transformer模块；所述颈部网络包括依次相连的第五卷积层、第一上采样层、第一连接层、第四CSP瓶颈层、第二Swin Transformer模块、第六卷积层、第二上采样层、第二连接层、第五CSP瓶颈层、第三Swin Transformer模块、第七卷积层、第三上采样层、第三连接层、第六CSP瓶颈层、第四Swin Transformer模块、第八卷积层、第四连接层、第七CSP瓶颈层、第五Swin Transformer模块、第九卷积层、第五连接层和第八CSP瓶颈层；所述检测头网络包括：第一检测头、第二检测头和第三检测头；所述第一CSP瓶颈层与所述第三连接层连接；所述第二CSP瓶颈层与第二连接层连接；所述第三CSP瓶颈层与第一连接层连接；所述第一Swin Transformer模块与第五卷积层连接；所述第六卷积层与第五连接层连接；所述第七卷积层与第四连接层连接；所述第六CSP瓶颈层与第一检测头连接；所述第七CSP瓶颈层与第二检测头连接；所述第八CS P瓶颈层与第三检测头连接。 4.根据权利要求1所述的一种人头检测方法，其特征在于，利用所述目标检测模型对所述监控图像集进行人头检测，得到人头检测结果，包括：对所述监控图像集进行切片操作，得到切片特征图；对所述切片特征图进行多次第一特征提取，得到第一特征图、第二特征图、第三特征图和第四特征图；所述第一特征提取为利用CS P瓶颈层进行的特征提取；对所述第四特征图进行池化处理、第二特征提取和上采样操作，并且与所述第三特征图进行特征融合，得到第五特征图；所述第二特征提取为利用Swin Transformer模块进行的特征提取；对所述第五特征图进行第二特征提取，得到第六特征图；对所述第六特征图进行上采样操作，并且与所述第二特征图进行特征融合，得到第七特征图；权　利　要　求　书 1/3 页 2 CN 114882440 A 2对所述第七特征图进行第二特征提取，得到第八特征图；对所述第八特征图进行上采样操作，并且和所述第一特征图进行特征融合，得到第九特征图；对所述第九特征图进行第二特征提取，并且与所述第八特征图进行特征融合，得到第十特征图；对所述第十特征图进行第二特征提取，并且与所述第六特征图进行特征融合，得到第十一特征图；将所述第九特征图、所述第十特征图和所述第十一特征图输入相应的检测头，检测头进行中目标、小目标和特小目标的检测，得到人头检测结果。 5.根据权利要求1所述的一种人头检测方法，其特征在于，所述检测模型的损失函数为：其中， Lossα‑DIoU为引入了alpha参数的DIoU Loss， IoU为预测框与真实框的交并比， α 为参数， ρ 为欧氏距离， b为预测框的中心点坐标， bgt为真实框的中心点坐标， c为预测框和真实框最小外界矩形的对角线距离。 6.一种人头检测系统，其特征在于，包括：样本模块，用于采集监控图像，建立监控图像样本集；所述监控图像包括：人的头部和肩部图像以及对应的标注框；所述监控图像样本集包括：监控图像训练集和监控图像测试集；预处理模块，用于对所述监控图像样本集进行预处理；训练模块，用于基于yolov5算法和SwinTransformer模块建立初始检测模型，利用预处理后的所述监控图像样本训练检测模型，得到目标检测模型；图像模块，用于获取监控图像集，并输入所述目标检测模型；检测模块，用于利用所述目标检测模型对所述监控图像集进行人头检测，得到人头检测结果。 7.根据权利要求6所述的一种人头检测系统，其特征在于，训练模块包括：迭代单元，用于利用所述监控图像训练集对所述初始检测模型进行迭代训练，得到训练后的检测模型；测试单元，用于利用所述监控图像测试集对所述训练后的检测模型进行测试，根据测试结果调整检测模型中相应的模型参数，得到所述目标检测模型。 8.根据权利要求6所述的一种人头检测系统，其特征在于，所述初始检测模型包括：骨干网络、颈部网络和检测头网络；所述骨干网络包括依次相连的Focus层、第一卷积层、第一 CSP瓶颈层、第二卷积层、第二CSP瓶颈层、第三卷积层、第三CSP瓶颈层、第四卷积层、池化层和第一Swin Transformer模块；所述颈部网络包括依次相连的第五卷积层、第一上采样层、第一连接层、第四CSP瓶颈层、第二Swin Transformer模块、第六卷积层、第二上采样层、第二连接层、第五CSP瓶颈层、第三Swin Transformer模块、第七卷积层、第三上采样层、第三连接层、第六CSP瓶颈层、第四Swin Transformer模块、第八卷积层、第四连接层、第七CSP瓶颈层、第五Swin Transformer模块、第九卷积层、第五连接层和第八CSP瓶颈层；所述检测头权　利　要　求　书 2/3 页 3 CN 114882440 A 3

专利 一种人头检测方法和系统

专利一种人头检测方法和系统