(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210599635.2
(22)申请日 2022.05.30
(71)申请人 联通 (广东) 产业互联网有限公司
地址 510000 广东省广州市黄埔区(中新广
州知识城)亿创街1号 406房之555
(72)发明人 邱芬鹏 邱述洪 童荪 梁华宇
甘海华
(74)专利代理 机构 广州润禾知识产权代理事务
所(普通合伙) 44446
专利代理师 郑永泉
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种人头 检测方法和系统
(57)摘要
本发明涉及计算机视觉领域, 更具体地, 涉
及一种人头检测方法和系统。 本发明通过将Swin
Transformer模块引入yolov5算法, 使检测模型
能更好地关注和 融合特征图的全局信息以及上
下文信息, 挖掘出特征表示的潜能, 提取出更有
用的特征, 提高了拥挤的场景下人头检测的准确
率。 在此基础上, 还对yolov5的检测头分支进行
改造, 在检测模型的计算量基本不变的同时, 提
升了对小目标的检测能力, 进 一步提高人头检测
的准确率。 此外, 选取Alpha ‑IoU Loss作为构建
检测模型的损失函数, 提高检测模 型的检测框精
度以及增强检测模型的鲁棒 性。
权利要求书3页 说明书9页 附图3页
CN 114882440 A
2022.08.09
CN 114882440 A
1.一种人头检测方法, 其特 征在于, 包括:
采集监控图像, 建立监控图像样本集; 所述监控图像包括: 人的头部和肩部图像以及对
应的标注框; 所述 监控图像样本集包括: 监控图像训练集和监控图像测试集;
对所述监控图像样本集进行 预处理;
基于yolov5算法和SwinTransformer模块建立初始检测模型, 利用预处理后的所述监
控图像样本训练检测模型, 得到目标检测模型;
获取监控图像集, 并输入所述目标检测模型;
利用所述目标检测模型对所述 监控图像集进行 人头检测, 得到人头检测结果。
2.根据权利要求1所述的一种人头检测方法, 其特征在于, 基于yolov5算法和
SwinTransformer模块建立初始检测 模型, 利用预处理后的所述监控图像样本训练检测 模
型, 得到目标检测模型, 包括:
利用所述监控图像训练集对所述初始检测模型进行迭代训练, 得到训练后的检测模
型;
利用所述监控图像测试集对所述训练后的检测模型进行测试, 根据测试结果调 整检测
模型中相应的模型参数, 得到所述目标检测模型。
3.根据权利要求1所述的一种人头检测方法, 其特征在于, 所述初始检测模型包括: 骨
干网络、 颈部网络和检测头网络; 所述骨干网络包括依次相连的Focus层、 第一卷积层、 第一
CSP瓶颈层、 第二卷积层、 第二CSP瓶颈层、 第三卷积层、 第三CSP瓶颈层、 第四卷积层、 池化层
和第一Swin Transformer模块; 所述颈部网络包括依次相连的第五卷积层、 第一上采样层、
第一连接层、 第四CSP瓶颈层、 第二Swin Transformer模块、 第六卷积层、 第二上采样层、 第
二连接层、 第五CSP瓶颈层、 第三Swin Transformer模块、 第七卷积层、 第三上采样层、 第三
连接层、 第六CSP瓶颈层、 第四Swin Transformer模块、 第八卷积层、 第四连接层、 第七CSP瓶
颈层、 第五Swin Transformer模块、 第九卷积层、 第五连接层和第八CSP瓶颈层; 所述检测头
网络包括: 第一检测 头、 第二检测头和第三检测头; 所述第一CSP瓶颈层与所述第三连接层
连接; 所述第二CSP瓶颈层与第二连接层连接; 所述第三CSP瓶颈层与第一连接层连接; 所述
第一Swin Transformer模块与第五卷积层连接; 所述第六卷积层与第五连接层连接; 所述
第七卷积层与第四连接层连接; 所述第六CSP瓶颈层与第一检测 头连接; 所述第七CSP瓶颈
层与第二检测头连接; 所述第八CS P瓶颈层与第三检测头连接 。
4.根据权利要求1所述的一种人头检测方法, 其特征在于, 利用所述目标检测模型对所
述监控图像集进行 人头检测, 得到人头检测结果, 包括:
对所述监控图像集进行切片操作, 得到切片特 征图;
对所述切片特征图进行多次第 一特征提取, 得到第 一特征图、 第二特征图、 第 三特征图
和第四特 征图; 所述第一特 征提取为利用CS P瓶颈层进行的特 征提取;
对所述第四特征图进行池化处理、 第二特征提取和上采样操作, 并且与所述第三特征
图进行特征融合, 得到第五特征图; 所述第二特征提取为利用Swin Transformer模块进行
的特征提取;
对所述第五特 征图进行第二特 征提取, 得到第六 特征图;
对所述第六特征图进行上采样操作, 并且与所述第二特征图进行特征融合, 得到第七
特征图;权 利 要 求 书 1/3 页
2
CN 114882440 A
2对所述第七特 征图进行第二特 征提取, 得到第八特 征图;
对所述第八特征图进行上采样操作, 并且和所述第一特征图进行特征融合, 得到第九
特征图;
对所述第九特征图进行第二特征提取, 并且与所述第八特征图进行特征融合, 得到第
十特征图;
对所述第十特征图进行第二特征提取, 并且与所述第六特征图进行特征融合, 得到第
十一特征图;
将所述第九特征图、 所述第十特征图和所述第十一特征图输入相应的检测头, 检测头
进行中目标、 小目标和特小目标的检测, 得到人头检测结果。
5.根据权利要求1所述的一种人头检测方法, 其特征在于, 所述检测模型的损失函数
为:
其中, Lossα‑DIoU为引入了alpha参数的DIoU Loss, IoU为预测框与真实框的交并比, α 为
参数, ρ 为欧氏距离, b为预测框的中心点坐 标, bgt为真实框的中心点坐 标, c为预测框和真实
框最小外界矩形的对角线距离 。
6.一种人头检测系统, 其特 征在于, 包括:
样本模块, 用于采集监控图像, 建立监控图像样本集; 所述监控图像包括: 人的头部和
肩部图像以及对应的标注框; 所述监控图像样本集包括: 监控图像训练集和 监控图像测试
集;
预处理模块, 用于对所述 监控图像样本集进行 预处理;
训练模块, 用于基于yolov5算法和SwinTransformer模块建立初始检测模型, 利用预处
理后的所述 监控图像样本训练检测模型, 得到目标检测模型;
图像模块, 用于获取监控图像集, 并输入所述目标检测模型;
检测模块, 用于利用所述目标检测模型对所述监控图像集进行人头检测, 得到人头检
测结果。
7.根据权利要求6所述的一种人头检测系统, 其特 征在于, 训练模块包括:
迭代单元, 用于利用所述监控图像训练集对所述初始检测模型进行迭代训练, 得到训
练后的检测模型;
测试单元, 用于利用所述监控图像测试集对所述训练后的检测模型进行测试, 根据测
试结果调整检测模型中相应的模型参数, 得到所述目标检测模型。
8.根据权利要求6所述的一种人头检测系统, 其特征在于, 所述初始检测模型包括: 骨
干网络、 颈部网络和检测头网络; 所述骨干网络包括依次相连的Focus层、 第一卷积层、 第一
CSP瓶颈层、 第二卷积层、 第二CSP瓶颈层、 第三卷积层、 第三CSP瓶颈层、 第四卷积层、 池化层
和第一Swin Transformer模块; 所述颈部网络包括依次相连的第五卷积层、 第一上采样层、
第一连接层、 第四CSP瓶颈层、 第二Swin Transformer模块、 第六卷积层、 第二上采样层、 第
二连接层、 第五CSP瓶颈层、 第三Swin Transformer模块、 第七卷积层、 第三上采样层、 第三
连接层、 第六CSP瓶颈层、 第四Swin Transformer模块、 第八卷积层、 第四连接层、 第七CSP瓶
颈层、 第五Swin Transformer模块、 第九卷积层、 第五连接层和第八CSP瓶颈层; 所述检测头权 利 要 求 书 2/3 页
3
CN 114882440 A
3
专利 一种人头检测方法和系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:56:19上传分享