安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210599635.2 (22)申请日 2022.05.30 (71)申请人 联通 (广东) 产业互联网有限公司 地址 510000 广东省广州市黄埔区(中新广 州知识城)亿创街1号 406房之555 (72)发明人 邱芬鹏 邱述洪 童荪 梁华宇  甘海华  (74)专利代理 机构 广州润禾知识产权代理事务 所(普通合伙) 44446 专利代理师 郑永泉 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种人头 检测方法和系统 (57)摘要 本发明涉及计算机视觉领域, 更具体地, 涉 及一种人头检测方法和系统。 本发明通过将Swin   Transformer模块引入yolov5算法, 使检测模型 能更好地关注和 融合特征图的全局信息以及上 下文信息, 挖掘出特征表示的潜能, 提取出更有 用的特征, 提高了拥挤的场景下人头检测的准确 率。 在此基础上, 还对yolov5的检测头分支进行 改造, 在检测模型的计算量基本不变的同时, 提 升了对小目标的检测能力, 进 一步提高人头检测 的准确率。 此外, 选取Alpha ‑IoU Loss作为构建 检测模型的损失函数, 提高检测模 型的检测框精 度以及增强检测模型的鲁棒 性。 权利要求书3页 说明书9页 附图3页 CN 114882440 A 2022.08.09 CN 114882440 A 1.一种人头检测方法, 其特 征在于, 包括: 采集监控图像, 建立监控图像样本集; 所述监控图像包括: 人的头部和肩部图像以及对 应的标注框; 所述 监控图像样本集包括: 监控图像训练集和监控图像测试集; 对所述监控图像样本集进行 预处理; 基于yolov5算法和SwinTransformer模块建立初始检测模型, 利用预处理后的所述监 控图像样本训练检测模型, 得到目标检测模型; 获取监控图像集, 并输入所述目标检测模型; 利用所述目标检测模型对所述 监控图像集进行 人头检测, 得到人头检测结果。 2.根据权利要求1所述的一种人头检测方法, 其特征在于, 基于yolov5算法和 SwinTransformer模块建立初始检测 模型, 利用预处理后的所述监控图像样本训练检测 模 型, 得到目标检测模型, 包括: 利用所述监控图像训练集对所述初始检测模型进行迭代训练, 得到训练后的检测模 型; 利用所述监控图像测试集对所述训练后的检测模型进行测试, 根据测试结果调 整检测 模型中相应的模型参数, 得到所述目标检测模型。 3.根据权利要求1所述的一种人头检测方法, 其特征在于, 所述初始检测模型包括: 骨 干网络、 颈部网络和检测头网络; 所述骨干网络包括依次相连的Focus层、 第一卷积层、 第一 CSP瓶颈层、 第二卷积层、 第二CSP瓶颈层、 第三卷积层、 第三CSP瓶颈层、 第四卷积层、 池化层 和第一Swin  Transformer模块; 所述颈部网络包括依次相连的第五卷积层、 第一上采样层、 第一连接层、 第四CSP瓶颈层、 第二Swin  Transformer模块、 第六卷积层、 第二上采样层、 第 二连接层、 第五CSP瓶颈层、 第三Swin  Transformer模块、 第七卷积层、 第三上采样层、 第三 连接层、 第六CSP瓶颈层、 第四Swin  Transformer模块、 第八卷积层、 第四连接层、 第七CSP瓶 颈层、 第五Swin  Transformer模块、 第九卷积层、 第五连接层和第八CSP瓶颈层; 所述检测头 网络包括: 第一检测 头、 第二检测头和第三检测头; 所述第一CSP瓶颈层与所述第三连接层 连接; 所述第二CSP瓶颈层与第二连接层连接; 所述第三CSP瓶颈层与第一连接层连接; 所述 第一Swin  Transformer模块与第五卷积层连接; 所述第六卷积层与第五连接层连接; 所述 第七卷积层与第四连接层连接; 所述第六CSP瓶颈层与第一检测 头连接; 所述第七CSP瓶颈 层与第二检测头连接; 所述第八CS P瓶颈层与第三检测头连接 。 4.根据权利要求1所述的一种人头检测方法, 其特征在于, 利用所述目标检测模型对所 述监控图像集进行 人头检测, 得到人头检测结果, 包括: 对所述监控图像集进行切片操作, 得到切片特 征图; 对所述切片特征图进行多次第 一特征提取, 得到第 一特征图、 第二特征图、 第 三特征图 和第四特 征图; 所述第一特 征提取为利用CS P瓶颈层进行的特 征提取; 对所述第四特征图进行池化处理、 第二特征提取和上采样操作, 并且与所述第三特征 图进行特征融合, 得到第五特征图; 所述第二特征提取为利用Swin  Transformer模块进行 的特征提取; 对所述第五特 征图进行第二特 征提取, 得到第六 特征图; 对所述第六特征图进行上采样操作, 并且与所述第二特征图进行特征融合, 得到第七 特征图;权 利 要 求 书 1/3 页 2 CN 114882440 A 2对所述第七特 征图进行第二特 征提取, 得到第八特 征图; 对所述第八特征图进行上采样操作, 并且和所述第一特征图进行特征融合, 得到第九 特征图; 对所述第九特征图进行第二特征提取, 并且与所述第八特征图进行特征融合, 得到第 十特征图; 对所述第十特征图进行第二特征提取, 并且与所述第六特征图进行特征融合, 得到第 十一特征图; 将所述第九特征图、 所述第十特征图和所述第十一特征图输入相应的检测头, 检测头 进行中目标、 小目标和特小目标的检测, 得到人头检测结果。 5.根据权利要求1所述的一种人头检测方法, 其特征在于, 所述检测模型的损失函数 为: 其中, Lossα‑DIoU为引入了alpha参数的DIoU  Loss, IoU为预测框与真实框的交并比, α 为 参数, ρ 为欧氏距离, b为预测框的中心点坐 标, bgt为真实框的中心点坐 标, c为预测框和真实 框最小外界矩形的对角线距离 。 6.一种人头检测系统, 其特 征在于, 包括: 样本模块, 用于采集监控图像, 建立监控图像样本集; 所述监控图像包括: 人的头部和 肩部图像以及对应的标注框; 所述监控图像样本集包括: 监控图像训练集和 监控图像测试 集; 预处理模块, 用于对所述 监控图像样本集进行 预处理; 训练模块, 用于基于yolov5算法和SwinTransformer模块建立初始检测模型, 利用预处 理后的所述 监控图像样本训练检测模型, 得到目标检测模型; 图像模块, 用于获取监控图像集, 并输入所述目标检测模型; 检测模块, 用于利用所述目标检测模型对所述监控图像集进行人头检测, 得到人头检 测结果。 7.根据权利要求6所述的一种人头检测系统, 其特 征在于, 训练模块包括: 迭代单元, 用于利用所述监控图像训练集对所述初始检测模型进行迭代训练, 得到训 练后的检测模型; 测试单元, 用于利用所述监控图像测试集对所述训练后的检测模型进行测试, 根据测 试结果调整检测模型中相应的模型参数, 得到所述目标检测模型。 8.根据权利要求6所述的一种人头检测系统, 其特征在于, 所述初始检测模型包括: 骨 干网络、 颈部网络和检测头网络; 所述骨干网络包括依次相连的Focus层、 第一卷积层、 第一 CSP瓶颈层、 第二卷积层、 第二CSP瓶颈层、 第三卷积层、 第三CSP瓶颈层、 第四卷积层、 池化层 和第一Swin  Transformer模块; 所述颈部网络包括依次相连的第五卷积层、 第一上采样层、 第一连接层、 第四CSP瓶颈层、 第二Swin  Transformer模块、 第六卷积层、 第二上采样层、 第 二连接层、 第五CSP瓶颈层、 第三Swin  Transformer模块、 第七卷积层、 第三上采样层、 第三 连接层、 第六CSP瓶颈层、 第四Swin  Transformer模块、 第八卷积层、 第四连接层、 第七CSP瓶 颈层、 第五Swin  Transformer模块、 第九卷积层、 第五连接层和第八CSP瓶颈层; 所述检测头权 利 要 求 书 2/3 页 3 CN 114882440 A 3

.PDF文档 专利 一种人头检测方法和系统

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种人头检测方法和系统 第 1 页 专利 一种人头检测方法和系统 第 2 页 专利 一种人头检测方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:56:19上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。