(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210467457.8
(22)申请日 2022.04.29
(71)申请人 韶关学院
地址 512005 广东省韶关 市浈江区大 学路
288号
(72)发明人 郑楚伟 林辉 韩竺秦
(74)专利代理 机构 广州骏思知识产权代理有限
公司 44425
专利代理师 程毅
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/774(2022.01)
G06V 10/762(2022.01)G06T 3/40(2006.01)
G06N 3/04(2006.01)
(54)发明名称
基于改进YOLOv5的安全帽佩戴检测方法
(57)摘要
本发明涉及一种基于改进YOLOv5的安全帽
佩戴检测方法, 包括步骤: 获取包含检测目标的
待检测图像; 将所述待检测图像输入改进的
YOLOv5模型进行目标检测, 得到所述检测目标的
位置尺寸信息及所属类别。 相对于现有技术, 本
发明提供一种基于改进YOLOv5的安全帽佩戴检
测方法, 通过多层的Swin transformer Block网
络对特征进行提取, 增强了模型对待检测图像的
特征提取能力, 通过自注意力机制提取特征, 能
够获得对用于识别检测目标贡献大的图像特征,
并且通过多层次的特征提取, 能够获得更丰富的
图像特征, 从而能够识别受到遮挡的检测目标以
及亮度较低的检测目标, 此外还能够辨别与检测
目标形状相似的物体, 误检漏检率低, 模型的检
测准确度高。
权利要求书5页 说明书14页 附图7页
CN 114973122 A
2022.08.30
CN 114973122 A
1.一种基于改进YOLOv5的安全帽佩戴检测方法, 其特 征在于, 包括 步骤:
获取包含检测目标的待检测图像;
将所述待检测图像输入改进的YOLOv5模型进行目标检测, 得到所述检测目标的位置尺
寸信息及所属类别, 其中, 所述改进的Y OLOv5模型包括特征提取模块、 特征融合模块和结果
预测模块, 所述特征提取模块包括图块分割子模块、 线性嵌入子模块、 第一Swin ‑T子模块、
第一图块拼接子模块、 第二Swin ‑T子模块、 第二图块拼接子模块、 第三Swin ‑T子模块、 第三
图块拼接子模块、 第四Swin ‑T子模块、 第四图块拼接子模块和第五Swin ‑T子模块, 所述特征
提取模块对待检测图像的特 征提取时, 包括 步骤:
将所述待检测图像输入所述图像分割子模块进行图像分割;
将分割后的所述待检测图像输入所述线性嵌入子模块进行线性变换;
将线性变换后的所述待检测图像输入所述第一Swin ‑T子模块进行特征提取, 得到第一
Swin‑T特征图;
将所述第一Swin ‑T特征图输入所述第一图块拼接子模块进行下采样, 得到第一层次特
征图;
将所述第一层次特征图输入所述第二Swin ‑T子模块进行特征提取, 得到第二Swin ‑T特
征图;
将所述第二Swin ‑T特征图输入所述第二图块拼接子模块进行下采样, 得到第二层次特
征图;
将所述第二层次特征图输入所述第三Swin ‑T子模块进行特征提取, 得到第三Swin ‑T特
征图;
将所述第三Swin ‑T特征图输入所述第三图块拼接子模块进行下采样, 得到第三层次特
征图;
将所述第三层次特征图输入所述第四Swin ‑T子模块进行特征提取, 得到第四Swin ‑T特
征图;
将所述第四Swin ‑T特征图输入所述第四 图块拼接子模块进行下采样, 得到第四层次特
征图;
将所述第四层次特征图输入所述第五Swin ‑T子模块进行特征提取, 得到第五Swin ‑T特
征图;
其中, 所述第一Swin ‑T子模块、 第二Swin ‑T子模块、 第四Swin ‑T子模块和第五Swin ‑T子
模块均包括两个Swin transformer Block网络, 第三Swin ‑T子模块包括六个所述Swin
transformer Block网络, 所述Swin transformer Block网络用于对输入的特征图进行图
像特征提取;
所述特征融合模块用于根据所述第五Swin ‑T特征图、 第四Swin ‑T特征图、 第三Swin ‑T
特征图、 第二Sw in‑T特征图进行融合, 得到多个不同网格尺寸的输出 特征图;
所述结果预测模块用于根据多个不同网格尺寸的输出特征图预测得到检测目标的位
置尺寸信息及所属类别。
2.根据权利要求1所述的方法, 其特征在于: 所述Swin transformer Block网络包括四
个LayerNorm层、 一个多头自注意力层、 两个MLP层、 一个移位窗口多头自注意力层、 四个
DropPath层和四个残差连接层, 所述Swin transformer Block网络对输入的特征图进行图权 利 要 求 书 1/5 页
2
CN 114973122 A
2像特征提取时, 包括 步骤:
将所述输入 的特征图输入所述LayerNorm层进行归一化处理; 将归一化的所述输入 的
特征图输入所述多头自注意力层进行多头自注意力特征提取, 得到多头自注意力特征图;
将所述多头自注 意力特征图输入 所述DropPath层 进行随机失活; 将所述Dr opPath层输出的
所述多头自注意力特征图与所述输入的特征图输入所述残差连接层进 行残差连接, 得到第
一中间特 征图;
将所述第一中间特征图输入所述LayerNorm层进行归一化处理; 将归一化的所述第一
中间特征图输入 所述MLP层进 行线性变换, 得到第一变换特征图; 将所述第一变换特征图输
入所述DropPath层进行随机失活; 将所述Dr opPath层输出的所述第一变换特征图与所述第
一中间特 征图输入所述残差连接层进行残差连接, 得到第二中间特 征图;
将所述第二中间特征图输入所述LayerNorm层进行归一化处理; 将归一化的所述第二
中间特征图输入所述移 位窗口多头自注意力层进 行像素移位的多头自注意力特征提取, 得
到移位多头自注 意力特征图; 将所述移 位多头自注 意力特征图输入 所述DropPath层 进行随
机失活; 将所述Dr opPath层输出的所述移位多头自注 意力特征图与所述第二中间特征图输
入所述残差连接层进行残差连接, 得到第三中间特 征图;
将所述第三中间特征图输入所述LayerNorm层进行归一化处理; 将归一化的所述第三
中间特征图输入 所述MLP层进 行线性变换, 得到第二变换特征图; 将所述第二变换特征图输
入所述DropPath层进行随机失活; 将所述Dr opPath层输出的所述第二变换特征图与所述第
三中间特征图输入所述残差连接层进行残差连接, 得到作为所述Swin transformer Block
网络输出的特 征图。
3.根据权利要求1所述的方法, 其特征在于: 所述第一图块拼接子模块、 第二图块拼接
子模块、 第三图块拼接子模块和第四图块拼接子模块均包括图块分割层、 concat层、
LayerNorm层和 全连接层, 其中, 所述图块分割层用于将输入的维度为[H, W, C]特征图中间
隔为2的相邻像素划分为多个图块; 所述concat层用于将分割的所述图块进行concat 拼接,
得到维度变为[H/2,W/2,4C]的特征图; 所述LayerNorm层用于将所述concat层输出的特征
图进行归一化; 所述全连接层用于将所述LayerNorm层输出的特征图的通道数进行线性变
换, 得到维度为[H /2,W/2,2C]的特 征图。
4.根据权利要求1所述的方法, 其特征在于: 所述特征融合模块包括第一CONV层、 第一
UP层、 第一Concat层、 第一C3 ‑Ghost层、 第二CONV层、 第二UP层、 第二Concat层、 第二C3 ‑
Ghost层、 第三CONV层、 第三UP层、 第三Concat层、 第三C3 ‑Ghost层、 第四CONV层、 第四Concat
层、 第四C3 ‑Ghost层、 第五CONV层、 第五Concat层、 第五C3 ‑Ghost层、 第六CONV层、 第六
Concat层和第六C3 ‑Ghost层, 所述特征融合模块根据所述第五Swin ‑T特征图、 第四Swin ‑T
特征图、 第三Swin ‑T特征图、 第二Swin ‑T特征图进行融合, 得到多个不同网格尺 寸的输出特
征图时, 包括 步骤:
获取所述第五Swin ‑T特征图并输入所述第一CONV层进行卷积处理, 得到第一卷积特征
图; 将所述第一卷积特征图输入所述第一UP层进行上采样操作; 获取所述第四Swin ‑T特征
图并与所述第一UP层输出的特征图共同输入 所述第一Concat层 进行Concat拼接; 将所述第
一Concat层输出的特 征图输入所述第一C 3‑Ghost层进行 卷积处理, 得到第一输出 特征图;
将所述第一输出特征图输入所述第二CONV层进行卷积处理, 得到第二卷积特征图; 将权 利 要 求 书 2/5 页
3
CN 114973122 A
3
专利 基于改进YOLOv5的安全帽佩戴检测方法
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:02:04上传分享