安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210528222.5 (22)申请日 2022.05.16 (71)申请人 中国科学院深圳先进技 术研究院 地址 518055 广东省深圳市南 山区深圳大 学城学苑大道1068号 申请人 中国科学院深圳理工大 学 (筹) (72)发明人 张佳帅 李攀 缪华桦 张涌  宁立 许宜诚  (74)专利代理 机构 深圳市科进知识产权代理事 务所(普通 合伙) 44316 专利代理师 刘建伟 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) (54)发明名称 一种基于YOLO v5s网络结构的目标检测方 法及其系统 (57)摘要 本发明涉及小目标检测领域, 特别涉及一种 基于YOLO  v5s网络结构的目标检测方法及其系 统; 本发明先进行图片 的马赛克数据增强处理、 自适应锚框计算和图片尺寸处理, 而且还对图片 进行切片后池化再进行特征图融合, 在采用YOL O  v5s原有的按通道维度拼接方法的同时, 采用 双 向特征金字塔网络的双向网络进行融合, 提高了 小目标的检测的精度的效果。 权利要求书1页 说明书5页 附图4页 CN 115205518 A 2022.10.18 CN 115205518 A 1.一种基于 YOLO v5s网络结构的目标检测方法, 其特 征在于, 包括如下步骤: 步骤S1、 采集输入图片, 对图片进行马赛克数据增强处理, 再进行自适应锚框计算得到 最佳锚框值, 再进行图片尺寸处 理缩放到一个固定尺寸; 步骤S2、 对图片进行切片操作处理, 再进行32个卷积核的卷积操作, 然后对图片的卷积 层特征图进行池化处 理, 将不同尺寸的卷积层特 征图拼接在一 起; 步骤S3、 采用双向特征金字塔网络将图片中不同辨率的特征进行融合形成多尺度 特征 融合, 且将多尺度特 征融合并入YOLO  v5s网络结构内; 步骤S4、 对融合特 征后的图片进行检测, 之后输出。 2.根据权利 要求1所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S3内, 将高分辨 率的P2特 征的信息引入多尺度特 征融合中。 3.根据权利 要求2所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S4内, 采用CIOU_L oss作为损失函数来进行检测区分每 个目标框中预测框的相对位置 。 4.根据权利 要求3所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S1内, 对将图片中数据集取出batch, 再从中随机取出4张图片, 进行随机位置裁剪拼接 成新图, 循环进行后进行马赛克 数据增强处 理。 5.根据权利 要求4所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S1内, 在不同的数据集中设定不同初始长宽的锚框, 在训练数据时, 在初始锚框的基础 上得到预测框, 把预测框和真实框比较, 计算出两者差距并反向更新迭代更新网络结构参 数, 进行自适应锚框计算得到最佳锚框值。 6.根据权利 要求5所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S1内, 在YOLO  v5s网络结构内进行训练时, 将图片尺寸进行缩放。 7.根据权利 要求6所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S2内, 将608 x608x3的图像进行切片操作后变成304x304x12大小, 再进行32 个卷积核的 卷积操作, 成为3 04x304x32的特 征图。 8.根据权利 要求7所述的一种基于YOLO  v5s网络结构的目标检测方法, 其特征在于, 在 步骤S2内, 对卷积层特 征图做最大池化, 将不同尺寸的卷积层特 征图拼接在一 起。 9.一种基于 YOLO v5s网络结构的目标检测系统, 其特 征在于, 包括: 输入模块, 用于采集输入图片, 对图片进行马赛克数据增强处理, 再进行自适应锚框计 算得到最佳锚框值, 再进行图片尺寸处 理缩放到一个固定尺寸; 骨干网络模块, 用于对图片进行切片操作处理, 再进行32个卷积核的卷积操作, 然后对 图片的卷积层特 征图进行池化处 理, 将不同尺寸的卷积层特 征图拼接在一 起; 连接模块, 用于采用双向特 征金字塔网络将图片中不同辨 率的特征进行融合; 输出模块, 用于对融合特 征后的图片进行输出。权 利 要 求 书 1/1 页 2 CN 115205518 A 2一种基于 YOLO v5s网络结构的目标 检测方法及其系统 技术领域 [0001]本发明涉及小目标检测领域, 特别涉及一种基于YOLO  v5s网络结构的目标检测方 法及其系统。 背景技术 [0002]随着计算机领域的迅速发展, 目标检测这个计算机视觉中的重要组成部分也受到 社会各界的广泛研究与探索, 并且目标检测技术已经广泛应用于医学、 交通、 安防、 互联网 等领域, 而小目标广泛存在于大视场图片、 远距离成像图片、 特殊类别目标图片中, 并且小 目标的图像具有信息少, 信息占比低、 特征不明显等因素; 基于上述原因, 提高小目标检测 精度以及实时性成为了目标检测广泛应用背景 下的当务之急。 [0003]大多数目标检测方法都是利用卷积神经网络进行特征提取, 而卷积神经网络大多 采用的是最顶端的高层特征, 小目标固有的分辨率低, 经过多次下采样后特征图持续不断 减小, 导致小目标的细节信息 丢失严重 。 发明内容 [0004]本发明主要解决的技术问题是提供一种基于YOLO  v5s网络结构的目标检测方法, 其对图片进行了马赛克数据增强处理、 自适应锚框计算和图片尺寸处理, 而且还对图片进 行切片后池化再进行特征图融合, 在采用YOLO  v5s原有的按通道维度拼接方法 的同时, 采 用双向特征金字塔网络的双向网络进行融合, 提高了小目标的检测的精度的效果; 还提供 了一种基于 YOLO v5s网络结构的目标检测系统。 [0005]为解决上述技术问题, 本发明采用的一个技术方案是: 提供一种基于YOLO  v5s网 络结构的目标检测方法, 其中, 包括如下步骤: [0006]步骤S1、 采集输入图片, 对图片进行马赛克数据增强处理, 再进行自适应锚框计算 得到最佳锚框值, 再进行图片尺寸处 理缩放到一个固定尺寸; [0007]步骤S2、 对图片进行切片操作处理, 再进行32个卷积核的卷积操作, 然后对图片的 卷积层特 征图进行池化处 理, 将不同尺寸的卷积层特 征图拼接在一 起; [0008]步骤S3、 采用双向特征金字塔网络将图片中不同辨率的特征进行融合形成多尺度 特征融合, 且将多尺度特 征融合并入YOLO  v5s网络结构内; [0009]步骤S4、 对融合特 征后的图片进行检测, 之后输出。 [0010]作为本发明的一种改进, 在步骤S3内, 将高分辨率的P2特征的信息引入多尺度特 征融合中。 [0011]作为本发明的进一步改进, 在步骤S 4内, 采用CIOU_Loss作为损失函数来进行检测 区分每个目标框中预测框的相对位置 。 [0012]作为本发明的更进一步改进, 在步骤S1内, 对将图片中数据集取出batch, 再从中 随机取出4张图片, 进行随机位置 裁剪拼接成新图, 循环进行后进行马赛克 数据增强处 理。 [0013]作为本发明的进一步改进, 在步骤S1内, 在不同的数据集中设定不 同初始长宽 的说 明 书 1/5 页 3 CN 115205518 A 3

.PDF文档 专利 一种基于YOLO v5s网络结构的目标检测方法及其系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于YOLO v5s网络结构的目标检测方法及其系统 第 1 页 专利 一种基于YOLO v5s网络结构的目标检测方法及其系统 第 2 页 专利 一种基于YOLO v5s网络结构的目标检测方法及其系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:44:22上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。