安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210509561.9 (22)申请日 2022.05.10 (71)申请人 东北林业大 学 地址 150040 黑龙江省哈尔滨市香坊区和 兴路26号 (72)发明人 黄英来 李大明 姜忠良  (51)Int.Cl. G06V 20/52(2022.01) G06V 20/40(2022.01) G06V 10/20(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种可调节算法计算参数量的监控视频人 物跟踪方法 (57)摘要 本发明公开了一种可调节算法计算参数量 的监控视频人物跟踪方法。 包 括: (1)制作训练数 据集。 (2)搭建改进的GhostNet ‑YOLOX网络, 主要 改进为: 使用GhostNet方法替换YOLOX算法原卷 积结构, 通过调整压缩比k, 控制压缩算法计算参 数量, 以适应不同算力的处理器, 训练Gho stNet‑ YOLOX网络以及实现视频人物位置信息 预测。 (3) 输入监控行人视频, 对视频分帧图片使用自适应 伽马变换进行亮度均衡处理, 降低或提升过亮或 过暗图片的亮度, 增强算法的识别率。 (4)使用 DeepSort算法调用改进后的GhostNet ‑YOLOX训 练模型, 输出预测结果, 实现人物跟踪。 通过改 进, 该算法能够保持较好的精度, 并提供不同的 计算参数量版本, 从而更好地在移动设备上进行 部署。 权利要求书2页 说明书6页 附图3页 CN 114821480 A 2022.07.29 CN 114821480 A 1.一种可调节算法计算参数量的监控视频人物跟踪方法, 结合GhostNet ‑YOLOX的目标 检测算法和De epSort算法, 包括如下步骤: 步骤1: 对多场景背景(商业区、 十字路口、 街道)下的监控视频进行分帧, 并对其中的人 像位置进行 标注, 将图片和对应的标注信息以VOC数据集格式存 储, 用作实验的训练集; 步骤2: 搭建 GhostNet ‑YOLOX模型; 步骤3: 输入训练集数据, 训练GhostNet ‑YOLOX模型, 直至损失函数曲线趋于平稳时, 停 止训练, 保存此时的训练权值, 以.pth格式保存; 步骤4: 输入监控行人视频, 对视频的分帧图像进行自适应伽马增强, 来调节整个 图片 的亮度; 步骤5: 对当前视频帧图片, 调用改进后的训练模型, 载入训练权值, 输出预测人物位置 参数; 步骤6: 使用De epSort算法根据轨 迹对当前 预测参数进行 管理, 分配ID实现人物 跟踪。 2.根据权利要求1所述的一种基于结合GhostNet ‑YOLOX的目标检测算法和D eepSort算 法的监控视频 人物跟踪方法其特 征在于, 步骤2包括: 首先, 搭建GhostNet ‑YOLOX网络, 主要包括: BackBone部分, Neck部分和Decouple_Head 三部分。 网络的基本组成单元为: Focus特征图重组结构, 由GhostNet、 批量归一化层和SiLU 函数激活层组成的GBS块,CS PLayer多 级残差块, S PP并行池化结构。 其中: SiLU的函数表达式为: 然后, 使用GhostNet方法替换其中的卷积结构, 设输入特征图为F1∈RC×H×W, 特征图通道 数为C, 宽和高分别为W和H。 输出特征图为 模块压缩比系数为k, 通过设定不同k 值, 调整计算 参数量。 GhostNet的过程 为: 首先, 通过常规卷积操作降低输入特征图通道数, 得到浓缩信息的特征图 C2值为C4/k; 然后, 对浓缩的特征图进行depthwise卷积操作, 得到映射特征图 C3值为 C4·(k‑1)/k, 同时为缩减参数量, 使depthwise卷积组数为C2, 则形成F2和F3维度之间的一 对多映射; 最后, 将浓 缩特征图通过残差边和映射特 征图进行拼接, 得到F4。 3.根据权利要求1所述的一种基于结合GhostNet ‑YOLOX的目标检测算法和D eepSort算 法的监控视频 人物跟踪方法其特 征在于, 步骤3包括: GhostNet ‑YOLOX的损失函数表达式为: L oss=loss_loc+k1×loss_con+k2×loss_cls。 其中, loss_loc为位置预测框回归损失, loss_con为置信度损失, loss_cls为分类损 失。 K1和K2为平衡三 者的参数。 4.根据权利要求1所述的一种基于结合GhostNet ‑YOLOX的目标检测算法和D eepSort算 法的监控视频 人物跟踪方法其特 征在于, 步骤4包括: 首先, 将待分帧的图片转化为RGB格式, 分为R、 G、 B三张特征 图, 分别计算R、 G、 B三张特 征图的像素均值M1、 M2、 M3。 然后, 分别求取R、 G、 B三张特征图各自 的变换系数αi, (i取值为1、 2、 3), 则最终的变 换系权 利 要 求 书 1/2 页 2 CN 114821480 A 2数α =( α1+α2+α3)/3。 αi计算公式如下: 然后, 分别对R、 G、 B三张特征图的每个像素值Xi, 映射到Yi∈[0,1]区间内。 映射公式如 下: Yi=Xi/255。 最后, 将Yi进行伽马变换后, 映射回原空间。 计算公式为: Zi=Yiα×255。 5.根据权利要求1所述的一种基于结合GhostNet ‑YOLOX的目标检测算法和D eepSort算 法的监控视频 人物跟踪方法其特 征在于, 步骤6包括: 步骤6‑1: 首先, 根据GhostNet ‑YOLOX的检测结果detections初始化预测轨迹信息 tracks。 其中, 轨迹信息tracks利用8维特征向量 表示,u,v表示检测框的坐 标, y,h表示宽高比和高, 后四个参数分别表示前四个参数的变化 率。 步骤6‑2: 对于预测的轨迹信息通过卡尔曼滤波算法进行导出, 产生未确认状态的新轨 迹unconfirmed tracks和可确认状态的轨 迹confirmed tracks。 步骤6‑3: 对于确认状态的轨迹confir med tracks, 与detections产生的目标框信息结 果进行级联匹配cascade, 形成如下两种情况: (1)tracks和detecti ons失配; (2)t racks和detecti ons匹配成功; 当tracks和detections匹配成功的情况, 则代表跟踪成功, 之后使用卡尔曼滤波法更 新预测轨 迹Tracks信息, 返回6 ‑2步骤, 进入下一循环。 步骤6‑4: 对于未确认状态的新轨迹unconfirmed  tracks或者原为确认状态的轨迹级 联匹配后失配 的tracks和detections, 进行tracks和detections之间的IoU值计算, 形成 tracks和detecti ons代价矩阵。 步骤6‑5: 代价矩阵通过匈 牙利算法, 得到t racks的三种匹配结果: (1)tracks失配; (2)decti ons失配; (3)t racks和detecti ons匹配成功。 对于6‑5的第(1)种情况: 如果失配的tracks是未确认态 或者是确认态的tracks但失配 次数超过3 0, 则删除, 反之失配次数 未超过30, 进入步骤6 ‑2, 进入下一循环。 对于6‑5的第(2)种情况: 对于失配的detections, 则为其分配一个新track,并分配新 的ID后进入步骤6 ‑2, 进入下一循环。 对于6‑5的第(3)种情况: 则代表跟踪成功, 之后使用卡尔曼滤波法更新预测轨迹 tracks信息, 返回6 ‑2步骤, 进入下一循环。 步骤6‑6: 重复步骤6 ‑2至步骤6 ‑5, 直到视频帧结束。权 利 要 求 书 2/2 页 3 CN 114821480 A 3

.PDF文档 专利 一种可调节算法计算参数量的监控视频人物跟踪方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种可调节算法计算参数量的监控视频人物跟踪方法 第 1 页 专利 一种可调节算法计算参数量的监控视频人物跟踪方法 第 2 页 专利 一种可调节算法计算参数量的监控视频人物跟踪方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:56:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。