安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211195726.6 (22)申请日 2022.09.29 (71)申请人 山东大学 地址 266237 山东省青岛市 即墨滨海路72 号 申请人 哈尔滨工业大 学 (深圳) 浙江猫精人工智能科技有限公司 (72)发明人 吴建龙 孙玮 聂礼强 甘甜 李潇婕 丁宁 姜飞俊 (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 张庆骞 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/764(2022.01)G06V 10/774(2022.01) G06V 10/778(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) (54)发明名称 基于近邻一致性和对比学习的半监督视频 分类方法及系统 (57)摘要 本发明属于计算机视觉视频分类领域, 为了 解决现有技术对视频中的运动信息挖掘不足, 引 入监督信号过少, 模型训练效率低下以及学习到 的特征判别性不足, 这些均导致视频分类的准确 率较低的问题, 提供基于近邻一致性和对比学习 的半监督视频分类方法及系统。 其中基于近邻一 致性和对比学习的半监督视频分类方法包括提 取待分类视频样本的RGB帧图像; 基于RGB帧图像 及训练好的教师网络, 得到所有视频分类的预测 分布, 将概率最大的类别作为分类结果; 其基于 教师‑学生网络对视频进行分类, 能够在仅有少 量标注数据的情况 下提高视频分类的准确性。 权利要求书2页 说明书11页 附图2页 CN 115311605 A 2022.11.08 CN 115311605 A 1.一种基于 近邻一致性和对比学习的半监 督视频分类方法, 其特 征在于, 包括: 提取待分类视频样本的RGB帧图像; 基于RGB帧图像及训练好的教师网络, 得到所有视频分类的预测分布, 并将其中概率最 大的类别作为分类结果; 其中, 所述教师网络来源于教师 ‑学生网络, 教师 ‑学生网络的训练过程 为: 对于有标签视频样本, 进行监 督学习, 得到监 督学习损失; 对于无标签视频样本, 进行伪标签学习, 得到伪标签学习损失; 对于无法生成伪标签的无 标签视频样本, 进行近邻一 致性学习, 得到 近邻一致性损失; 依据近邻视频样本信息, 进行近邻对比学习, 得到 近邻对比损失; 根据整合在一起的监督学习损失、 伪标签学习损失、 近邻一致性损失和近邻对比损失, 对教师‑学生网络进行 联合优化训练。 2.如权利要求1所述的基于近邻一致性和对比学习的半监督视频分类方法, 其特征在 于, 在训练教师 ‑学生网络的过程, 还 包括: 提取视频样本的RGB帧和TG帧, 并进行强弱扩充。 3.如权利要求2所述的基于近邻一致性和对比学习的半监督视频分类方法, 其特征在 于, 在训练教师 ‑学生网络的过程中: 对于有标签视频样本, 依据标签和弱扩充后样本的预测分布, 最小化 二者交叉熵。 4.如权利要求2所述的基于近邻一致性和对比学习的半监督视频分类方法, 其特征在 于, 在训练教师 ‑学生网络的过程中: 对于无标签视频样本, 教师网络利用弱扩充后的RGB帧和TG帧生成高置信度的伪标签, 并最小化伪标签和由学生网络得到的强扩充样本预测分布之间的交叉熵。 5.如权利要求2所述的基于近邻一致性和对比学习的半监督视频分类方法, 其特征在 于, 在训练教师 ‑学生网络的过程中: 对于无法生成伪标签的无标签样本, 教师网络借助近邻信息生成高置信度的近邻标 签, 并最小化近邻标签和由学生网络得到的强扩充样本预测分布之间的KL散度。 6.如权利要求1或2所述的基于近邻一致性和对比学习的半监督视频分类方法, 其特征 在于, 在训练教师 ‑学生网络的过程中: 依据近邻信 息, 将样本与其近邻样本构造正样本对, 与非近邻样本构造负样本对, 并利 用对比学习, 最小化 正样本对之间的距离, 最大化负 样本对之间的距离 。 7.一种基于 近邻一致性和对比学习的半监 督视频分类系统, 其特 征在于, 包括: RGB帧提取模块, 其用于提取待分类视频样本的RGB帧图像; 视频分类模块, 其用于基于RGB帧图像及训练好的教师网络, 得到所有视频分类的预测 分布, 并将其中概 率最大的类别作为分类结果; 其中, 所述教师网络来源于教师 ‑学生网络, 教师 ‑学生网络的训练过程 为: 对于有标签视频样本, 进行监 督学习, 得到监 督学习损失; 对于无标签视频样本, 进行伪标签学习, 得到伪标签学习损失; 对于无法生成伪标签的无 标签视频样本, 进行近邻一 致性学习, 得到 近邻一致性损失; 依据近邻视频样本信息, 进行近邻对比学习, 得到 近邻对比损失; 根据整合在一起的监督学习损失、 伪标签学习损失、 近邻一致性损失和近邻对比损失,权 利 要 求 书 1/2 页 2 CN 115311605 A 2对教师‑学生网络进行 联合优化训练。 8.如权利要求7所述的基于近邻一致性和对比学习的半监督视频分类系统, 其特征在 于, 在训练教师 ‑学生网络的过程中: 提取视频样本的RGB帧和TG帧, 并进行强弱扩充; 对于有标签视频样本, 依据标签和弱扩充后样本的预测分布, 最小化 二者交叉熵。 9.如权利要求8所述的基于近邻一致性和对比学习的半监督视频分类系统, 其特征在 于, 在训练教师 ‑学生网络的过程中: 对于无标签视频样本, 教师网络利用弱扩充后的RGB帧和TG帧生成高置信度的伪标签, 并最小化伪标签和由学生网络得到的强扩充样本预测分布之间的交叉熵。 10.如权利要求8所述的基于近邻一致性和对比学习的半监督视频分类系统, 其特征在 于, 在训练教师 ‑学生网络的过程中: 对于无法生成伪标签的无标签样本, 教师网络借助近邻信息生成高置信度的近邻标 签, 并最小化近邻标签和由学生网络得到的强扩充样本预测分布之间的KL散度。权 利 要 求 书 2/2 页 3 CN 115311605 A 3
专利 基于近邻一致性和对比学习的半监督视频分类方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:04:28
上传分享
举报
下载
原文档
(660.5 KB)
分享
友情链接
GB-T 26603-2011 N,N-二甲基苯胺.pdf
GB-T 33131-2016 信息安全技术 基于IPSec的IP存储网络安全技术要求.pdf
GB 29384-2012 乙酰甲胺磷原药.pdf
GB-T 41783-2022 模块化数据中心通用规范.pdf
SY-T 0538-2021 管式加热炉规范.pdf
中康科技 乙肝肝炎行业研究报告解读 2021 .pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
GB-T 36896.2-2018 轻型有缆遥控水下机器人 第2部分:机械手与液压系统.pdf
GB-T 20272-2019 信息安全技术 操作系统安全技术要求.pdf
NY-T 2997-2016 草地分类.pdf
DB14-T 1720-2018 黄土公路隧道工程监测技术规程 山西省.pdf
ISO IEC 27035-1-2016.pdf
GB-T 36896.3-2018 轻型有缆遥控水下机器人 第3部分:导管螺旋桨推进器.pdf
GB-T 12538-2023 道路车辆 质心位置的测定.pdf
GB-T 7002-2008 投光照明灯具光度测试.pdf
民航 CTSO-C13f 救生衣.pdf
专利 黑产设备的确定方法、装置及服务器.PDF
T-CASMES 176—2023 智慧城市管家运营服务规范.pdf
GB-T 12572-2008 无线电发射设备参数通用要求和测量方法.pdf
JR-T 0099-2012 证券期货业信息系统运维管理规范.pdf
1
/
16
评价文档
赞助2元 点击下载(660.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。