安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165883.2 (22)申请日 2022.09.23 (71)申请人 维沃移动通信有限公司 地址 523863 广东省东莞 市长安镇维沃路1 号 (72)发明人 肖达 (74)专利代理 机构 北京远志博慧知识产权代理 事务所 (特殊普通合伙) 11680 专利代理师 李翠雅 (51)Int.Cl. G06V 10/764(2022.01) G06V 20/40(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 视频分类方法、 装置、 电子设备及存 储介质 (57)摘要 本申请公开了一种视频分类方法、 装置、 电 子设备及存储介质, 属于人工智 能技术领域。 该 方法包括: 获取目标视频的视频特征信息; 目标 视频包括图像特征信息和文本特征信息; 将视频 特征信息输入至视频分类模型, 对目标视频进行 第一分类处理, 得到目标视频对应的M个第一分 类类别, 并对图像特征信息和文本特征信息进行 第二分类处理, 得到目标视频对应的N个第二分 类类别, M、 N为正整数; 基于M个第一 分类类别, 校 准N个第二 分类类别, 并通过校准后的N个第二分 类类别, 确定目标视频对应的目标分类 类别。 权利要求书2页 说明书12页 附图2页 CN 115359303 A 2022.11.18 CN 115359303 A 1.一种视频分类方法, 其特 征在于, 所述方法包括: 获取目标视频的视频 特征信息; 所述目标视频包括图像特 征信息和文本特 征信息; 将所述视频特征信息输入至视频分类模型, 对所述目标视频进行第一分类处理, 得到 所述目标视频对应的M个第一分类类别, 并对所述图像特征信息和所述文本特征信息进行 第二分类处 理, 得到所述目标视频对应的N个第二分类 类别, M、 N 为正整数; 基于所述M个第 一分类类别, 校准所述N个第二分类类别, 并通过所述校准后的N个第二 分类类别, 确定所述目标视频对应的目标分类 类别。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述M个第一分类类别, 校准所述 N个第二分类 类别, 包括: 获取第一类别信息, 所述第一类别信息用于表征所述目标视频属于所述M个第一分类 类别中的任一第一分类 类别的概 率; 根据所述第 一类别信息、 所述M个第一分类类别和所述N个第二分类类别, 校准所述N个 第二分类 类别。 3.根据权利要求2所述的方法, 其特 征在于, 所述获取第一类别 信息, 包括: 对所述M个第一分类类别与预设类别进行交叉熵计算, 得到M个第一损 失值, 每个第一 损失值用于指示M个第一分类 类别中的每 个第一分类 类别与预设类别之间的差异程度; 对所述M个第一损失值进行采样处 理, 得到所述第一类别 信息。 4.根据权利要求1至3 中任一项所述的方法, 其特征在于, 所述通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目标分类 类别之后, 所述方法还 包括: 对所述校准后的N个第二分类类别与预设类别进行交叉熵计算, 得到N个第二损失值, 每个第二损失值用于表征所述校准后的N个第二分类类别中的每个第二分类类别与预设类 别之间的差异程度; 根据所述M个第一损失值和所述 N个第二损失值, 更新所述视频分类模型。 5.根据权利要求1所述的方法, 其特征在于, 所述通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目标分类 类别, 包括: 对所述校准后的N个第二分类类别进行采样处理, 获取N个第二分类信息, 每个第二分 类信息用于表征所述目标视频属于校准后的N个第二分类类别的任一第二分类类别的概 率; 根据所述 N个第二分类信息, 确定所述目标视频对应的目标分类 类别。 6.根据权利要求1所述的方法, 其特 征在于, 获取目标视频的视频 特征信息, 包括: 提取所述目标视频的L视频帧对应的图像特征信息, 以及所述目标视频对应的文本特 征信息, L 为大于1的整数; 将所述图像特 征信息和所述文本特 征信息进行 特征融合, 得到所述视频 特征信息。 7.一种视频分类装置, 其特征在于, 所述视频分类装置包括: 获取模块、 处理模块、 校准 模块和确定模块; 所述获取模块, 用于获取目标视频的视频特征信息; 所述目标视频包括图像特征信息 和文本特 征信息; 所述处理模块, 用于将所述视频特征信息输入至视频分类模型, 对所述目标视频进行 第一分类处理, 得到所述目标视频对应的M个第一分类类别, 并对所述图像特征信息和所述权 利 要 求 书 1/2 页 2 CN 115359303 A 2文本特征信息进行第二分类处理, 得到所述目标视频对应的N个第二分类类别, M、 N为正整 数; 所述校准模块, 用于基于所述M个第一分类 类别, 校准所述 N个第二分类 类别; 所述确定模块, 用于通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目 标分类类别。 8.根据权利要求7所述的装置, 其特征在于, 所述校准模块, 具体用于获取第一类别信 息, 所述第一类别信息用于表征所述 目标视频属于所述M个第一分类类别中的任一第一分 类类别的概率; 并根据所述第一类别信息、 所述M个第一分类类别和所述N个第二分类类别, 校准所述 N个第二分类 类别。 9.根据权利要求8所述的装置, 其特征在于, 所述获取模块, 具体对所述M个第 一分类类 别与预设类别进行交叉熵计算, 得到M个第一损失值, 每个第一损失值用于指示M个第一分 类类别中的每个第一分类类别与预设类别 之间的差异程度; 并对所述M个第一损失值进行 采样处理, 得到所述第一类别 信息。 10.根据权利要求7至9中任一项所述的装置, 其特征在于, 所述处理模块, 还用于所述 通过所述校准后的N个第二分类类别, 确定所述目标视频对应的目标分类类别之后, 对所述 校准后的N个第二分类类别与预设类别进行交叉熵计算, 得到N个第二损失值, 每个第二损 失值用于表征所述校准后的N个第二分类类别中的每个第二分类类别与预设类别之 间的差 异程度; 并根据所述M个第一损失值和所述 N个第二损失值, 更新所述视频分类模型。 11.根据权利要求7所述的装置, 其特征在于, 所述确定模块, 具体用于对所述校准后的 N个第二分类类别进行采样处理, 获取N个第二分类信息, 每个第二分类信息用于表征所述 目标视频属于校准后的N个第二分类类别的任一第二分类类别的概率; 并根据所述N个第二 分类信息, 确定所述目标视频对应的目标分类 类别。 12.根据权利要求7所述的装置, 其特征在于, 所述获取模块, 具体用于提取所述目标视 频的L视频帧对应的图像特征信息, 以及所述目标视频对应的文本特征信息, L为大于1的整 数; 将所述图像特 征信息和所述文本特 征信息进行 特征融合, 得到所述视频 特征信息。 13.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行的程序或指 令, 所述程序或指 令被所述处理器执行时实现如权利要求 1至6 中任一项所述的视频分类方法的步骤。 14.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处 理器执行时实现如权利要求1至 6中任一项所述的视频分类方法的步骤。权 利 要 求 书 2/2 页 3 CN 115359303 A 3
专利 视频分类方法、装置、电子设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:04:34
上传分享
举报
下载
原文档
(625.0 KB)
分享
友情链接
GB-T 41703-2022 商业或工业用及类似用途的热泵热水系统设计、安装、验收规范.pdf
GB-T 10479-2009 铝制铁道罐车.pdf
GB-T 43758.1-2024 智能网联汽车运行安全测试环境技术 条件 第1部分 公共道路.pdf
T-SCCIA 013—2023 机器人通行领域的身份鉴别密码应用指南.pdf
GB-T 19568-2017 风力发电机组 装配和安装规范.pdf
DB22-T 370-2014 建筑逃生缓降器设置技术规范 吉林省.pdf
JY-T 0590-2020 旋转流变仪测量方法通则.pdf
DL-T 2038-2019 高压直流输电工程直流磁场测量方法.pdf
IPC-A-610 电子组件的可接受性.pdf
T-CADERM 5015—2023 救护直升机院际患者转运规范.pdf
Fortify_TaxonomyofSoftwareSecurityErrors Foritfy 7种软件安全错误分类法 英文版 .pdf
GB-T 34960.4-2017信息技术服务治理第4部分审计导则.pdf
YD-T 4075-2022 以太网交换机多机虚拟化系统技术要求.pdf
GB 31892-2015 伞类产品安全通用技术条件.pdf
GB-T 32045-2015 节能量测量和验证实施指南.pdf
猴子无限 构建企业级的私有大模型.pdf
GB-T 35003-2018 非易失性存储器耐久和数据保持试验方法.pdf
GB-Z 25425-2010 风力发电机组 公称视在声功率级和音值.pdf
GB 17411-2015 船用燃料油.pdf
GB-T 21063.4-2007 政务信息资源目录体系 第4部分:政务信息资源分类.pdf
1
/
17
评价文档
赞助2元 点击下载(625.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。