安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165883.2 (22)申请日 2022.09.23 (71)申请人 维沃移动通信有限公司 地址 523863 广东省东莞 市长安镇维沃路1 号 (72)发明人 肖达  (74)专利代理 机构 北京远志博慧知识产权代理 事务所 (特殊普通合伙) 11680 专利代理师 李翠雅 (51)Int.Cl. G06V 10/764(2022.01) G06V 20/40(2022.01) G06V 10/80(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 视频分类方法、 装置、 电子设备及存 储介质 (57)摘要 本申请公开了一种视频分类方法、 装置、 电 子设备及存储介质, 属于人工智 能技术领域。 该 方法包括: 获取目标视频的视频特征信息; 目标 视频包括图像特征信息和文本特征信息; 将视频 特征信息输入至视频分类模型, 对目标视频进行 第一分类处理, 得到目标视频对应的M个第一分 类类别, 并对图像特征信息和文本特征信息进行 第二分类处理, 得到目标视频对应的N个第二分 类类别, M、 N为正整数; 基于M个第一 分类类别, 校 准N个第二 分类类别, 并通过校准后的N个第二分 类类别, 确定目标视频对应的目标分类 类别。 权利要求书2页 说明书12页 附图2页 CN 115359303 A 2022.11.18 CN 115359303 A 1.一种视频分类方法, 其特 征在于, 所述方法包括: 获取目标视频的视频 特征信息; 所述目标视频包括图像特 征信息和文本特 征信息; 将所述视频特征信息输入至视频分类模型, 对所述目标视频进行第一分类处理, 得到 所述目标视频对应的M个第一分类类别, 并对所述图像特征信息和所述文本特征信息进行 第二分类处 理, 得到所述目标视频对应的N个第二分类 类别, M、 N 为正整数; 基于所述M个第 一分类类别, 校准所述N个第二分类类别, 并通过所述校准后的N个第二 分类类别, 确定所述目标视频对应的目标分类 类别。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述M个第一分类类别, 校准所述 N个第二分类 类别, 包括: 获取第一类别信息, 所述第一类别信息用于表征所述目标视频属于所述M个第一分类 类别中的任一第一分类 类别的概 率; 根据所述第 一类别信息、 所述M个第一分类类别和所述N个第二分类类别, 校准所述N个 第二分类 类别。 3.根据权利要求2所述的方法, 其特 征在于, 所述获取第一类别 信息, 包括: 对所述M个第一分类类别与预设类别进行交叉熵计算, 得到M个第一损 失值, 每个第一 损失值用于指示M个第一分类 类别中的每 个第一分类 类别与预设类别之间的差异程度; 对所述M个第一损失值进行采样处 理, 得到所述第一类别 信息。 4.根据权利要求1至3 中任一项所述的方法, 其特征在于, 所述通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目标分类 类别之后, 所述方法还 包括: 对所述校准后的N个第二分类类别与预设类别进行交叉熵计算, 得到N个第二损失值, 每个第二损失值用于表征所述校准后的N个第二分类类别中的每个第二分类类别与预设类 别之间的差异程度; 根据所述M个第一损失值和所述 N个第二损失值, 更新所述视频分类模型。 5.根据权利要求1所述的方法, 其特征在于, 所述通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目标分类 类别, 包括: 对所述校准后的N个第二分类类别进行采样处理, 获取N个第二分类信息, 每个第二分 类信息用于表征所述目标视频属于校准后的N个第二分类类别的任一第二分类类别的概 率; 根据所述 N个第二分类信息, 确定所述目标视频对应的目标分类 类别。 6.根据权利要求1所述的方法, 其特 征在于, 获取目标视频的视频 特征信息, 包括: 提取所述目标视频的L视频帧对应的图像特征信息, 以及所述目标视频对应的文本特 征信息, L 为大于1的整数; 将所述图像特 征信息和所述文本特 征信息进行 特征融合, 得到所述视频 特征信息。 7.一种视频分类装置, 其特征在于, 所述视频分类装置包括: 获取模块、 处理模块、 校准 模块和确定模块; 所述获取模块, 用于获取目标视频的视频特征信息; 所述目标视频包括图像特征信息 和文本特 征信息; 所述处理模块, 用于将所述视频特征信息输入至视频分类模型, 对所述目标视频进行 第一分类处理, 得到所述目标视频对应的M个第一分类类别, 并对所述图像特征信息和所述权 利 要 求 书 1/2 页 2 CN 115359303 A 2文本特征信息进行第二分类处理, 得到所述目标视频对应的N个第二分类类别, M、 N为正整 数; 所述校准模块, 用于基于所述M个第一分类 类别, 校准所述 N个第二分类 类别; 所述确定模块, 用于通过所述校准后的N个第 二分类类别, 确定所述目标视频对应的目 标分类类别。 8.根据权利要求7所述的装置, 其特征在于, 所述校准模块, 具体用于获取第一类别信 息, 所述第一类别信息用于表征所述 目标视频属于所述M个第一分类类别中的任一第一分 类类别的概率; 并根据所述第一类别信息、 所述M个第一分类类别和所述N个第二分类类别, 校准所述 N个第二分类 类别。 9.根据权利要求8所述的装置, 其特征在于, 所述获取模块, 具体对所述M个第 一分类类 别与预设类别进行交叉熵计算, 得到M个第一损失值, 每个第一损失值用于指示M个第一分 类类别中的每个第一分类类别与预设类别 之间的差异程度; 并对所述M个第一损失值进行 采样处理, 得到所述第一类别 信息。 10.根据权利要求7至9中任一项所述的装置, 其特征在于, 所述处理模块, 还用于所述 通过所述校准后的N个第二分类类别, 确定所述目标视频对应的目标分类类别之后, 对所述 校准后的N个第二分类类别与预设类别进行交叉熵计算, 得到N个第二损失值, 每个第二损 失值用于表征所述校准后的N个第二分类类别中的每个第二分类类别与预设类别之 间的差 异程度; 并根据所述M个第一损失值和所述 N个第二损失值, 更新所述视频分类模型。 11.根据权利要求7所述的装置, 其特征在于, 所述确定模块, 具体用于对所述校准后的 N个第二分类类别进行采样处理, 获取N个第二分类信息, 每个第二分类信息用于表征所述 目标视频属于校准后的N个第二分类类别的任一第二分类类别的概率; 并根据所述N个第二 分类信息, 确定所述目标视频对应的目标分类 类别。 12.根据权利要求7所述的装置, 其特征在于, 所述获取模块, 具体用于提取所述目标视 频的L视频帧对应的图像特征信息, 以及所述目标视频对应的文本特征信息, L为大于1的整 数; 将所述图像特 征信息和所述文本特 征信息进行 特征融合, 得到所述视频 特征信息。 13.一种电子设备, 其特征在于, 包括处理器, 存储器及存储在所述存储器上并可在所 述处理器上运行的程序或指 令, 所述程序或指 令被所述处理器执行时实现如权利要求 1至6 中任一项所述的视频分类方法的步骤。 14.一种可读存储介质, 其特征在于, 所述可读存储介质上存储程序或指令, 所述程序 或指令被处 理器执行时实现如权利要求1至 6中任一项所述的视频分类方法的步骤。权 利 要 求 书 2/2 页 3 CN 115359303 A 3

PDF文档 专利 视频分类方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频分类方法、装置、电子设备及存储介质 第 1 页 专利 视频分类方法、装置、电子设备及存储介质 第 2 页 专利 视频分类方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。