(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211197000.6
(22)申请日 2022.09.29
(65)同一申请的已公布的文献号
申请公布号 CN 115272780 A
(43)申请公布日 2022.11.01
(73)专利权人 北京鹰瞳科技发展股份有限公司
地址 100081 北京市海淀区北理工国防科
技园2号楼4层21室
(72)发明人 贺婉佶 史晓宇 和超
(74)专利代理 机构 北京维昊知识产权代理事务
所(普通合伙) 11804
专利代理师 杜丹丹 陈姗姗
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/774(2022.01)(56)对比文件
CN 106960219 A,2017.07.18
CN 111061889 A,2020.04.24
CN 113095338 A,2021.07.09
CN 10913739 2 A,2019.01.04
JP 2021086 350 A,2021.0 6.03
审查员 叶秋珍
(54)发明名称
训练多标签分类模型的方法及相关产品
(57)摘要
本发明涉及一种训练多标签分类模型的方
法, 包括: 获取待作为多标签分类模型的训练样
本的第一图片集, 其中所述多标签 分类模型是基
于第二图片集预训练好的基础模 型, 所述第二图
片集中的图片具有N个类别标签, 所述第一图片
集中的图片具有M个类别标签且缺失N ‑M个类别
标注; 基于所述第一图片集和所述第二图片集创
建新图片集, 其中所述新图片集中缺失部分类别
标注的图片配置有基于所述多标签分类模型所
确定的N‑M个软标签, 以基于所述软标签标注图
片所缺失的类别; 以及基于新图片集对多标签分
类模型进行微调训练。 通过本发明的方案, 能够
有效利用缺失标签的数据资源提升多标签分类
模型的性能。 另外, 本发明还提出了一种设备及
计算机可读存 储介质。
权利要求书2页 说明书6页 附图4页
CN 115272780 B
2022.12.23
CN 115272780 B
1.一种训练多标签分类模型的方法, 其特 征在于, 包括:
获取待作为多标签分类模型的训练样本的第 一图片集, 其中所述多标签分类模型是基
于第二图片集预训练好的基础模 型, 所述第二图片集中的图片具有N个类别标签, 所述第一
图片集中的图片具有M个 类别标签且缺失N ‑M个类别标注, 其中M<N;
基于所述第 一图片集和所述第 二图片集创建新图片集, 其中所述新图片集中缺失部分
类别标注的图片配置有基于所述多标签分类模型所确定的N ‑M个软标签, 以基于所述软标
签标注图片所缺 失的类别, 其中基于所述多标签分类模型对来自所述第一图片集的图片的
未标注类别进行类别预测, 并根据类别预测的结果确定所述未标注类别对应的N ‑M个软标
签; 以及
基于所述 新图片集对所述多标签分类模型进行微调训练。
2.根据权利要求1所述的方法, 其特征在于, 基于所述第 一图片集和所述第 二图片集创
建新图片集包括:
对所述第一图片集和所述第二图片集进行合并处理, 以得到所述新图片集, 其中所述
新图片集中的图片包括所述第一图片集中的所有图片和所述第二图片集中的所有图片。
3.根据权利要求2所述的方法, 其特 征在于, 还 包括:
基于所述 新图片集中图片的来源确定作为训练样本的图片具有的类别标签。
4.根据权利要求3所述的方法, 其特征在于, 基于所述新图片集中图片的来源确定作为
训练样本的图片具有的类别标签包括:
响应于确定所述新图片集中作为训练样本的图片来源于所述第 二图片集, 将所述第 二
图片集对应的N个 类别标签确定为所述作为训练样本的图片的类别标签; 或者
响应于确定所述新图片集中作为训练样本的图片来源于所述第 一图片集, 将所述第 一
图片集对应的M个 类别标签和N ‑M个软标签确定为所述作为训练样本的图片的类别标签。
5.根据权利要求1所述的方法, 其特征在于, 基于所述多标签分类模型对来自所述第 一
图片集的图片的未 标注类别进行类别预测包括:
基于所述多标签分类模型预测来自所述第一图片集的图片的未标注类别对应的类别
概率值, 且确定所述类别概 率值为所述类别预测的结果。
6.根据权利要求5所述的方法, 其特征在于, 基于所述新图片集对所述多标签分类模型
进行微调训练包括:
以所述新图片集中的图片为监督信号对所述多标签分类模型进行有监督微调训练, 其
中, 训练过程中以目标激活函数为所述多标签分类模型 的最后一层, 且以交叉熵为所述多
标签分类模型的损失函数。
7.根据权利要求6所述的方法, 其特 征在于, 还 包括:
在利用来自所述第 一图片集的图片微调所述多标签分类模型时, 根据作为训练样本的
图片的未 标注类别对应的类别概 率值确定交叉熵的目标。
8.一种电子设备, 其特 征在于, 包括:
处理器; 以及
存储器, 其存储有训练多标签分类模型的计算机指令, 当所述计算机指令由所述处理
器运行时, 使得 所述电子设备 执行根据权利要求1 ‑7的任意一项所述的方法。
9.一种计算机可读存储介质, 其特征在于, 包含训练多标签分类模型的计算机指令, 当权 利 要 求 书 1/2 页
2
CN 115272780 B
2所述计算机指令由处 理器执行时, 使得实现根据权利要求1 ‑7的任意一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115272780 B
3
专利 训练多标签分类模型的方法及相关产品
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:04:27上传分享