安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111678278.0 (22)申请日 2021.12.31 (71)申请人 特斯联科技 集团有限公司 地址 101100 北京市通州区滨惠北一 街3号 院1号楼1- 6室 (72)发明人 刘斌 张睿 何英杰 聂虎  (74)专利代理 机构 北京辰权知识产权代理有限 公司 11619 专利代理师 李小朋 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种图像分类方法、 装置、 存 储介质及终端 (57)摘要 本发明公开了一种图像分类方法、 装置、 存 储介质及终端, 方法包括: 获取待分类的目标图 像; 将目标图像输入到预先训练的图像 分类模型 中; 其中, 预先训练的图像分类模型是依次经过 自监督学习、 监督学习和半监督学习训练生成 的; 自监督学习是基于有标签数据集训练的, 监 督学习是基于无标签数据集训练的, 半监督学习 时基于伪标签数据集和有标签数据集共同训练 的; 伪标签数据集是基于无标签数据集生成的; 输出目标图像对应的图像类别。 本申请通过无标 签数据集生成伪标签数据集, 并结合有标签数据 集对模型进一步训练, 从而提升了无标签数据的 利用率, 使得模型的分类精度更高。 权利要求书3页 说明书13页 附图3页 CN 114494718 A 2022.05.13 CN 114494718 A 1.一种图像分类方法, 其特 征在于, 所述方法包括: 获取待分类的目标图像; 将所述目标图像输入到预先训练的图像分类模型中; 其中, 所述预先训练的图像分类 模型是依 次经过自监督学习、 监督学习和半监督学习训练生成的; 所述自监督学习 是基于 有标签数据集训练的, 所述监督学习 是基于无标签数据集训练的, 所述半监督学习时基于 伪标签数据集和有标签数据集共同训练的; 所述伪标签数据集是基于所述无标签数据集生 成的; 输出所述目标图像对应的图像 类别。 2.根据权利要求1所述的方法, 其特征在于, 按照以下步骤生成预先训练 的图像分类模 型, 包括: 获取数据集; 其中, 所述数据集包括无 标签数据集和有标签数据集; 创建分类模型, 并基于所述分类模型的模型参数构建编码器和动量编码器; 根据所述无 标签数据集、 编码器和动量编码器进行自监 督学习, 得到训练后的编码器; 将训练后的编码器的参数加载到所述分类模型上, 并初始化所述分类模型的全连接 层, 得到第一分类模型; 将所述有标签数据集输入到所述第 一分类模型进行监督学习, 得到训练后的第 一分类 模型; 预处理训练后的第一分类模型, 得到预处 理后的第一分类模型; 将所述有标签数据集输入到预处理后的第 一分类模型进行半监督学习, 得到预先训练 的图像分类模型。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述无标签数据集、 编码器和动 量编码器进行自监 督学习, 得到训练后的编码器, 包括: 初始化预设大小的队列; 将所述无 标签数据集划分为多个子数据集; 在所述多个子数据集中确定出一个目标子数据集; 对所述目标子数据集进行图像 变换, 得到第一变换 数据和第二变换 数据; 将所述第一变换数据和第 二变换数据分别 输入到所述编码器和动 量编码器中, 输出第 一嵌入式表征 结果和第二嵌入式表征 结果; 对所述第一嵌入式表征结果和第 二嵌入式表征结果分别进行维度扩 张, 得到第 一扩张 结果和第二扩张结果; 根据所述第一扩张结果和第二扩张结果计算 正样本特 征相似度; 将所述队列中的特征进行置换后得到置换矩阵, 并根据 所述置换矩阵与所述第 一嵌入 式表征结果计算负 样本特征相似度; 根据所述正样本特征相似度和所述负样本特征相似度计算自监督学习损失值, 并当所 述自监督学习损失值到 达预设值时, 得到训练后的编码器。 4.根据权利要求3所述的方法, 其特征在于, 所述当所述自监督学习损失值到达预设值 时, 得到训练后的编码器, 包括: 当所述自监督学习损失值未到达预设值 时, 根据所述自监督学习损失值对所述编码器 进行反向传播, 以更新所述编码器参数;权 利 要 求 书 1/3 页 2 CN 114494718 A 2继续执行所述在所述多个子数据集中确定出一个目标子数据集的步骤, 直到所述自监 督学习损失值到 达预设值。 5.根据权利要求2所述的方法, 其特征在于, 所述预处理训练后的第一分类模型, 得到 预处理后的第一分类模型, 包括: 确定训练后的第一分类模型的骨干网络和第一全连接层; 构建与所述第一全连接层结构相同的第二全连接层; 将所述第二全连接层连接在所述骨干网络的最后一层, 得到第二分类模型; 将所述第二分类模型中的骨干网络和第 一全连接层参数进行固定, 并开启所述第 二分 类模型中的所有Dropout层, 得到预处 理后的第一分类模型。 6.根据权利要求5所述的方法, 其特征在于, 所述将所述有标签数据集输入到预处理后 的第一分类模型进行半监 督学习, 得到预 先训练的图像分类模型, 包括: 将所述有标签数据输入到预处理后的第 一分类模型中进行多次并行计算, 输出多个第 一目标预测值; 根据每个第 一目标预测值计算第 一均值和第 一标准差, 并根据 所述第一均值和第 一标 准差计算半监 督学习损失值; 当所述半监 督学习损失值到 达预设值时, 得到第三分类模型; 开启所述第三分类模型中的第二全连接层中的Dropout层; 关闭所述第三分类模型中的除第二全连接层之外其它层中的Dropout层, 得到预处理 后的第三分类模型; 将所述无标签数据输入预处理后的第 三分类模型中进行多次并行计算, 输出多个第 二 目标概率值和偶然不确定性 参数; 根据每个第二目标概 率值计算出第二均值和第二标准差; 根据所述偶然不确定性 参数、 第二均值和第二标准差得到伪标签数据集; 当所述伪标签符合预设多个条件时, 将所述伪标签数据集加入所述有标签数据集中, 得到目标 数据集; 将所述目标数据集输入到所述第 一分类模型进行监督学习, 得到预先训练的图像分类 模型。 7.根据权利要求6所述的方法, 其特征在于, 所述当所述半监督学习损失值到达预设值 时, 得到第三分类模型, 包括: 当所述半监督学习损失值未到达预设值 时, 继续执行将所述有标签数据输入到预处理 后的第一分类模型中进行多次并行计算的步骤。 8.一种图像分类装置, 其特 征在于, 所述装置包括: 图像获取模块, 用于获取待分类的目标图像; 图像输入模块, 用于将所述目标图像输入到预先训练的图像分类模型中; 其中, 所述预 先训练的图像分类模型是依 次经过自监督学习、 监督学习和半监督学习训练生成的; 所述 自监督学习 是基于有标签数据集训练的, 所述监督学习 是基于无标签数据集训练的, 所述 半监督学习时基于伪标签数据集和有标签数据集共同训练的; 所述伪标签数据集是基于所 述无标签数据集 生成的; 类别输出模块, 用于 输出所述目标图像对应的图像 类别。权 利 要 求 书 2/3 页 3 CN 114494718 A 3

.PDF文档 专利 一种图像分类方法、装置、存储介质及终端

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种图像分类方法、装置、存储介质及终端 第 1 页 专利 一种图像分类方法、装置、存储介质及终端 第 2 页 专利 一种图像分类方法、装置、存储介质及终端 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:46:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。