安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211206057.8 (22)申请日 2022.09.30 (71)申请人 山东大学 地址 266237 山东省青岛市 即墨滨海路72 号 申请人 哈尔滨工业大 学 (深圳) 浙江猫精人工智能科技有限公司 (72)发明人 吴建龙 丁沐河 聂礼强 董雪 甘甜 丁宁 姜飞俊 (74)专利代理 机构 济南圣达知识产权代理有限 公司 372 21 专利代理师 张庆骞 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/778(2022.01)G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 5/02(2006.01) (54)发明名称 基于预习机制知识蒸馏的模型压缩方法及 系统 (57)摘要 本发明属于计算机视觉图像 分类领域, 为了 解决识别图像类别的准确性差且不稳定的问题, 提供基于预习机制知识蒸馏的模型压缩方法及 系统。 其中该方法包括获取图像样 本并标注其标 签, 对学生网络进行监督训练; 使得学生网络与 预先训练好的教师网络进行输出对齐、 特征对 齐、 类别中心对齐以及类别中心对比学习; 计算 图像样本的难度分数, 动态分配不同图像样本的 权重; 基于监督训练、 输出对齐、 特征对齐、 类别 中心对齐及类别中心对比学习的损失函数及不 同图像样本的权重, 得到总损失函数; 根据总损 失函数来指导训练学生网络, 得到训练完成的学 生网络, 以作为图像分类模型, 用于对输入的图 像进行类别分布预测。 其提高了图像识别类别的 准确性。 权利要求书2页 说明书9页 附图4页 CN 115294407 A 2022.11.04 CN 115294407 A 1.一种基于预习机制知识蒸馏的模型压缩方法, 其特 征在于, 包括: 获取图像样本并标注其标签, 对学生网络进行监 督训练; 基于类别对比学习知识蒸馏方法使得学生网络与预先训练好的教师网络进行输出对 齐、 特征对齐、 类别中心对齐以及类别中心对比学习; 采用预习机制的学习策略计算图像样本的难度分数, 并基于难度分数动态分配不同图 像样本的权 重; 基于监督训练、 输出对齐、 特征对齐、 类别中心对齐及类别中心对比学习的损失函数及 不同图像样本的权 重, 得到总损失函数; 根据总损失函数来指导训练学生网络, 得到基于教师网络模型压缩训练完成的学生网 络, 以作为图像分类模型, 用于对输入的图像进行类别分布预测。 2.如权利要求1所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 对学生网 络进行监督训练的过程中, 基于图像样本和标签, 最小化学生网络的预测分布和标签的交 叉熵。 3.如权利要求1所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 在使得学 生网络与预先训练好的教师网络进行输出对齐的过程中, 最小化教师网络和学生网络输出 的KL散度, 让两者的输出相似。 4.如权利要求1所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 在使得学 生网络与预先训练好的教师网络进行特征对齐的过程中, 将学生网络的特征通过多层感知 机对齐教师网络的特 征维度, 并最小化两者特 征的欧几里 得距离, 让两者的特 征相似。 5.如权利要求1所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 在使得学 生网络与预先训练好的教师网络进行类别中心对齐的过程中, 最小化教师网络和学生网络 的全连接层权 重矩阵的欧几里 得距离, 对齐两者的类别中心。 6.如权利要求1所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 在采用预 习机制的学习策略计算图像样本的难度分数的过程中, 当图像样本的难度分数不大于动态 阈值时, 图像样本权重赋值为1; 否则, 图像样本权重的赋值的倒数为图像样本的难度分数 的平方的e指数。 7.如权利要求6所述的基于预习机制知识蒸馏的模型压缩方法, 其特征在于, 所述动态 阈值为幂指函数, 其中, 指数为训练次数, 底数为1与控制增长率的超参数之和。 8.一种基于预习机制知识蒸馏的模型压缩系统, 其特 征在于, 包括: 监督训练模块, 其用于获取图像样本并标注其标签, 对学生网络进行监 督训练; 知识蒸馏模块, 其用于基于类别对比学习知识蒸馏方法使得学生网络与预先训练好的 教师网络进行输出对齐、 特 征对齐、 类别中心对齐以及类别中心对比学习; 预习机制学习模块, 其用于采用预习机制的学习策略计算图像样本的难度分数, 并基 于难度分数动态分配不同图像样本的权 重; 总损失函数确定模块, 其用于基于监督训练、 输出对齐、 特征对齐、 类别中心对齐及类 别中心对比学习的损失函数及不同图像样本的权 重, 得到总损失函数; 模型压缩模块, 其用于根据总损 失函数来指导训练学生网络, 得到基于教师网络模型 压缩训练完成的学生网络, 以作为图像分类模型, 用于对输入的图像进行类别分布预测。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执权 利 要 求 书 1/2 页 2 CN 115294407 A 2行时实现如权利要求1 ‑7中任一项所述的基于预习机制知识蒸馏的模型压缩方法中的步 骤。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑7中任一项 所述的基于 预习机制知识蒸馏的模型压缩方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115294407 A 3
专利 基于预习机制知识蒸馏的模型压缩方法及系统
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:04:26
上传分享
举报
下载
原文档
(728.4 KB)
分享
友情链接
GB-T 39637-2020 金属和合金的腐蚀 土壤环境腐蚀性分类.pdf
T-QAAM 003—2023 智能网联汽车道路测试与示范应用安全管理要求.pdf
GB-T 39404-2020 工业机器人控制单元的信息安全通用要求.pdf
DB31-T 329.1—2019 重点单位重要部位安全技术防范系统要求 第1部分:展览馆、博物馆 上海市.pdf
DB43-T 612-2021 医疗机构能耗定额 湖南省.pdf
GB-T 12167-2006 带电作业用铝合金紧线卡线器.pdf
GB-T 29829-2022 信息安全技术 可信计算密码支撑平台功能与接口规范.pdf
GB-T 12962-2015 硅单晶.pdf
T-FJTEA 002—2023 小白茶林下栽培技术规程.pdf
GB-T 1425-2021 贵金属及其合金熔化温度范围的测定 热分析试验方法.pdf
T-CSTM 00043.6—2018 大气环境腐蚀试验 第6部分:建筑涂层材料暴露腐蚀试验.pdf
GB-T 42591-2023 燃气轮机 质量控制规范.pdf
GB 9706.236-2021 医用电气设备 第2-36部分:体外引发碎石设备的基本安全和基本性能专用要求.pdf
GB-T 6499-2022 原棉含杂率试验方法.pdf
机房管理制度.pdf
DB2数据库安全配置基线.doc
GB-T 27909.3-2011 银行业务 密钥管理(零售) 第3部分:非对称密码系统及其密钥管理和生命周期.pdf
T-CSPSTC 103—2022 氢气管道工程设计规范.pdf
GB-T 41619-2022 科学技术研究项目评价实施指南 基础研究项目.pdf
安华金和 基于数据安全治理.pdf
1
/
16
评价文档
赞助2元 点击下载(728.4 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。