安全公司报告
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111672404.1 (22)申请日 2021.12.31 (71)申请人 哈尔滨工业大 学 地址 150001 黑龙江省哈尔滨市南岗区西 大直街92号 (72)发明人 彭喜元 姚博文 彭宇 刘梓豪  刘连胜  (74)专利代理 机构 哈尔滨市阳光惠远知识产权 代理有限公司 2321 1 代理人 张宏威 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/94(2022.01) G06V 10/40(2022.01) G06V 20/00(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种串级CNN细粒度目标分类方法 (57)摘要 本发明是一种串级CNN细粒度目标分类方 法。 本发明涉及深度学习和硬件加速计算技术领 域, 本发明由第一级CNN分类网络对目标进行第 一次粗分类, 进行宏观目标特征的提取, 实现基 于明显特征的目标粗分类; 根据第一级CNN分类 得到的结果, 再由第二级CNN分类网络进行细粒 度分类, 进行深层 目标特征提取, 实现基于高维 特征的目标分类。 本发明以经典骨干卷积神经网 络模型为基础, 设计串级模型结构进行图像目标 的细粒度分类, 并基于 FPGA设计资源与架构可复 用的加速器, 实现有限资源条件 下的模型高能效 部署和应用。 权利要求书1页 说明书5页 附图1页 CN 114359634 A 2022.04.15 CN 114359634 A 1.一种FP GA硬件加速器架构, 其特征是: 所述架构包括: CNN计算模块、 分类网络权重参 数存储模块和参数调度控制器; 所述CNN计算模块用于实现分类网络结构, 根据串级CNN细粒度目标分类模型结构, 以 网络中的主 要计算结构卷积层为基本设计单 元, 设计硬件计算结构; 分类网络权重参数存储模块用于存储和输出两级网络的权重数据, 包括第 一级分类网 络权重参数和第二级分类网络 权重参数; 所述参数调度控制器用于控制两级网络的运行切换和参数加载。 2.根据权利要求1所述的一种FPGA硬件加速器架构, 其特征是: 参数控制器根据预设的 CNN计算模块执行模式, 控制权重参数存储模块进 行权重数据的加载, 然后控制数据通路切 换模块进行两级网络执 行过程的切换。 3.根据权利要2所述的一种FPGA硬件加速器架构, 其特征是: 当执行第一级分类网络 时, 存储模块由参数调度器控制输出第一级网络权重参数, 并加载到相应的CNN计算单元 中; 当执行第二级分类网络时, 存储模块由参数调度器控制 输出第二级网络权重中对应的 目标子类权 重参数, 并加载到相应的CN N计算单元中。 4.根据权利要3所述的一种FPGA硬件加速器架构, 其特征是: CNN计算模块采用可复用 结构设计, 根据串级网络结构的相似性, 将 硬件结构划分为浅层特征提取部 分、 深层特征提 取部分和分类 器结构。 5.根据权利要3所述的一种FPGA硬件加速器架构, 其特征是: 浅层特征提取部分和分类 器结构组成第一级CNN分类网络; 浅层特征提取部 分、 深层特征提取部 分和分类器结构组成 第二级CNN分类网络; 即第一级和第二级CNN分类网络公用浅层特征提取结构和分类器结 构, 通过加载不同的模型权 重参数实现网络的切换; 在浅层特征提取最后一层和深层特征提取第 一层之间设计数据通路切换模块, 用于控 制特征图数据的流向, 从而实现执行 的网络模型 的切换, 即, 当执行第一级分类网络时, 数 据通路切换模块将浅层特征提取结果直接输出至分类器进 行粗分类; 当执行第二级分类网 络时, 数据通路切换模块将浅层特 征提取结果输出至深层特 征提取部分。 6.一种串级CNN细粒度目标分类方法, 所述方法基于如权利要求1所述的一种FP GA硬件 加速器架构, 其特征是: 由第一级CNN分类网络对目标进行第一次粗分类, 进行宏观目标特 征的提取, 实现基于明显特征的目标粗分类; 根据第一级CNN分类得到的结果, 再由第二级 CNN分类网络进行细粒度分类, 进行深层目标 特征提取, 实现基于高维特 征的目标分类。 7.根据权利 要求6所述的一种串级CNN细 粒度目标分类方法, 其特征是: 第一级CNN分类 网络在深层卷积神经网络基础上, 裁剪高维特征提取结构, 构成低维的浅层特征提取网络, 并根据粗分类数据集对模型参数与结构进 行训练和微调, 从而完成对多类目标的宏观特征 进行粗分类, 且具体目标种类n的值 不能过高。 8.根据权利要求7所述的一种 串级CNN细粒度目标分类方法, 其特征是: 所述步骤2具体 为: 第二级CNN分类采用具有更深层的网络结构, 针对每一种粗分类结果构建子类数据集, 并分别对第二级CNN网络进行训练, 获得对应的网络权重; 在细粒度分类过程中, 分别向第 二级网络中加载对应目标类别权 重, 从而实现更加精准的细粒度目标分类。权 利 要 求 书 1/1 页 2 CN 114359634 A 2一种串级CN N细粒度目标分类方 法 技术领域 [0001]本发明涉及深度学习和硬件加速计算技术领域, 是一种串级CNN细粒度目标分类 方法。 背景技术 [0002]近年来, 人工神经网络在图像解译、 计算机视觉、 语音识别以及数字信号处理等众 多领域受到广泛关注, 并都取得了诸多瞩目的研究成果和进展, 尤其是在图像分类技术方 面, 卷积神经网络作为典型 的人工神经网络模型, 在部分单一场景中其分类精度已超过人 类, 成为目前 处理图像 分类任务的首选方案。 但在实际的应用场景中, 复杂且密集的图像信 息普遍存在于工业生产和社会生活中, 这对神经网络的处理精度提出了更高的要求。 尤其 是对于同种目标内, 但形状、 属性或特征具有细微差别的不同类型目标, 进行更加精细的细 粒度分类, 成为目前图像分类领域的热点研究问题。 为提升网络模型的细粒度分类能力, 人 们进一步提出了更加复杂且精度更高的目标特征学习和分类结构 。 但改进后的模型虽然在 细粒度目标识别任务中表现出了更优的精度和鲁棒性, 但同时其更加复杂的计算结构和重 参数化设计, 也造成了严重的计算开销和处理延迟, 尤其是对于边缘端延迟敏感型任务, 神 经网络模型的实际计算效率成为限制其部署和应用的重要问题。 [0003]目前, 硬件加速器设计已经成为加速神经网络计算过程的重要手段。 FPGA作为一 种高能效、 可重构、 高性价比的硬件加速器设计、 验证和 应用平台, 受到国内外研究者的广 泛关注。 FPGA通常是由可编程逻辑单元、 布线资源和I/O资源组成的半定制可编程芯片, 因 其高度可定制的并行结构, FPGA极其适合处理条件单一且具有重复性的计算任务, 因此十 分适用于加速具有同样特点的卷积神经网络。 然而, 结构复杂的高精度检测网络通常难以 达到最佳的计算加速效果, 而结构更加单一的分类模型更适合FPGA计算, 但却存在精度不 足的问题。 因此, 设计一种能够有效平衡算法精度和计算速度之间的关系, 从而实现神经网 络算法和FPGA硬件间良好地协同运算的方法和加速计算结构, 是该领域需要解决 的重要问 题。 [0004]针对图像分类领域细粒度目标分类需求, 现有方法通常采用改变网络结构, 提升 特征提取维度的方式, 拓宽模型 的细粒度特征学习能力。 这在算法层面虽然可以获得一定 程度的理论精度提升, 但复杂的网络结构和大规模的模型参数, 难以在资源有限条件下 的 边缘端硬件设备中进行部署和 应用。 同时, 受 限于硬件开发难度大、 周期长等问题, 现有的 神经网络加速器也很难以适应多样化、 快速迭代的神经网络发展状态, 对细粒度分类模型 在边缘端的计算加速和高实时性应用造成了阻碍。 因此, 为解决现有方法中, 复杂网络模型 在边缘端硬件设备中难部署、 难计算、 难加速的现实问题, 需要设计一种基于经典神经网络 模型的细粒度图像分类方法, 使其在边缘端硬件部署资源容量限制范围内, 既能满足精细 目标分类的任务需求, 又可以于现有加速方法进行匹配, 从而降低细粒度分类网络设计难 度, 减少边 缘端计算资源消耗, 增强模型实际应用效能。说 明 书 1/5 页 3 CN 114359634 A 3

.PDF文档 专利 一种串级CNN细粒度目标分类方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种串级CNN细粒度目标分类方法 第 1 页 专利 一种串级CNN细粒度目标分类方法 第 2 页 专利 一种串级CNN细粒度目标分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 21:46:38上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。