专利 一种串级CNN细粒度目标分类方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111672404.1 (22)申请日 2021.12.31 (71)申请人哈尔滨工业大学地址 150001 黑龙江省哈尔滨市南岗区西大直街92号 (72)发明人彭喜元　姚博文　彭宇　刘梓豪　刘连胜　 (74)专利代理机构哈尔滨市阳光惠远知识产权代理有限公司 2321 1 代理人张宏威 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/94(2022.01) G06V 10/40(2022.01) G06V 20/00(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种串级CNN细粒度目标分类方法 (57)摘要本发明是一种串级CNN细粒度目标分类方法。本发明涉及深度学习和硬件加速计算技术领域，本发明由第一级CNN分类网络对目标进行第一次粗分类，进行宏观目标特征的提取，实现基于明显特征的目标粗分类；根据第一级CNN分类得到的结果，再由第二级CNN分类网络进行细粒度分类，进行深层目标特征提取，实现基于高维特征的目标分类。本发明以经典骨干卷积神经网络模型为基础，设计串级模型结构进行图像目标的细粒度分类，并基于 FPGA设计资源与架构可复用的加速器，实现有限资源条件下的模型高能效部署和应用。权利要求书1页说明书5页附图1页 CN 114359634 A 2022.04.15 CN 114359634 A 1.一种FP GA硬件加速器架构，其特征是：所述架构包括： CNN计算模块、分类网络权重参数存储模块和参数调度控制器；所述CNN计算模块用于实现分类网络结构，根据串级CNN细粒度目标分类模型结构，以网络中的主要计算结构卷积层为基本设计单元，设计硬件计算结构；分类网络权重参数存储模块用于存储和输出两级网络的权重数据，包括第一级分类网络权重参数和第二级分类网络权重参数；所述参数调度控制器用于控制两级网络的运行切换和参数加载。 2.根据权利要求1所述的一种FPGA硬件加速器架构，其特征是：参数控制器根据预设的 CNN计算模块执行模式，控制权重参数存储模块进行权重数据的加载，然后控制数据通路切换模块进行两级网络执行过程的切换。 3.根据权利要2所述的一种FPGA硬件加速器架构，其特征是：当执行第一级分类网络时，存储模块由参数调度器控制输出第一级网络权重参数，并加载到相应的CNN计算单元中；当执行第二级分类网络时，存储模块由参数调度器控制输出第二级网络权重中对应的目标子类权重参数，并加载到相应的CN N计算单元中。 4.根据权利要3所述的一种FPGA硬件加速器架构，其特征是： CNN计算模块采用可复用结构设计，根据串级网络结构的相似性，将硬件结构划分为浅层特征提取部分、深层特征提取部分和分类器结构。 5.根据权利要3所述的一种FPGA硬件加速器架构，其特征是：浅层特征提取部分和分类器结构组成第一级CNN分类网络；浅层特征提取部分、深层特征提取部分和分类器结构组成第二级CNN分类网络；即第一级和第二级CNN分类网络公用浅层特征提取结构和分类器结构，通过加载不同的模型权重参数实现网络的切换；在浅层特征提取最后一层和深层特征提取第一层之间设计数据通路切换模块，用于控制特征图数据的流向，从而实现执行的网络模型的切换，即，当执行第一级分类网络时，数据通路切换模块将浅层特征提取结果直接输出至分类器进行粗分类；当执行第二级分类网络时，数据通路切换模块将浅层特征提取结果输出至深层特征提取部分。 6.一种串级CNN细粒度目标分类方法，所述方法基于如权利要求1所述的一种FP GA硬件加速器架构，其特征是：由第一级CNN分类网络对目标进行第一次粗分类，进行宏观目标特征的提取，实现基于明显特征的目标粗分类；根据第一级CNN分类得到的结果，再由第二级 CNN分类网络进行细粒度分类，进行深层目标特征提取，实现基于高维特征的目标分类。 7.根据权利要求6所述的一种串级CNN细粒度目标分类方法，其特征是：第一级CNN分类网络在深层卷积神经网络基础上，裁剪高维特征提取结构，构成低维的浅层特征提取网络，并根据粗分类数据集对模型参数与结构进行训练和微调，从而完成对多类目标的宏观特征进行粗分类，且具体目标种类n的值不能过高。 8.根据权利要求7所述的一种串级CNN细粒度目标分类方法，其特征是：所述步骤2具体为：第二级CNN分类采用具有更深层的网络结构，针对每一种粗分类结果构建子类数据集，并分别对第二级CNN网络进行训练，获得对应的网络权重；在细粒度分类过程中，分别向第二级网络中加载对应目标类别权重，从而实现更加精准的细粒度目标分类。权　利　要　求　书 1/1 页 2 CN 114359634 A 2一种串级CN N细粒度目标分类方法技术领域 [0001]本发明涉及深度学习和硬件加速计算技术领域，是一种串级CNN细粒度目标分类方法。背景技术 [0002]近年来，人工神经网络在图像解译、计算机视觉、语音识别以及数字信号处理等众多领域受到广泛关注，并都取得了诸多瞩目的研究成果和进展，尤其是在图像分类技术方面，卷积神经网络作为典型的人工神经网络模型，在部分单一场景中其分类精度已超过人类，成为目前处理图像分类任务的首选方案。但在实际的应用场景中，复杂且密集的图像信息普遍存在于工业生产和社会生活中，这对神经网络的处理精度提出了更高的要求。尤其是对于同种目标内，但形状、属性或特征具有细微差别的不同类型目标，进行更加精细的细粒度分类，成为目前图像分类领域的热点研究问题。为提升网络模型的细粒度分类能力，人们进一步提出了更加复杂且精度更高的目标特征学习和分类结构。但改进后的模型虽然在细粒度目标识别任务中表现出了更优的精度和鲁棒性，但同时其更加复杂的计算结构和重参数化设计，也造成了严重的计算开销和处理延迟，尤其是对于边缘端延迟敏感型任务，神经网络模型的实际计算效率成为限制其部署和应用的重要问题。 [0003]目前，硬件加速器设计已经成为加速神经网络计算过程的重要手段。 FPGA作为一种高能效、可重构、高性价比的硬件加速器设计、验证和应用平台，受到国内外研究者的广泛关注。 FPGA通常是由可编程逻辑单元、布线资源和I/O资源组成的半定制可编程芯片，因其高度可定制的并行结构， FPGA极其适合处理条件单一且具有重复性的计算任务，因此十分适用于加速具有同样特点的卷积神经网络。然而，结构复杂的高精度检测网络通常难以达到最佳的计算加速效果，而结构更加单一的分类模型更适合FPGA计算，但却存在精度不足的问题。因此，设计一种能够有效平衡算法精度和计算速度之间的关系，从而实现神经网络算法和FPGA硬件间良好地协同运算的方法和加速计算结构，是该领域需要解决的重要问题。 [0004]针对图像分类领域细粒度目标分类需求，现有方法通常采用改变网络结构，提升特征提取维度的方式，拓宽模型的细粒度特征学习能力。这在算法层面虽然可以获得一定程度的理论精度提升，但复杂的网络结构和大规模的模型参数，难以在资源有限条件下的边缘端硬件设备中进行部署和应用。同时，受限于硬件开发难度大、周期长等问题，现有的神经网络加速器也很难以适应多样化、快速迭代的神经网络发展状态，对细粒度分类模型在边缘端的计算加速和高实时性应用造成了阻碍。因此，为解决现有方法中，复杂网络模型在边缘端硬件设备中难部署、难计算、难加速的现实问题，需要设计一种基于经典神经网络模型的细粒度图像分类方法，使其在边缘端硬件部署资源容量限制范围内，既能满足精细目标分类的任务需求，又可以于现有加速方法进行匹配，从而降低细粒度分类网络设计难度，减少边缘端计算资源消耗，增强模型实际应用效能。说　明　书 1/5 页 3 CN 114359634 A 3

专利 一种串级CNN细粒度目标分类方法

专利一种串级CNN细粒度目标分类方法