安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211154185.2 (22)申请日 2022.09.21 (71)申请人 南华大学 地址 421001 湖南省衡阳市蒸湘区常胜西 路28号 (72)发明人 李跃 阙识澄 万亚平 刘杰  (74)专利代理 机构 衡阳雁城专利代理事务所 (普通合伙) 43231 专利代理师 陈纪文 (51)Int.Cl. H04N 19/134(2014.01) H04N 19/597(2014.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 9/00(2006.01)G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 基于轻量级神经网络的动态3D点云编码模 式快速确定方法及系统 (57)摘要 基于轻量级神经网络的动态3D点云编码模 式快速确定方法及系统, 涉及视频编码技术领 域。 本发明是按照HEVC的原始编码方案进行 merge/skip模式的预测编码过程, 通过提取当前 编码CU的特征信息并处理得到T1网络的输入特 征x1, 将x1输入T1网络得到判断结果, 若T1网络 判断merge/skip模式为最佳模式则跳过后续模 式的决策过程直接进入划分阶段, 否则继续执行 inter 2N×2N模式的预测编码过程; 提取当前编 码CU的特征信息并处理得到T2网络的输入特征 x2, 将x2输入T2网络得到判断结果, 若T2网络判 断merge/skip模式或inter  2N×2N模式为最佳 编码模式则跳过后续模式决策的过程直接进入 划分阶段, 否则继续后续模式的决策过程。 与现 有方法相比, 本发明可大幅缩短动态3D点 云的帧 间编码时间。 权利要求书3页 说明书8页 附图3页 CN 115550653 A 2022.12.30 CN 115550653 A 1.基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于, 包括以下 步骤: 步骤1, 数据收集: 对数据进行提取, 样本将用于T1、 T2网络的训练, 所提取的特征包括: 最大二划分预测失真方差、 最大四划分预测失真方差、 编码块标志、 编 码块深度、 量化参数、 实时编码顺序、 编码单 元类型、 前层模式和merge/sk ip模式编码标志; 步骤2, 数据处理: 首先, 对所提特征中的最大二划分预测失真方差、 最大四划分预测失 真方差进行区分几何图和纹理图编码的归一化; 然后, 将上述两个特征做上下限溢出截断 并赋值为边界值的处理以将其限制在[ 0,1]范围内; 接着, 根据样本的最大二划分预测失真 方差和最大四划分预测失真方差进行 数据清洗; 最后, 对量 化参数做最大最小值归一 化; 步骤3, 参数训练: 对于训练集 中T1网络的CU样本, 作 为轻量级神经网络T1的输入, 使用 一个全连接层作为分类器根据样 本输入判断merge/ skip模式是否为最佳模式; 对于训练集 中T2网络的CU样本, 作为轻量级神经网络T2的输入, 使用一个全连接层作为分类器根据样 本输入判断merge/skip模式或inter  2N×2N模式是否为最佳模式; 最终根据分类结果进行 快速的模式决策; 步骤4, 模型部署: 在merge/skip模式决策结束后, 若T1网络判断merge/skip模式是当 前编码CU的最佳模式, 则跳过后续所有模式决策过程, 直接进入划分阶段, 否则继续后续模 式决策过程; 在inter2N ×2N模式决策结束后, 若T2网络判断merge/skip模式或inter  2N× 2N模式中有当前编 码CU的最佳模式, 则跳过后续所有模式决策过程, 直接进入划分阶段, 否 则继续后续模式决策 过程。 2.根据权利要求1所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 在步骤1中, 计算最大二划分预测失真方差或最大四划分预测失真方差时, 以 水平、 垂直的二划分或四划分方法进行划分, 最终对于子块中预测失真变换方差最大 的值 作为此特征进行提取。 3.根据权利要求1所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 在步骤1 中, 对T1、 T2网络特征应分别进行提取, T1网络所提取的特征为最大二 划分预测失真方差、 最大四划分预测失真方差、 编 码块标志、 编码块深度、 量化参数、 实时编 码顺序、 编码单 元类型、 前层模式, 对于特 征merge/sk ip模式编码标志仅在T2网络中使用。 4.根据权利要求2所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 所述预测失真变换 的计算是根据预测失真变换矩阵得来的, 预测失真变换矩 阵的定义如下: 其中 是编码模式对宽为w, 高为h的当前编码CU进行编码模式预测的像素值矩阵, 为当前编码CU的原始像素值矩阵, 是根据预测失真得到的宽为 w高为h的预测失 真变换矩阵, 为变换系数, 其中α 根据当前编码图像的类别不同有不同的取值: 权 利 要 求 书 1/3 页 2 CN 115550653 A 2根据矩阵 按照水平、 垂直的二划 分或四划分方法的划 分方式计算出不 同子块的 预测失真变换的方差大小, 其中二划分下的四个子块中方差值最大的就为最大二划分预测 失真方差BDV, 最大四划分预测失真方差QDV的计算同理, 定义如下: BDV=max{Varih,B,Variv,B},i∈{1,2} QDV=max{Varih,Q,Variv,Q},i∈{1,2,3,4}。 5.根据权利要求2所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 在步骤2中, 对最大二划分预测失真方差、 最大四划分预测失真方差的归一化 方法, 定义如下: 其中BDV和QDV分别表示最大二划分预测失真方差和最大四划分预测失真方差, Vari表 示以水平、 垂直的二划分或四划分方法的划分子块中预测失真变换方差最大 的值, 归一化 系数β 根据所编码的几何与纹 理图的不同有不同的固定取值。 6.根据权利要求1所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 在步骤2中, 数据 清洗的方式是: 对于T1网络的样本中, 若满足BDV或QDV<0.2且 最终编码模式为非merge/skip模式的则删除, 若满足BDV或QDV>0.8且最终编码模式为 merge/skip模 式的则删除; 对于T2网络的样本中, 若满足BDV或QDV<0.1且最终编码模 式为 merge/skip模式和inter  2N×2N模式以外的则删除, 若满足BDV或QDV>0.9且最终编码 模式 为merge/sk ip模式或i nter 2N×2N模式的则 删除。 7.根据权利要求1所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 在步骤2中, 对量 化参数QP的最大最小值归一 化的定义如下: 8.根据权利要求1所述的基于轻量级神经网络的动态3D点云编码模式快速确定方法, 其特征在于: 对于部署 到编解码 器中的算法流程, T1和T2网络有 各自的使用条件, T1网络的 使用条件是当前编码CU不属 于占位图图像且不为I 帧, T2网络的使用条件是当前编码CU不 属于占位图 图像、 不为I帧且T1网络没有做快速模式决策。 9.一种基于轻量级神经网络的动态3D点云编码模式快速确定系统, 其特 征在于, 包括: 数据收集模块: 用于对数据进行提取, 样本将用于T1、 T2网络的训练, 所提取的特征包 括: 最大二划分预测失真方差、 最大四划分预测失真方差、 编 码块标志、 编码块深度、 量化参 数、 实时编码顺序、 编码单 元类型、 前层模式和merge/sk ip模式编码标志; 数据处理模块: 用于对所提特征中的最大二划分预测失真方差、 最大四划分预测失真 方差进行区分几何图和纹理图编码的归一化; 然后, 将上述两个特征做上下限溢出截断并权 利 要 求 书 2/3 页 3 CN 115550653 A 3

PDF文档 专利 基于轻量级神经网络的动态3D点云编码模式快速确定方法及系统

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于轻量级神经网络的动态3D点云编码模式快速确定方法及系统 第 1 页 专利 基于轻量级神经网络的动态3D点云编码模式快速确定方法及系统 第 2 页 专利 基于轻量级神经网络的动态3D点云编码模式快速确定方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。