(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211004846.3
(22)申请日 2022.08.22
(71)申请人 天津大学
地址 300072 天津市南 开区卫津路9 2号
(72)发明人 王孟鑫 陈世展
(74)专利代理 机构 天津市北洋 有限责任专利代
理事务所 12 201
专利代理师 刘子文
(51)Int.Cl.
H04L 41/042(2022.01)
H04L 41/044(2022.01)
H04L 41/0823(2022.01)
H04L 41/14(2022.01)
H04L 41/16(2022.01)
H04L 9/40(2022.01)
(54)发明名称
基于分层共识和强化学习的区块链性能自
适应优化方法
(57)摘要
本发明公开一种基于分层共识和强化学习
的区块链 性能自适应优化方法, 基于由分层共识
模块和网络安全评估模块组成的强化学习决策
模块, 分层共识模块为基于网络分层模型的共识
算法模块, 包括信任评估子模块; 该优化方法具
体包括: (1)通过网络节点分层模块将共识流程
中的节点划分为主共识组和子共识组集群, 子共
识组集群中包括若干个子共识组; (2)通过信任
评估子模块内的信任模型评估共识过程中每个
节点的行为; 实现信任评估和 信任选举; (3)通过
网络安全评估模块计算出分组数量的安全性约
束及时延的安全性约束; (4)通过强化学习决策
模块实现区块链性能自适应优化。 本发明在保证
区块链网络安全的同时优化网络性能, 实现自适
应调节。
权利要求书4页 说明书11页 附图4页
CN 115378788 A
2022.11.22
CN 115378788 A
1.一种应用于区块链网络的强化学习决策模块, 其特征在于, 包括分层共识模块和网
络安全评估模块, 所述分层共识模块为基于网络分层模型 的共识算法模块, 包括信任评估
子模块, 所述分层共识模块用于将区块链网络中的节点划分为主共识组和子共识组集群,
子共识组集群中包括若干个子共识组; 分层共识模块内的共识 算法能够降低共识通信复杂
度, 更快达成全网共识;
信任评估子模块用于实现信任评估和信任选举; 信任评估子模块内引入了一个信任模
型来评估共识过程中每个节点的行为; 如果检测到节点恶意行为, 信任模型会降低该节点
的信任值, 反之则会提高其信任值; 在每一轮共识后, 所有节点更新节点信任值和节点状态
信息, 并根据信任值调整共识组, 以信任值高低作为选举标准选举相应节点成为领导节点
或主节点;
所述网络安全评估模块从分组数量和时延两个角度计算 区块链网络的安全性约束; 所
述网络安全评估模块通过获取区块链共识历史信息并计算共识历史的不一致性, 估算当前
区块链网络中恶意节点的比例, 以计算出分组数量的安全性约束; 通过限定有限个连续区
块间隔时间内完成一轮共识, 最终计算出时延的安全性约束;
所述强化学习决策模块内的强化学习神经网络使用两个智能体, 用于主共识 组的智能
体采用严格的分组约束作为激励函数的约束 条件, 而用于子共识组的智能体采用宽松的分
组约束; 强化学习决策模块将节点间数据传输速率、 节点性能、 共识历史组成的区块链网络
环境信息作为状态空间; 将区块大小、 出块时间、 共识组中节点数量组成的参数作为动作空
间; 在满足区块链网络安全性约束前提下, 通过计算区块链 性能参数, 实现区块链性能自适
应优化。
2.一种基于分层共识和强化学习的区块链性能自适应优化方法, 基于权利要求1所述
强化学习决策模块, 其特 征在于, 包括:
(1)通过网络节点分层模块将共识流程中的节点划分为主共识组和子共识组集群, 子
共识组集群中包括若干个子共识组; 网络节 点分层模块内使用的共识 算法是将PBFT算法中
所有节点互相广播的方式改为分层共识, 引入流水线化的Hotstuff算法, 在每个子共识组
内完成初步共识, 然后在 主共识组中完成最 终共识; 所述共识 算法由预准备、 准备、 提交、 确
定四个阶段组成;
(2)通过信任评估子模块内的信任模型评估共识过程中每个节点的行为; 如果检测到
节点恶意行为, 信任模型会降低该节点的信任值, 反之则会提高其信任值; 在每一轮共识
后, 所有节点更新节点信任值和节点状态信息, 并根据信任值调整共识组, 以信任值高低作
为选举标准选举相应节点成为领导节点或主节点;
(3)通过网络安全评估模块获取区块链共识历史信息, 并通过计算共识历史的不一致
值来估算当前区块链网络中恶意节点的比例, 以计算出分组数量的安全性约束; 通过限定
有限个连续区块间隔时间内完成一轮共识, 以计算出时延的安全性约束;
(4)所述强化学习决策模块用于实现区块链性能自适应优化, 强化学习神经网络使用
两个采用D 3QN网络的智能体, 用于主共识组的智能体采用严格的分组约束作为激励函数的
约束条件, 用于子共识组的智能体采用宽松的分组约束; 强化学习决策模块将节点间数据
传输速率、 节点性能、 共识历史组成的区块链网络环境信息作为状态空间; 将区块大小、 出
块时间、 共识组中节点数量组成的参数作为动作空间; 在满足区块链网络安全性约束前提权 利 要 求 书 1/4 页
2
CN 115378788 A
2下, 通过计算区块链性能参数, 实现区块链性能自适应优化。
3.根据权利要求2所述一种基于分层共识和强化学习的区块链性能自适应优化方法,
其特征在于, 步骤(1)具体如下:
(101)在共识算法开始阶段, 各共识组内由信 任值评估模块选举主节点, 客户端发送请
求给主节点;
(102)每轮共识开始时, 主节点收集到足额的副本节点发送的更改视图消息, 其包含了
发送节点上高度最高的预准备签名; 主节点向所有节点转发请求并发送预准备消息, 消息
中包含预准备签名; 该步是主共识组的预准备阶段;
(103)在每个子共识组内的副本节点收到预准备消息之后, 对预准备消息中签名的合
法性及视图合法性进行验证, 随后向领导节点发送确认消 息; 步骤(102)和(103)是子共识
组的预准备阶段;
(104)当子共识组内的领导节点收集到足额的签名时进入本步骤, 领导节点收到预准
备消息时, 通过聚合若干数量的签名得到预准备签名; 然后领导节点向组内副本节点发送
准备消息, 准备消息附带聚合得到的预准备签名;
(105)每个共识组内的副本节点向领导节点收到准备消息, 验证后发送准备投票消息;
步骤(104和(10 5))是子共识组的准备阶段;
(106)当子共识组内领导节点收集足额签名时进入本步骤, 然后聚合出这一阶段的准
备签名, 然后第一个领导节点向其 他领导节点发送提交消息, 提交消息中包 含准备签名;
(107)其他领导节点收到提交消息, 验证后发送提交投票消息给主节点; 步骤(106)和
(107)是主共识组的提交阶段;
(108)第一个共识组的主节点收集到足额的提交消息时, 聚合得到提交签名, 并且附带
在确定消息中发送给其 他所有节点;
(109)当其他节点收到确定消息时, 其中提交签名指向的交易就会被执行, 之后增加视
图号; 最后发送回复消息给客户端, 完成本轮共识, 并开启下一轮共识。
4.根据权利要求2所述一种基于分层共识和强化学习的区块链性能自适应优化方法,
其特征在于, 步骤(2)中, 信任模 型内节点信任值设为[0,1], 数值越大, 可信度越高; 信任模
型将信任值划分为不同区间, 每个区间表示一种节点状态; 并且设置基于信任值的节点状
态转化方式。
5.根据权利要求3所述一种基于分层共识和强化学习的区块链性能自适应优化方法,
其特征在于, 节点状态转化方式如下: 区块链网络刚运行时, 节点状态为正常; 当节点若干
次的生成有效的块, 并且信任值大于阈值α 时, 升级到可信状态; 如果节点出现异常行为, 节
点状态变为受限状态; 如果节点信任值低于阈值β, 节点将变为恶意状态; 不论节点处于什
么状态, 如果在 共识过程中 向不同节 点发送不一致投票消息, 则直接降级为恶意节点; 节 点
生成有效块后或者在 共识过程中与大多 数节点投票信息一致, 信任值会不断提高; 最后, 在
每一轮共识后, 所有节点更新节点信任值和状态信息 。
6.根据权利要求2所述一种基于分层共识和强化学习的区块链性能自适应优化方法,
其特征在于, 步骤(3)中共识历史的不一致值是使用规范化的熵 值计算的, 不一致值是共识
状态的不同概率的不确定性的度量; 首先在子共识组集群内的每个子共识组和主共识组中
计算不一致值; 然后, 通过平均所有共识组的归范化熵值 来计算区块链网络安全性。权 利 要 求 书 2/4 页
3
CN 115378788 A
3
专利 基于分层共识和强化学习的区块链性能自适应优化方法
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:06:08上传分享