专利 基于深度强化学习的多区域综合能源系统能量管理方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211025701.1 (22)申请日 2022.08.25 (71)申请人浙江英集动力科技有限公司地址 311100 浙江省杭州市余杭区仓前街道龙园路8 8号2幢208、 209-1、 209-2室 (72)发明人谢金芳　金鹤峰　穆佩红　赵琼　 (74)专利代理机构郑州博派知识产权代理事务所(特殊普通合伙) 41137 专利代理师荣永辉 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/04(2012.01) G06Q 50/06(2012.01) H04L 41/14(2022.01) (54)发明名称基于深度强化学习的多区域综合能源系统能量管理方法 (57)摘要本发明公开了一种基于深度强化学习的多区域综合能源系统能量管理方法，包括：构建多区域综合能源系统能量管理边缘计算架构；通过网络物理层中各子区域综合能源系统设置的传感器采集综合能源系统各类数据信息，并通过无线通信设备上传至边缘层中的边缘节点；将训练完成的深度强化学习模型部署在各个边缘节点上，根据网络物理层上传的信息生成能量管理策略，并反馈给网络物理层进行系统中冷热电源各自的出力控制和储能设备的能量输入、输出量控制；在边缘层和云层之间建立迭代学习机制，当实际和预期的能量管理性能存在出入时，云服务器根据各个边缘节点上报的数据和历史学习经验重新训练深度强化学习模型，并下发至各个边缘节点。权利要求书4页说明书10页附图2页 CN 115392373 A 2022.11.25 CN 115392373 A 1.一种基于深度强化学习的多区域综合能源系统能量管理方法，其特征在于，它包括：构建包括网络物理层、边缘层和云层的多区域综合能源系统能量管理边缘计算架构；通过网络物理层中各子区域综合能源系统设置的不同类型传感器采集综合能源系统运行数据、运行状态和环境信息，并通过无线通信设备上传至边缘层中就近设置的边缘节点等待处理；将训练完成的深度强化学习模型部署在各个边缘节点上，根据网络物理层上传的信息生成能量管理策略，并反馈给网络物理层进行系统中冷热电源各自的出力控制和储能设备的能量输入、输出量控制；其中，在边缘层和云层之间建立迭代学习机制，当深度强化学习模型实际的能量管理性能和预期的能量管理性能之间存在超出预设的出入时，边缘节点会通知相应的云服务器重新启动深度强化学习模型的训练过程；云服务器根据各个边缘节点上报的数据和历史学习经验重新训练深度强化学习模型，并下发至各个边缘节点。 2.根据权利要求1所述的多区域综合能源系统能量管理方法，其特征在于，所述多区域综合能源系统包括相关的多个区域，每个区域内包括各类能量存储和转化元件、能量传输网络和各类负荷构成，并与电网和燃气网进行电力和天然气交互；区域之间通过联络线或联络管道相连，实现电能、天然气的交互；各个区域的能量管理系统之间通过通讯网络相连，用于交换边界信息，实现各区域间能量协同管理；所述能量存储和转化元件包括分布式电源、冷热电三联供、电锅炉、燃气锅炉、冷机和储能装置；所述各类负荷包括电负荷、热负荷和冷负荷；其中，所述分布式电源包括光伏发电和风机发电，用于供给系统电负荷，同时一部分电能输送至冷机或电锅炉，多余的电能存储至电储能设备；所述冷热电三联供包括溴化锂制冷机和燃气内燃机；所述储能装置包括电、热、冷储能装置；冷负荷由溴化锂制冷机供给，或由冷机制冷补充；热负荷由燃气内燃机供给，燃气锅炉和电锅炉产热作为补充；能量传输网络是按照能量传输介质分为电力总线、热力总线和冷却总线，并设定相同传输介质的能量会由能量源流向总线，流向负荷的能量会从总线流出，且系统能量管理需要满足电力总线能量平衡、热力总线能量平衡和冷却总线能量平衡。 3.根据权利要求1所述的多区域综合能源系统能量管理方法，其特征在于，所述构建包括网络物理层、边缘层和云层的多区域综合能源系统能量管理边缘计算架构，包括：多区域综合能源系统能量管理边缘计算架构从下向上依次构建网络物理层、边缘层和云层；所述网络物理层包括多种类型的传感器、执行器和无线通信设备，传感器用于采集多区域综合能源系统现场的实际数据和反馈能量管理性能，至少包括系统各类能量存储和转化元件的温度数据、压力数据、流量数据、燃料燃烧数据、储能装置释能和储能运行状态、各设备能量分配、转换或储存状态和室外环境信息的采集；执行器用于执行边缘层反馈的能量管理策略；无线通信设备包括WIFI、 WLAN、 4G、 5G和蓝牙，用于网络物理层和边缘层之间数据双向通信；所述边缘层包括依据多区域综合能源系统的位置就近设置多个边缘节点，边缘节点中设有基站、无线访问热点、轻量级边缘服务器，通过无线通信技术向网络物理层的设备下发能量管理策略，同时通过互联网上传历史数据至云层；权　利　要　求　书 1/4 页 2 CN 115392373 A 2所述云层由多个重量级云服务器资源组成，用于大数据存储、处理、离线分析、强化学习模型构建和能量管理优化决策；以及用于调配计算资源和分配计算任务，缓解局部边缘节点的计算压力。 4.根据权利要求1所述的多区域综合能源系统能量管理方法，其特征在于，在所述深度强化学习模型训练之前，还包括：构建多区域综合能源系统能量管理优化模型；多区域综合能源系统能量管理优化模型的目标是协调区域系统中各设备元件出力，获得最小化系统运行成本；所述系统运行成本包括与主网能量交互成本、消耗的天然气成本、设备启停成本和碳排放交易成本，表示为： minCi＝Cd,i+Cq,i+Cg,i+Co,i；其中， Ci为区域i系统运行成本； Cd,i为该区域与主网能量交互成本； Cq,i为该区域消耗的天然气成本； Cg,i为该区域设备启停成本； Co,i为该区域碳排放交易成本； Pd(t)为t时刻综合能源系统与主网的电力交换功率，为正时表示向主网购电，为负时表示系统向主网售电； εd(t)为t时刻的电价； T为对该区域综合能源系统进行能量管理所考虑的总时间； vGT(t)、 vGB(t)分别为t时刻的燃气内燃机、燃气锅炉消耗的天然气量； εq(t)为t时刻的天然气单价； U(t)为t时刻的燃气内燃机的启停状态变量； UMT为t时刻燃气内燃机启停一次的成本； Qc为储能装置的投资成本； Nc为标称循环寿命； nc为储能装置在调度期间内的循环次数； cc为碳排放配额时碳排放权交易价格； An为第n台设备碳排放强度； λn为第n台碳排放设备单位碳排放配额； Pn,o(t)为第n台碳排放设备在t时刻的出力； N为碳排放设备的个数；多区域综合能源系统能量管理的约束条件至少包括：热量平衡约束：为区域i中燃气内燃机在t时段内产生的多余热量；为区域i中燃气锅炉在t时段内天然气燃烧后产生的热量；为区域i中电锅炉在t时段内产生的热量；为区域i中溴化锂制冷机在t时段内所需要的的热量；为区域i中用户在t时段内的热负荷；为区域i中系统t时段内的热量传输损耗；为区域i在t时段内与热网交换的热功率；电量平衡约束：为区域i系统在t时段内从公网购买的电量；为区域i中燃气内燃机在时段t内的发电量；为区域i中分布式电源在t时段内产生的电量；为区域i中用户在t 时段内的电负荷；为区域i中冷机在t 时权　利　要　求　书 2/4 页 3 CN 115392373 A 3

专利 基于深度强化学习的多区域综合能源系统能量管理方法

专利基于深度强化学习的多区域综合能源系统能量管理方法