安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211293400.7 (22)申请日 2022.10.21 (71)申请人 江苏大学 地址 212013 江苏省镇江市京口区学府路 301号 (72)发明人 刘星桥 周康 赵德安 刘一颖  (74)专利代理 机构 南京智造力知识产权代理有 限公司 32382 专利代理师 王军丽 (51)Int.Cl. G01D 21/02(2006.01) G06K 9/62(2022.01) G06N 5/00(2006.01) G06N 20/00(2019.01) (54)发明名称 一种基于无人船和集成学习的智能广域水 质监测分析系统、 方法及水质分析方法 (57)摘要 本发明公开了一种基于无人船和集成学习 的智能广域水质监测分析系统、 方法及水质分析 方法。 以单片机为主控制单元对无人船进行设 计, 无人船上搭载导航、 通信模块及水质监测系 统。 上位机界面加载百度地图, 点击鼠标可对地 图对应水域 设置若干监测点, 通过上位机中的路 径规划和自动航行槽函数, 无人船按照规划路线 到达指定的监测点作业, 测得的水质等数据经由 GPRS模块与上位机进行交互, 上位机通过SQL等 技术建立与数据库之间的联系, 进而保存用户信 息及下位机数据。 基于集 成学习的水质分析算法 建立起水质分析模型。 本发明具有低成本、 水质 监测范围广且实时性高、 水质分析优越、 低功耗 等优点, 可以广泛应用于农业水产养殖以及城市 污水监测等场景。 权利要求书4页 说明书8页 附图5页 CN 115435845 A 2022.12.06 CN 115435845 A 1.一种水质分析 方法, 其特 征在于, 采用随机森林算法实现, 包括如下步骤: 步骤1: 提取三个特征, 即PH、 温度和溶解氧值, 获得原始数据集; 然后, 将这些值与从历 史数据集中获得的水质评价结果相结合, 历史数据由人工采集的不同深度的水质参数和平 均法得到的水质评价 值组成; 步骤2: 通过对三个特征参数的异常值和水质评价值进行检索处理, 对步骤1得到的数 据进行清洗; 具体方式为对水质参数及水质评价值分别进行遍历, 通过预先设置的范围, 对 有错误的值进行删除, 例如温度或水质评价 值等数据明显超过正常范围的; 步骤3: 通过自举采样有放回的抽 取(bootstrap), 为每个决策树生成子训练集和测试 样本, 叶子节 点分裂时, 从M个特征中随机选取m个特征, 满足m<M, 采用基尼算法从m个特征 中选取基尼指数最小的特征作为切分点进行裂, 不进行剪枝操作使其最大限度的生长, 形 成单棵决策树, 计算过程如下: 式中, pi为类别Ci在样本集 N中出现的概 率; 步骤4: 步骤2和3 重复T次, 构造T个决策树, 生成随机森林; 步骤5: 汇总各决策树对测试样本的分类结果, 得票 最多的类为 最终结果: 式中, hk(x)为单棵决策树分类结果; argmax为求函数最大值自变量点集; T为 决策树的 数目; Y为目标分类; I()为 示性函数。 采用泛化误差衡量模型迁移能力, 使用训练数据训练出来的模型oob(out  of bag)数 据或者测试数据上的表现可以用泛化误差来体现, 泛化误差低, 模型迁移能力好, 反之则不 好, 定义余量函数, 泛化 误差如下: mg(X, Y)=avkI(hk(x)=Y)‑maxj≠kavkI(hk(x)=j)    (3) 式中, j为误分向量; PX, Y为X, Y空间下的泛化误差; avk()为取平均, 根据余量函数和泛 化误差定义、 强大 数定律及决策树的结构可推导随机森林泛化 误差总收敛于: 同理, Pβ为β 空间下的泛 化误差, 式5也表明了随机森林并不会因为决策树数量的增加而 产生过拟合的不良效果, 再定义随机森林的余 量函数为: 余量函数反映了模型正确分类的得票数超过误分类的最大得票数的程度, 该值越大, 则模型置信度越高, Eβ为β 空间下的期望; 根据切比雪夫不 等式, 可得: 式中, EX, Ymr(X, Y)为训练的模型对分类 结果的期望, 再定义决策树的分类强度以及相关权 利 要 求 书 1/4 页 2 CN 115435845 A 2性, 分别用s, 表示: s=EX, Ymr(X, Y)>=0             (8) 式中, d( β )、 d( β ‘)均为方差; 独立同分布的随机变量遵循Eβf( β )2=Eβ, β‘f( β )f( β‘), 再结合s, 可得到: 综上, 可得随机森林的泛化 误差收敛, 其界限为: 决策树分类强度 s及决策树之间的相关程度 决定随机森林的泛化误差范围, 增大s或 减小 是提高训练模型分类精度的关键 。 上述oob数据为抽取样本过程中未被抽中的样本, 即为带外数据, 大约为37%, 是由随 机森林自身特性所决定的: 该部分oob数据未参与模型的训练, 可用于验证随机森林的泛化能力, 具体: 统计每棵 决策树对袋外数据的误分率, 取其平均值作为模型泛化误差的估计, 称为包外估计, 包外估 计为随机森林泛化 误差的一个无偏估计, 结果近似于大量交叉验证的结果。 2.一种基于无人船和集成学习的智能广域水质监测分析系统, 其特征在于, 包括低成 本无人船系统、 水质监测系统、 水质分析算法三部分; 第一部分, 所述低成本无人船系统包括双体船, MCU, 动力系统, 导航模块, 通信 模块, 电 源模块; 所述双体船的浮体为可充气 气囊; 所述MCU作为下位机, 通过通信模块与上位机通讯; 所述动力系统包括船体两侧的直 流电机和无刷电调; 所述直流电机驱动螺 旋桨用于双体无 人船的航行; 所述无刷电调通过PWM方式对电机调速; 所述导航模块包括北斗 定位模块及航向角模块; 所述北斗 定位模块用于记录无 人船的经纬度数据; 所述航向角模块用于记录无 人船航向角数据; 所述通信模块用于下位机程序及上位机后台服 务器程序间通信; 所述电源 模块为可充电锂电池, 为 其他部件供电; 第二部分, 所述水质监测系统放置在无人船装置盒中, 包括水质测量模块和提升装置; 所述水质测量模块包括溶解氧、 温度、 PH传感器; 所述提升装置为步进电机, 用于下放水质 测量模块到不同的深度; 第三部分, 所述水质分析算法是基于集成学习的随机森林算法, 具体采用如权利要求1 所述的水质分析 方法。权 利 要 求 书 2/4 页 3 CN 115435845 A 3

.PDF文档 专利 一种基于无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法 第 1 页 专利 一种基于无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法 第 2 页 专利 一种基于无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。