安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211278592.4 (22)申请日 2022.10.19 (71)申请人 中国空间技 术研究院 地址 100094 北京市海淀区友谊路104 号 (72)发明人 王亚坤 韩笑冬 徐楠 王超  邢川 王睿 武长青  (74)专利代理 机构 北京志霖恒远知识产权代理 有限公司 1 1435 专利代理师 郭栋梁 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种基于聚类的卫星遥测数据序列异常检 测方法 (57)摘要 本发明公开了一种基于聚类的卫星遥测数 据序列异常检测方法, 涉及卫星遥测数据分析、 人工智能领域。 本发明中, 首先, 选择没有异常的 历史遥测数据作为训练样本, 然后, 将遥测数据 进行分段处理, 每一段遥测数据是一个样本。 利 用基于距离的聚类方法对分段数据样本进行聚 类。 在此基础上, 利用训练数据的训练误差, 拟合 一元高斯分布。 最后, 计算被检测遥测数据的到 其最近类的距离, 利用拟合的高斯分布判断其是 否为异常数据。 本发明中, 通过对卫星时间序列 遥测数据进行基于距离的聚类分析, 自动学习正 常遥测数据中常见的卫星操作模式。 通过对异常 操作模式进行检测, 发现卫星遥测数据中存在的 序列异常。 本方法用于在轨卫星序列异常的实时 检测。 权利要求书1页 说明书3页 附图1页 CN 115496164 A 2022.12.20 CN 115496164 A 1.一种基于聚类的卫星遥测数据 序列异常检测方法, 其特 征在于, 包括以下步骤: S1: 将正常的卫星遥测数据制成包 含M个遥测变量的数据表, 数据按时间序列排列; S2: 对数据进行 预处理, 包括野值剔除和缺失值补全; S3: 将M维遥测数据生成N(N=M ‑T)个重叠 的数据序列, T为每个数据序列的长度, 即每 个数据序列包含T个时刻的遥测数据, 形成N ×T×M的训练数据{x1,x2…,xN}; S4: 利用基于欧几里 得距离的聚类方法, 对数据进行聚类学习, 输出 K个类; S5: 利用训练数据的训练误差, 拟合一元高斯分布N( μ ′, σ′), 基于聚类预测和高斯分布 判断任意序列遥测数据xt是否为异常。 2.根据权利要求1所述的一种基于聚类的卫星遥测数据序列异常检测方法, 其特征在 于, 所述基于欧几里 得距离的聚类方法包括: 随机初始化K个 类中心向量γ={γ1,γ2…,γk}; 对每个训练数据, i=1, …,N, 基于欧几里得距 离计算其距 离每个聚类中心的距 离di=| |xi‑γk||2, 选择其距离最短的聚类中心c(i)作为 其所属类c(i)=mi nk||xi‑γk||2; 重新计算每 个类中心向量γ ′, 等于所有属于该类样本的均值 重复上述计算, 直到类中心向量 不再更新。 3.根据权利要求1所述的一种基于聚类的卫星遥测数据序列异常检测方法, 其特征在 于, 所述一元高斯分布包括: 当完成聚类学习后, 计算对每个训练数据xi到其所属聚类中心的距离, 即训练误差di= ||xi‑γk||2, 利用训练误差基于最大似然估计法来估计一元高斯分布N( μ ′, σ′); 对于任意序列遥测数据xt, 基于欧几里得距离计算其距离每个聚类中心的距离dt=|| xt‑γk||2, 选择其距离最短的聚类中心c (t) 作为其所属类 , 其异常得分为 当a(xt)>2时, 判定序列遥测数据xt为异常数据, 当a(xt)≤2时, 判定 序列遥测数据xt为正常。权 利 要 求 书 1/1 页 2 CN 115496164 A 2一种基于聚类的卫星遥测数据序列异常检测方 法 技术领域 [0001]本发明涉及卫星遥测数据分析、 人工智能技术领域, 尤其涉及一种基于聚类 的卫 星遥测数据 序列异常检测方法。 背景技术 [0002]卫星系统或其每个子系统具有多种不同的工作 模式, 并且会随着时间从一种模式 变为另一种模式, 如光照季模式和地影季模式的相互切换。 然而, 当异常发生时, 卫星系统 将在未知的故障模式下工作。 异常从数据模式上可划分为点异常和序列异常。 相对于单个 数据点的异常, 序列异常通常是指某个数据序列出现异常, 而单取出其中任何一个点无法 判定异常。 卫星遥测数据中存在典型 的序列异常。 本发明利用基于欧几里得距离的聚类对 卫星时间序列遥测数据进行序列异常检测, 该方法是一种 无监督学习方法。 该方法可对按 时间窗口划分好的正常序列数据进行聚类学习, 然后对新的数据通过距离计算实现序列异 常检测。 发明内容 [0003]本发明的目的在于: 为了解决上述问题, 而提出的一种基于聚类的卫星遥测数据 序列异常检测方法, 该 方法可有效检测卫星遥测数据中的序列异常。 [0004]为了实现上述目的, 本发明采用了如下技 术方案: [0005]一种基于聚类的卫星遥测数据 序列异常检测方法, 包括以下步骤: [0006]S1: 将正常的卫星遥测数据制成包含M个遥测变量的数据表, 数据按时间序列排排 列; [0007]S2: 对数据进行 预处理, 包括野值剔除和缺失值补全; [0008]S3: 将M维遥测数据生成N(N=M ‑T)个重叠的数据序列, T为每个数据序列的长度, 即每个数据序列包含T个时刻的遥测数据, 形成 Ⅳ×T×M的训练数据{x1, x2…, xN}; [0009]S4: 利用基于欧几里 得距离的聚类方法, 对数据进行聚类学习, 输出 K个类; [0010]S5: 利用训练数据的训练误差, 拟合一元高斯分布N( μ ′, σ′), 基于聚类预测和高斯 分布判断任意序列遥测数据xt是否为异常。 [0011]优选地, 所述基于欧几里 得距离的聚类方法包括: [0012]随机初始化K个 类中心向量γ={γ1, γ2…, γk}; [0013]对每个训练数据, i=1, …, N, 基于欧几里得距离计算其距离每个聚类中心的距离 di=||xi‑γk||2, 选择其距离最短的聚类中心c(i)作为 其所属类c(i)=mi nk||xi‑γk||2; [0014]重新计算每 个类中心向量γ ′, 等于所有属于该类样本的均值 [0015]重复上述计算, 直到类中心向量 不再更新。 [0016]优选地, 所述 一元高斯分布包括: [0017]当完成聚类学习后, 计算对每个训练数据xi到其所属聚类中心 的距离, 即训练误说 明 书 1/3 页 3 CN 115496164 A 3

.PDF文档 专利 一种基于聚类的卫星遥测数据序列异常检测方法

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于聚类的卫星遥测数据序列异常检测方法 第 1 页 专利 一种基于聚类的卫星遥测数据序列异常检测方法 第 2 页 专利 一种基于聚类的卫星遥测数据序列异常检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。