(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211278592.4
(22)申请日 2022.10.19
(71)申请人 中国空间技 术研究院
地址 100094 北京市海淀区友谊路104 号
(72)发明人 王亚坤 韩笑冬 徐楠 王超
邢川 王睿 武长青
(74)专利代理 机构 北京志霖恒远知识产权代理
有限公司 1 1435
专利代理师 郭栋梁
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于聚类的卫星遥测数据序列异常检
测方法
(57)摘要
本发明公开了一种基于聚类的卫星遥测数
据序列异常检测方法, 涉及卫星遥测数据分析、
人工智能领域。 本发明中, 首先, 选择没有异常的
历史遥测数据作为训练样本, 然后, 将遥测数据
进行分段处理, 每一段遥测数据是一个样本。 利
用基于距离的聚类方法对分段数据样本进行聚
类。 在此基础上, 利用训练数据的训练误差, 拟合
一元高斯分布。 最后, 计算被检测遥测数据的到
其最近类的距离, 利用拟合的高斯分布判断其是
否为异常数据。 本发明中, 通过对卫星时间序列
遥测数据进行基于距离的聚类分析, 自动学习正
常遥测数据中常见的卫星操作模式。 通过对异常
操作模式进行检测, 发现卫星遥测数据中存在的
序列异常。 本方法用于在轨卫星序列异常的实时
检测。
权利要求书1页 说明书3页 附图1页
CN 115496164 A
2022.12.20
CN 115496164 A
1.一种基于聚类的卫星遥测数据 序列异常检测方法, 其特 征在于, 包括以下步骤:
S1: 将正常的卫星遥测数据制成包 含M个遥测变量的数据表, 数据按时间序列排列;
S2: 对数据进行 预处理, 包括野值剔除和缺失值补全;
S3: 将M维遥测数据生成N(N=M ‑T)个重叠 的数据序列, T为每个数据序列的长度, 即每
个数据序列包含T个时刻的遥测数据, 形成N ×T×M的训练数据{x1,x2…,xN};
S4: 利用基于欧几里 得距离的聚类方法, 对数据进行聚类学习, 输出 K个类;
S5: 利用训练数据的训练误差, 拟合一元高斯分布N( μ ′, σ′), 基于聚类预测和高斯分布
判断任意序列遥测数据xt是否为异常。
2.根据权利要求1所述的一种基于聚类的卫星遥测数据序列异常检测方法, 其特征在
于, 所述基于欧几里 得距离的聚类方法包括:
随机初始化K个 类中心向量γ={γ1,γ2…,γk};
对每个训练数据, i=1, …,N, 基于欧几里得距 离计算其距 离每个聚类中心的距 离di=|
|xi‑γk||2, 选择其距离最短的聚类中心c(i)作为 其所属类c(i)=mi nk||xi‑γk||2;
重新计算每 个类中心向量γ ′, 等于所有属于该类样本的均值
重复上述计算, 直到类中心向量 不再更新。
3.根据权利要求1所述的一种基于聚类的卫星遥测数据序列异常检测方法, 其特征在
于, 所述一元高斯分布包括:
当完成聚类学习后, 计算对每个训练数据xi到其所属聚类中心的距离, 即训练误差di=
||xi‑γk||2, 利用训练误差基于最大似然估计法来估计一元高斯分布N( μ ′, σ′);
对于任意序列遥测数据xt, 基于欧几里得距离计算其距离每个聚类中心的距离dt=||
xt‑γk||2, 选择其距离最短的聚类中心c (t) 作为其所属类 , 其异常得分为
当a(xt)>2时, 判定序列遥测数据xt为异常数据, 当a(xt)≤2时, 判定
序列遥测数据xt为正常。权 利 要 求 书 1/1 页
2
CN 115496164 A
2一种基于聚类的卫星遥测数据序列异常检测方 法
技术领域
[0001]本发明涉及卫星遥测数据分析、 人工智能技术领域, 尤其涉及一种基于聚类 的卫
星遥测数据 序列异常检测方法。
背景技术
[0002]卫星系统或其每个子系统具有多种不同的工作 模式, 并且会随着时间从一种模式
变为另一种模式, 如光照季模式和地影季模式的相互切换。 然而, 当异常发生时, 卫星系统
将在未知的故障模式下工作。 异常从数据模式上可划分为点异常和序列异常。 相对于单个
数据点的异常, 序列异常通常是指某个数据序列出现异常, 而单取出其中任何一个点无法
判定异常。 卫星遥测数据中存在典型 的序列异常。 本发明利用基于欧几里得距离的聚类对
卫星时间序列遥测数据进行序列异常检测, 该方法是一种 无监督学习方法。 该方法可对按
时间窗口划分好的正常序列数据进行聚类学习, 然后对新的数据通过距离计算实现序列异
常检测。
发明内容
[0003]本发明的目的在于: 为了解决上述问题, 而提出的一种基于聚类的卫星遥测数据
序列异常检测方法, 该 方法可有效检测卫星遥测数据中的序列异常。
[0004]为了实现上述目的, 本发明采用了如下技 术方案:
[0005]一种基于聚类的卫星遥测数据 序列异常检测方法, 包括以下步骤:
[0006]S1: 将正常的卫星遥测数据制成包含M个遥测变量的数据表, 数据按时间序列排排
列;
[0007]S2: 对数据进行 预处理, 包括野值剔除和缺失值补全;
[0008]S3: 将M维遥测数据生成N(N=M ‑T)个重叠的数据序列, T为每个数据序列的长度,
即每个数据序列包含T个时刻的遥测数据, 形成 Ⅳ×T×M的训练数据{x1, x2…, xN};
[0009]S4: 利用基于欧几里 得距离的聚类方法, 对数据进行聚类学习, 输出 K个类;
[0010]S5: 利用训练数据的训练误差, 拟合一元高斯分布N( μ ′, σ′), 基于聚类预测和高斯
分布判断任意序列遥测数据xt是否为异常。
[0011]优选地, 所述基于欧几里 得距离的聚类方法包括:
[0012]随机初始化K个 类中心向量γ={γ1, γ2…, γk};
[0013]对每个训练数据, i=1, …, N, 基于欧几里得距离计算其距离每个聚类中心的距离
di=||xi‑γk||2, 选择其距离最短的聚类中心c(i)作为 其所属类c(i)=mi nk||xi‑γk||2;
[0014]重新计算每 个类中心向量γ ′, 等于所有属于该类样本的均值
[0015]重复上述计算, 直到类中心向量 不再更新。
[0016]优选地, 所述 一元高斯分布包括:
[0017]当完成聚类学习后, 计算对每个训练数据xi到其所属聚类中心 的距离, 即训练误说 明 书 1/3 页
3
CN 115496164 A
3
专利 一种基于聚类的卫星遥测数据序列异常检测方法
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:41:40上传分享