(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210701193.8
(22)申请日 2022.06.21
(65)同一申请的已公布的文献号
申请公布号 CN 114780620 A
(43)申请公布日 2022.07.22
(73)专利权人 联通 (江苏) 产业互联网有限公司
地址 210000 江苏省南京市 鼓楼区古平岗4
号C座二层
(72)发明人 刘浏 徐建娴 叶飞
(74)专利代理 机构 济南光启专利代理事务所
(普通合伙) 37292
专利代理师 李晓平
(51)Int.Cl.
G06F 16/2458(2019.01)
G06F 16/2453(2019.01)G06F 16/248(2019.01)
G06F 16/28(2019.01)
G06K 9/62(2022.01)
G06Q 40/02(2012.01)
(56)对比文件
CN 108536841 A,2018.09.14
WO 2021151521 A1,2021.08.0 5
US 2021158175 A1,2021.0 5.27
审查员 冯雅
(54)发明名称
基于大数据挖掘性能的云计算业务分析方
法、 装置及系统
(57)摘要
本发明公开了一种基于大数据挖掘性能的
云计算业务分析方法、 装置及系统, 涉及行为预
测技术领域。 主要包括: 根据用户对不同业务的
历史查询情况 获得用户的查询特征值; 利用预设
时长内访问的所有用户的查询特征值进行用户
分类, 获得同一类用户的习惯业务序列; 根据同
一类用户相邻查询次数的不同业务被查询的频
率之差以及不同业务间的相关性, 获得其在任一
查询次数中任意两业务间的关联性; 根据用户当
前所查询业务、 用户的习惯序列以及当前查询次
数中各业务的关联性, 预测用户下一个查询业
务, 并将预测查询业务提前放入 供用户查询的缓
存中。 本发 明实施例中各业务间的关联性更具针
对性, 从而提高用户查询的预测结果的准确性。
权利要求书2页 说明书8页 附图3页
CN 114780620 B
2022.08.26
CN 114780620 B
1.基于大 数据挖掘性能的云计算 业务分析方法, 其特 征在于, 包括:
根据用户对不同业 务的历史查询情况, 获得用户的查询特 征值;
利用预设时长 内访问的所有用户的查询特征值将用户聚类成多类, 并按照 查询次数的
先后顺序, 将同一类用户在各查询次数中查询频率最高的业务进行排序, 以获得同一类用
户的习惯业 务序列;
根据同一类用户相邻查询次数的不同业务被查询的频率之差以及不同业务间的相关
性, 获得同一类用户在任一 查询次数中任意两业 务间的关联性;
根据用户的查询特征值, 确定该用户的习惯业务序列, 并判断当前所查询的业务与习
惯业务序列中当前查询次数对应的业 务是否一 致;
若判断结果为是, 则将习惯业务序列中下一个业务作为预测查询业务; 若判断结果为
否, 将与当前查询业务关联性最大 的业务作为预测查询业务; 将预测查询业务提前放入供
用户查询的缓存中。
2.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 根
据同一类用户相 邻查询次数的不同业务被查询的频率之差以及不同业务间的相关性, 获得
同一类用户在任一 查询次数中任意两业 务间的关联性, 包括:
其中,
为同一类用户在进行第i次查询时业务
与业务
之间的关联性,
为同一
类用户在进 行第i次查询时业务
被查询的频率,
为同一类用户在进 行第i次查询时业务
被查询的频率,
为同一类用户在进行第i ‑1次查询时业务
被查询的频率,
为业务
与业务
之间的相关性,
为指数曲线。
3.根据权利要求2所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 所
述方法还 包括:
选取同一类用户中预设比例的用户作为代表用户, 根据代表用户相邻查询次数的最高
查询频率之差以及不同业务间的相关性, 获得代表用户在进 行任一查询次数下任意两业务
间的关联性;
将代表用户在进行任一查询次数下任意两业务间的关联性, 作为同一类用户在进行任
一查询次数 下任意两业 务间的关联性。
4.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 根
据用户对不同业 务的历史查询情况, 获得用户的查询特 征值, 包括:
对历史查询情况中同一查询次数下不同用户对各业务的查询次数进行第一PCA, 将第
一PCA的最大主成分作为第一 最大主成分;
分别将不同用户对各业务的查询次数对第 一最大主成分进行投影, 分别获得各用户在
同一查询次数 下的第一 查询特征值;
将各用户在各查询次数下的所述第一查询特征值进行第二PCA, 将第二PCA的最大主成
分方向作为第二 最大主成分;
分别将各用户在各查询次数下的所述第 一查询特征值对第 二最大主成分进行投影, 分
别获得各用户的第二 查询特征值, 并将用户的第二 查询特征值作为用户的查询特 征值。权 利 要 求 书 1/2 页
2
CN 114780620 B
25.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 所
述方法还 包括:
当前所查询的业务与习惯业务序列中当前查询次数对应的业务一致 时, 将习惯业务序
列中预测查询业务后预设数量个业务作为备选查询业务, 将备选查询业务放入预测查询业
务的缓存后。
6.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 所
述方法还 包括:
当前所查询的业务与习惯业务序列中当前查询次数对应的业务不一致 时, 将与预测查
询业务关联性最大的预设数量个业务作为备选查询业务, 将备选查询业务放入预测查询业
务的缓存后。
7.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 根
据用户对不同业务的历史查询情况, 获得用户的查询特征值前, 所述方法还包括: 对用户对
不同业务的历史查询情况进行 数据清洗 。
8.根据权利要求1所述的基于大数据挖掘性 能的云计算业务分析方法, 其特征在于, 利
用预设时长内访问的所有用户的查询特征值将用户聚类成多类后, 所述方法还包括: 建立
多个云数据仓库用于储存所有用户的查询数据, 且同一个云数据仓库中存放同一类用户的
查询数据。
9.基于大 数据挖掘性能的云计算 业务分析装置, 包括:
用户查询特征值获取模块, 用于根据用户对不同业务的历史查询情况, 获得用户的查
询特征值;
用户聚类模块, 用于利用预设时长内访问的所有用户的查询特征值将用户聚类成多
类;
习惯业务序列获取模块, 用于按照查询次数的先后顺序, 将同一类用户在各查询次数
中查询频率 最高的业 务进行排序, 以获得同一类用户的习惯业 务序列;
关联性获取模块, 用于根据同一类用户相邻查询次数的不同业务被查询的频率之差以
及不同业 务间的相关性, 获得同一类用户在任一 查询次数中任意两业 务间的关联性;
判断模块, 用于根据用户的查询特征值, 确定该用户的习惯业务序列, 并判断当前所查
询的业务与习惯业 务序列中当前查询次数对应的业 务是否一 致;
预测业务确定模块, 若判断结果为是, 将习惯业务序列中下一个业务作为预测查询业
务, 若判断结果 为否, 将与当前查询业 务关联性 最大的业 务作为预测查询业 务;
缓存预调度模块, 将预测查询业 务提前放入供用户查询的缓存中。
10.基于大数据挖掘性能的云计算业务分析系统, 包括: 存储器和处理器, 其特征在于,
所述处理器执行所述存储器存储的计算机程序, 以实现如权利要求1 ‑8中任一项所述的基
于大数据挖掘性能的云计算 业务分析方法。权 利 要 求 书 2/2 页
3
CN 114780620 B
3
专利 基于大数据挖掘性能的云计算业务分析方法、装置及系统
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:22:43上传分享