(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211330827.X
(22)申请日 2022.10.28
(71)申请人 方寸慧医 (江苏) 生物科技有限公司
地址 210000 江苏省南京市 建邺区庐山路
158号嘉业国际城4幢701室
(72)发明人 乔延春 刘和平
(74)专利代理 机构 南京明杰知识产权代理事务
所(普通合伙) 32464
专利代理师 张文杰
(51)Int.Cl.
G16H 50/70(2018.01)
G06N 3/00(2006.01)
G06K 9/62(2022.01)
G06F 16/904(2019.01)
(54)发明名称
基于AI的高通量测序数据智能分析系统及
方法
(57)摘要
本发明公开了基于AI的高通量测序数据智
能分析系统及方法, 属于高通量测序数据智能分
析技术领域。 该系统包括高通量测序数据采集模
块、 平台构建模块、 流程管理模块、 个性化数据分
析模块、 可视化输出模块; 所述高通量测序数据
采集模块、 所述平台构建模块与所述流程管理模
块顺次连接; 所述流程管理模块的输出端与所述
个性化数据分析模块的输入端相连接; 所述个性
化数据分析模块的输出端与所述可视化输出模
块的输入端相连接。 本发 明能够利用AI智能处理
掉海量数据的分析工作, 建立基于可视化、 流程
化的国产AI数据分析协作平台, 实现NCS级别研
究成果的数据可视化展现, 提高研究员工作效
率。
权利要求书3页 说明书8页 附图4页
CN 115472298 A
2022.12.13
CN 115472298 A
1.基于AI的高通 量测序数据智能分析 方法, 其特 征在于: 该 方法包括以下步骤:
S1、 获取高通量测序 数据, 所述高通量测序数据包括单细胞转录组测序数据、 空间转录
组测序数据、 全基因 组关联研究数据、 全外 显子测序数据;
S2、 构建AI数据分析协作平台, 所述平台包括项目管理、 定制流 程分析、 可视化展现;
S3、 将高通量测序数据输入至AI数据分析协作平台中, 获取操作人员个性化特征, 定制
流程分析, 构建可视化智能分析模型;
S4、 根据可视化智能分析模型, 输出本次高通 量测序数据的可视化结果至管理员端口。
2.根据权利要求1所述的基于AI的高通量测序数据智能分析方法, 其特征在于: 所述AI
数据分析协作平台包括项目管理、 定制流 程分析、 可视化展现;
所述项目管理包括记录高通量测序数据、 数据分析任务、 数据分析工具以及参与人员;
所述定制流程分析包括根据操作人员的个性化特征, 确 立不同的流程输出控制系统操作;
所述可视化展现用于根据高通 量测序数据分析 结果, 智能选择图表, 输出 可视化结果。
3.根据权利要求2所述的基于AI的高通量测序 数据智能分析方法, 其特征在于: 所述定
制流程分析包括:
获取用户登录数据, 选取该账号下进行高通量测序数据分析的历史流程, 将历史流程
分类为正常流程与精简流程; 所述精简流程指用户仅输出可视化结果, 未进行无关操作的
流程; 所述无关操作指 构建新项目、 存 储、 通讯录分享;
构建流程分析模型, 以输入的高通量测序数据量、 相邻两次高通量测序数据输入的间
隔时间为自变量、 以使用精简流 程为因变量, 拟合成为线性模型:
其中,
为本次使用精简流程的概率;
代表回归系数;
为本次输入的高通量测
序数据量;
为本次与上一次高通量测序数据输入的间隔时间;
代表误差项, 利用MATLAB
软件仿真, 计算得 出
;
设置概率阈值, 在P超出概 率阈值时, 定义本次使用精简流 程。
4.根据权利要求3所述的基于AI的高通量测序 数据智能分析方法, 其特征在于: 所述构
建可视化智能分析模型包括:
S3‑1、 获取所有的可视化分析 结果展示图, 记录在数据库内, 分别计算
任一可视化分析 结果展示图在可视化智能分析模型 下被选择的概 率;
S3‑2、 获取用户登录数据, 根据用户登录数据获取该账号下的历史操作数据, 在历史操
作数据下获取任一可视化分析结果展示图M的被选择数据; 所述被选择数据中包括本次选
择可视化分析 结果展示图M的所有高通 量测序数据特 征;
S3‑3、 将步骤S3 ‑2中获取的被选择数据进行组合编码, 记为[A1、 A2、 A3、……、 An], 每一编
码对应一个高通量测序数据特征, 其中A1、 A2、 A3、……、 An分别代表高通量测序数据特征中
的一种, 记 为元素; 所述高通量测序数据特征包括OUT 数目数量、 样本测序数量、 高通量测序
数据类别、 测序数据分析目标;
S3‑4、 随机初始化一个种群, 所述种群中包含有R组被选择数据, R样本测序数量表示系权 利 要 求 书 1/3 页
2
CN 115472298 A
2统预设常数, 对R组被选择数据中选择可视化分析结果展示图M的数据进行标记, 设置初始
迭代次数G=1, 对标记的数据中编码中元素进行随机组合, 根据编码中元素A1、 A2、 A3、……、
An及元素A1、 A2、 A3、……、 An的随机组合分别计算每个元素或元素组合对选择可视化分析结
果展示图M的影响程度, 构建偏差值计算模型:
其中,
代表编码
对应的选择可视化分析结果展示图M 的偏差值;
代表编码
中所
有元素组合方式中的任一种,其中单独一种元素也称为元素组合, n代表编码
中所有元素
组合方式的集合;
代表种群中选择可视化分析结果展示图M时且存在组合方式为
的编
码数量;
代表种群中存在组合方式为
的编码数量;
S3‑5、 构建迭代停止因子, 计算种群 中所有编码的偏差值的期望值与标准差; 若不满足
正态分布, 则设置迭代次数G= G+1, 挖掘子元素生 成新的种群, 再次计算新的种群的偏 差值;
所述生成新的种群包括: 利用随机选择, 每次选择两个编码, 偏差值高的留下, 不断循环直
至选择出的种群数量达到
, 其中
,
为系统预设的常数, 对新的种群中出现率
最低的元 素进行删除, 对剩余元 素进行挖掘子元 素, 所述元 素与子元 素之间存在包 含关系;
若满足正态分布, 停止迭代, 输出当前高通量测序数据特征下选择可视化分析结果展
示图M的最优概 率计算模型;
S3‑6、 在数据库内依次选取可视化分析结果展示图, 对应输入当前高通量测序数据特
征, 分别计算得出当前高通量测序数据特征下选择每个可视化分析结果展示图的最优概率
值; 对最优概率值进 行从大到小排序, 获取管理员输入的图表需要 数量, 按照顺序智能选择
图表, 自动输出本次高通 量测序数据的可视化结果至管理员端口。
5.基于AI的高通量测序 数据智能分析系统, 其特征在于: 该系统包括: 高通量测序 数据
采集模块、 平台构建模块、 流 程管理模块、 个性 化数据分析模块、 可视化输出模块;
所述高通量测序 数据采集模块用于获取高通量测序 数据, 并对高通量测序数据进行分
类; 所述平台构建模块用于构建A I数据分析协作平台, 所述平台能够实现项目管理、 定制流
程分析、 可视化展现的功能; 所述流程管理模块用于在将高通量测序数据输入至AI数据分
析协作平台中, 获取操作人员个性化特征, 定制流程分析, 生成处理流程; 所述个性化数据
分析模块用于构建可视化智能分析模型, 智能选择可视化输出图表; 所述可视化输出模块
用于根据可视化智能分析模型, 输出本次高通 量测序数据的可视化结果至管理员端口;
所述高通量测序 数据采集模块的输出端与 所述平台构建模块的输入端相连接; 所述平
台构建模块的输出端与所述流程管理模块的输入端相连接; 所述流程管理模块的输出端与
所述个性化数据分析模块的输入端相连接; 所述个性化数据分析模块的输出端与所述可视
化输出模块的输入端相连接 。
6.根据权利要求5所述的基于AI的高通量测序 数据智能分析系统, 其特征在于: 所述高
通量测序数据采集模块包括高通 量测序数据采集单 元、 分类单 元;权 利 要 求 书 2/3 页
3
CN 115472298 A
3
专利 基于AI的高通量测序数据智能分析系统及方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:43:01上传分享