安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211299043.5 (22)申请日 2022.10.24 (71)申请人 臻和 (北京) 生物科技有限公司 地址 100192 北京市海淀区宝盛南路1号院 26号楼3层310号 申请人 臻悦生物科技江苏有限公司 (72)发明人 杨顺莉 李溪 李宇龙 洪媛媛  韩天澄 黄宇 陈维之 杜波  (74)专利代理 机构 常州佰业腾飞专利代理事务 所(普通合伙) 32231 专利代理师 毛姗 (51)Int.Cl. G16B 40/00(2019.01) G16B 20/30(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于cfDNA多组学的多分类方法及装置 (57)摘要 本发明提供了一种基于cfDNA多组学的多分 类方法及装置, 其中, 多分类方法包括: 基于 ATAC‑seq技术对待测血浆样本进行超低深度的 全基因组测序, 并获取预设ATA C‑seq区域簇的测 序数据, 每个ATAC ‑seq区域簇对应一类别的特征 区域; 基于预先配置的长插入片段阈值区间和短 插入片段阈值区间分别统计每个ATAC ‑seq区域 簇测序数据的长插入片段数量和短插入片段数 量; 将统计得到的长插入片段数量和短插入片段 数量输入预先训练的多组学分类模型中进行分 类, 得到待测血浆样本所属的类别。 其基于片段 组学的特征信息对待检测血浆样 本进行分类, 为 后续应用提供部分依据。 权利要求书4页 说明书20页 附图5页 CN 115376616 A 2022.11.22 CN 115376616 A 1.一种基于 cfDNA多组学的多分类方法, 其特 征在于, 包括: 基于ATAC ‑seq技术对待测血浆样本进行超低深度的全基因组测序, 并获取预设ATAC ‑ seq区域簇的测序数据, 每 个所述ATAC ‑seq区域簇对应一类别的特 征区域; 基于预先配置的长插入片段阈值区间和短插入片段阈值区间分别统计每个ATAC ‑seq 区域簇测序数据的长插 入片段数量和短插 入片段数量; 将统计得到的长插入片段数量和短插入片段数量输入预先训练的多组学分类模型中 进行分类, 得到所述待测血浆样本所属的类别。 2.如权利要求1所述的多分类方法, 其特征在于, 在所述基于预先配置的长插入片段阈 值区间和短插入片段阈值区间分别统计每个ATAC ‑seq区域簇测序数据的长插入片段数量 和短插入片段数量中, 所述长插入片段阈值区间为169bp~240bp, 所述短插入片段阈值区间 为100bp~166bp。 3.如权利要求1或2所述的多分类方法, 其特征在于, 所述基于ATAC ‑seq技术对待测血 浆样本进行超低深度的全基因组测序, 并获取预设ATAC ‑seq区域簇的测序数据之前, 还包 括对预设ATAC ‑seq区域簇测序数据的性能表现进行验证的步骤, 包括: 基于ATAC ‑seq技术分别对健康血浆样本和癌症患者血浆样本进行超低深度的全基因 组测序, 并获取预设ATAC ‑seq区域簇的测序数据; 所述癌症患者血浆样本包括多类型癌种 的血浆样本; 基于预先配置的长插入片段阈值区间和短插入片段阈值区间分别统计每个ATAC ‑seq 区域簇测序数据的长插 入片段数量和短插 入片段数量; 基于统计的长插入片段数量和短插入片段数量使用秩和单边检验方法对癌症患者血 浆样本对应癌种的特 征显著性进行检验。 4.一种基于 cfDNA多组学的多分类方法, 其特 征在于, 包括: 基于ATAC ‑seq技术对待测血浆样本进行超低深度的全基因组测序, 并获取预设ATAC ‑ seq区域簇的测序数据, 每 个所述ATAC ‑seq区域簇对应一类别的特 征区域; 分别计算每 个ATAC‑seq区域簇测序数据的 甲基化位点占比; 其中, 表示第i个ATAC‑seq区域簇的甲基化位点占比, 表示第i个 ATAC‑seq区域簇中所有CpG位点的数量, 表示第i个ATAC‑seq区域簇中甲基化 CpG位点的数量; 将计算得到的甲基化位点占比输入预先训练 的多组学分类模型中进行分类, 得到所述 待测血浆样本所属的类别。 5.如权利 要求4所述的多分类方法, 其特征在于, 所述基于ATAC ‑seq技术对待测血浆样 本进行超低深度的全基因组测序, 并获取预设ATAC ‑seq区域簇的测序数据之前, 还包括对 预设ATAC ‑seq区域簇测序数据的性能表现进行验证的步骤, 包括: 基于ATAC ‑seq技术分别对健康血浆样本和癌症患者血浆样本进行超低深度的全基因 组测序, 并获取预设ATAC ‑seq区域簇的测序数据; 所述癌症患者血浆样本包括多类型癌种 的血浆样本;权 利 要 求 书 1/4 页 2 CN 115376616 A 2分别计算每 个ATAC‑seq区域簇测序数据的 甲基化位点占比; 基于统计的甲基化位点占比使用秩和单边检验方法对癌症患者血浆样本对应癌种的 特征显著性进行检验。 6.一种基于 cfDNA多组学的多分类方法, 其特 征在于, 包括: 基于ATAC ‑seq技术对待测血浆样本进行超低深度的全基因组测序, 并获取预设ATAC ‑ seq区域簇的测序数据, 每 个所述ATAC ‑seq区域簇对应一类别的特 征区域; 基于预先配置的长插入片段阈值区间和短插入片段阈值区间分别统计每个ATAC ‑seq 区域簇测序数据的长插 入片段数量和短插 入片段数量; 分别计算每 个ATAC‑seq区域簇测序数据的 甲基化位点占比; 其中, 表示第i个ATAC‑seq区域簇的甲基化位点占比, 表示第i个 ATAC‑seq区域簇中所有CpG位点的数量, 表示第i个ATAC‑seq区域簇中甲基化 CpG位点的数量; 将统计得到的长插入片段数量、 短插入片段数量及甲基化位点占比输入预先训练的多 组学分类模型中进行分类, 得到所述待测血浆样本所属的类别。 7.一种基于 cfDNA多组学的多分类装置, 其特 征在于, 包括: 数据获取模块, 用于获取基于ATAC ‑seq技术对待测血浆样本进行超低深度全基因组测 序得到的测序数据, 并从中进一步获取预设ATAC ‑seq区域簇的测序数据, 每个所述ATAC ‑ seq区域簇对应一类别的特 征区域; 数量统计模块, 用于基于预先配置的长插入片段阈值区间和短插入片段阈值 区间分别 统计每个ATAC‑seq区域簇测序数据的长插 入片段数量和短插 入片段数量; 多分类模块, 用于将统计得到的长插入片段数量和短插入片段数量输入预先训练的多 组学分类模型中进行分类, 得到所述待测血浆样本所属的类别。 8.如权利要求7所述的多分类装置, 其特征在于, 所述数量统计模块中, 所述长插入片 段阈值区间为169bp~240bp, 所述短插 入片段阈值区间为10 0bp~166bp。 9.如权利要求7或8所述的多分类装置, 其特征在于, 所述多分类装置中, 还包括用于对 预设ATAC ‑seq区域簇测序数据的性能表现进行验证的性能验证模块, 包括: 数据获取单元, 用于获取基于ATAC ‑seq技术分别 对健康血浆样本和癌症患者血浆样本 进行超低深度全基因组测序得到的测序数据, 并从中进一步获取预设ATAC ‑seq区域簇的测 序数据; 所述癌症患者血浆样本包括多类型癌种的血浆样本; 数量统计模块, 用于基于预先配置的长插入片段阈值区间和短插入片段阈值 区间分别 统计每个ATAC‑seq区域簇测序数据的长插 入片段数量和短插 入片段数量; 检验单元, 用于基于统计的长插入片段数量和短插入片段数量使用秩和单边检验方法 对癌症患者血浆样本对应癌种的特 征显著性进行检验。 10.一种基于 cfDNA多组学的多分类装置, 其特 征在于, 包括: 数据获取模块, 用于获取基于ATAC ‑seq技术对待测血浆样本进行超低深度全基因组测 序得到的测序数据, 并从中进一步获取预设ATAC ‑seq区域簇的测序数据, 每个所述ATAC ‑权 利 要 求 书 2/4 页 3 CN 115376616 A 3

.PDF文档 专利 一种基于cfDNA多组学的多分类方法及装置

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于cfDNA多组学的多分类方法及装置 第 1 页 专利 一种基于cfDNA多组学的多分类方法及装置 第 2 页 专利 一种基于cfDNA多组学的多分类方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:41:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。