安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211283066.7 (22)申请日 2022.10.18 (71)申请人 中国地质大 学 (北京) 地址 100083 北京市海淀区学院路2 9号中 国地质大 学 (北京) (72)发明人 金旸 廉海荣 郭翠平 李德湘 初玉婷 (74)专利代理 机构 北京友联知识产权代理事务 所(普通合伙) 11343 专利代理师 王淑梅 薛鹏 (51)Int.Cl. G06K 9/62(2022.01) G16H 50/20(2018.01) (54)发明名称 基于乳腺癌变量的分类模型建立方法及系 统、 存储介质 (57)摘要 本申请提供了一种基于乳腺癌变量的分类 模型建立方法及系统、 存储介质, 属于医疗数据 处理技术领域, 基于乳 腺癌变量的分类模型建立 方法包括: 获取乳腺癌数据, 对乳腺癌数据进行 预处理; 基于乳腺癌数据建立数据集, 并根据数 据集划分出训练集和测试集, 划分数据集的方法 包括以下之一: 随机子抽样验证法、 交叉验证法 和自助法; 基于数据集进行变量筛选, 得出筛选 结果; 基于筛选 结果, 通过Adaboost分类器和/或 随机森林分类器 建立分类模型; 通过模型评价指 标对分类模 型进行评价, 模型评价指标包括精准 率、 召回率、 F1值和ROC曲线。 通过本申请的技术 方案, 能够提高乳腺癌重要变量的预测精度, 有 利于医疗预防和筛查防护。 权利要求书2页 说明书7页 附图3页 CN 115358351 A 2022.11.18 CN 115358351 A 1.一种基于 乳腺癌变量的分类模型建立方法, 其特 征在于, 包括: 获取乳腺癌数据, 对所述乳腺癌数据进行 预处理; 基于所述乳腺癌数据建立数据集, 并根据所述数据集划分出训练集和测试集, 划分所 述数据集的方法包括以下之一: 随机 子抽样验证法、 交叉验证法和自助法; 基于所述数据集进行变量筛 选, 得出筛选结果; 基于所述筛 选结果, 通过Adabo ost分类器和/或随机森林分类 器建立分类模型; 通过模型评价指标对所述分类模型进行评价, 所述模型评价指标包括精准率、 召回率、 F1值和ROC曲线。 2.根据权利要求1所述的基于乳腺癌变量的分类模型建立方法, 其特征在于, 所述获取 乳腺癌数据, 对所述乳腺癌数据进行 预处理, 具体包括: 获取乳腺癌数据; 对所述乳腺癌数据进行数据归一化, 所述数据归一化的方法包括Min ‑Max归一化和零 均值归一 化; 对所述乳腺癌数据进行异常值处理, 所述异常值处理的方法包括直接删除法、 序列均 值填充法、 临近点均值 填充、 中位数填充和线性插值。 3.根据权利要求2所述的基于乳腺癌变量的分类模型建立方法, 其特征在于, 所述Min ‑ Max归一化的公式为: ; 其中, 表示第i个变量的某一个值, 表示第i个变量的最小值, 表示第i个变量 的最大值, 是归一化后的变量。 4.根据权利要求2所述的基于乳腺癌变量的分类模型建立方法, 其特征在于, 所述零均 值归一化的公式为: ; 其中, 是样本的均值, 是样本的标准差, 为归一化后的变量, 为原始数据。 5.根据权利要求1至4中任一项所述的基于乳腺癌变量的分类模型建立方法, 其特征在 于, 所述变量筛选的方法包括Lasso变量筛选、 随机森 林变量筛选、 SIS变量筛选和DC ‑SIS变 量筛选。 6.根据权利要求1至4中任一项所述的基于乳腺癌变量的分类模型建立方法, 其特征在 于, 所述精准 率的公式为: ; 其中, 为精准率, 表示真实值是P ositive, 模型认为是P ositive的数量, 表示真实值是Positive, 模型认为是Neg ative的数量。 7.根据权利要求1至4中任一项所述的基于乳腺癌变量的分类模型建立方法, 其特征在 于, 所述召回率的公式为:权 利 要 求 书 1/2 页 2 CN 115358351 A 2; 其中, 为召回率, 表示真实值是Positive, 模型认为是Positive的数量, 表 示真实值是Positive, 模型认为是Neg ative的数量。 8.一种基于 乳腺癌变量的分类模型建立系统, 其特 征在于, 包括: 获取模块 (1 10) , 用于获取乳腺癌数据, 对所述乳腺癌数据进行 预处理; 数据集划分模块 (120) , 用于基于所述乳腺癌数据建立数据集, 并根据所述数据集划分 出训练集和测试集, 划分所述数据集的方法包括以下之一: 随机子抽样验证法、 交叉验证法 和自助法; 筛选模块 (13 0) , 用于基于所述数据集进行变量筛 选, 得出筛选结果; 分类模型建立模块 (140) , 用于基于所述筛选结果, 通过Adaboost分类器和/或随机森 林分类器建立分类模型; 评价模块 (150) , 用于通过模型评价指标对所述分类模型进行评价, 所述模型评价指标 包括精准 率、 召回率、 F1 值和ROC曲线。 9.一种基于 乳腺癌变量的分类模型建立系统, 其特 征在于, 包括: 存储器 (300) 和处理器 (400) , 其中, 所述存储器 (300) 上存储有可在所述处理器 (400) 上运行的程序或指令, 所述处理器 (400) 执行所述程序或所述指令时实现如权利要求1至7 中任一项所述的基于 乳腺癌变量的分类模型建立方法的步骤。 10.一种可读存储介质, 其上存储有程序或指令, 其特征在于, 所述程序或所述指令被 处理器执行时实现如权利要求1至7中任一项所述的基于乳腺癌变量的分类模型建立方法 的步骤。权 利 要 求 书 2/2 页 3 CN 115358351 A 3
专利 基于乳腺癌变量的分类模型建立方法及系统、存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:43:06
上传分享
举报
下载
原文档
(544.4 KB)
分享
友情链接
GB-T 30331-2021 仓储绩效指标体系.pdf
GB-T 15609-2008 彩色显示器色度测量方法.pdf
GBT 33132-2016 信息安全技术 信息安全风险处理实施指南.pdf
GB-T 21062.2-2007 政务信息资源交换体系 第2部分:技术要求.pdf
NIST 关键基础设施网络安全改善框架-美国关基-v1.1-2018年 安全内参翻译版本.pdf
T-ZZB 0602—2018 环保节能舒适型冷风扇.pdf
T-CI 038—2023 污泥脱水调理剂.pdf
GB 21555-2008 烟花爆竹 双响(升空类产品).pdf
GB-T 9969-2008 工业产品使用说明书 总则.pdf
GB-Z 42759-2023 智慧城市 人工智能技术应用场景分类指南.pdf
奇安信 2020网络安全投融资趋势报告.pdf
DB13-T 5022-2019 冶金企业气体防护站安全管理规范 河北省.pdf
R155e.pdf
NY-T 3992-2021 苯噻酰草胺原药.pdf
GB-T 43806-2024 资产管理系统通用技术要求.pdf
GB-T 24479-2023 火灾情况下的电梯特性.pdf
GB-T 30688-2014 馆藏砖石文物病害与图示.pdf
GB-T 25058-2019 信息安全技术 网络安全等级保护实施指南.pdf
T BJQC 智能网联汽车信息安全测试方法(征求意见稿).pdf
T-GDAEPI 17—2023 有色金属矿区地下水污染调查技术规范.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(544.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。