安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210568067.X (22)申请日 2022.05.24 (71)申请人 蚂蚁区块链科技 (上海) 有限公司 地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人 殷旭东 吴云崇 章鹏 (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 孙欣欣 周良玉 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 训练风险预测模 型、 业务风险的确定方法和 装置 (57)摘要 本说明书实施例提供一种训练风险预测模 型、 业务风险的确定方法和装置, 训练风险预测 模型的方法包括: 获取第一用户群; 第一用户群 包括的各个用户具有分别对应的历史用户数据; 通过对第一用户群进行多轮采样, 得到多个子用 户群; 基于任一子用户群包括的各个用户的历史 用户数据, 确定该子用户群的多个特征维度的群 特征数据和该子用户群的风险指标标签值, 作为 一个训练样 本; 将训练样本包括的子用户群的群 特征数据输入风险预测模型, 输出该子用户群的 风险指标预测值, 根据该子用户群的风险指标预 测值和该子用户群的风险指标标签值, 调整风险 预测模型的模 型参数。 能够在用户群中的用户无 风险表现期间, 预估该用户群的风险指标值。 并 且, 准确度高。 权利要求书3页 说明书11页 附图3页 CN 114936919 A 2022.08.23 CN 114936919 A 1.一种训练风险预测模型的方法, 所述方法包括: 获取第一用户群; 所述第一用户群包括的各个用户具有分别对应的历史用户数据; 通过对所述第一用户群进行多轮采样, 得到多个子用户群; 基于所述多个子用户群中任一子用户群包括的各个用户的历史用户数据, 确定该子用 户群的多个特 征维度的群特 征数据和该子用户群的风险指标 标签值, 作为 一个训练样本; 将所述训练样本包括的子用户群的群特征数据输入风险预测模型, 通过所述风险预测 模型输出该子用户群的风险指标预测值, 根据该子用户群的风险指标预测值和该子用户群 的风险指标 标签值, 调整所述 风险预测模型的模型参数。 2.如权利要求1所述的方法, 其中, 所述历史用户数据为从用户进行目标业务行为之后 的第一时间长度内的用户数据, 所述第一时间长度超过了预设时间长度, 所述风险指标标 签值基于从用户进行目标业 务行为之后的预设时间长度内的历史用户数据计算得到 。 3.如权利要求1所述的方法, 其中, 所述风险指标标签值用于指示, 该子用户群在从用 户进行目标业务行为之后的预设时间长度内未发生与目标业务行为对应的履约行为的违 约风险。 4.如权利要求3所述的方法, 其中, 所述目标业务行为包括借款行为, 所述履约行为包 括还款行为。 5.如权利要求1所述的方法, 其中, 所述历史用户数据包括用户在所述多个特征维度的 用户特征数据; 所述多个特征维度包括第一特征维度; 所述基于所述多个子用户群中任一 子用户群包括的各个用户的历史用户数据, 确定该子用户群的多个特征维度的群特征数 据, 包括: 对任一子用户群包括的各个用户的第 一特征维度的用户特征数据进行聚合, 得到该子 用户群在所述第一特 征维度的群特 征数据。 6.如权利要求5所述的方法, 其中, 所述第一特征维度为数值型特征; 所述对任一子用 户群包括的各个用户的第一特 征维度的用户特 征数据进行聚合, 包括: 对任一子用户群包括的各个用户的第 一特征维度的用户特征数据求平均值, 得到该子 用户群在所述第一特 征维度的群特 征数据。 7.如权利要求5所述的方法, 其中, 所述第一特征维度为类别型特征; 所述对任一子用 户群包括的各个用户的第一特 征维度的用户特 征数据进行聚合, 包括: 根据任一子用户群包括的各个用户的第 一特征维度的用户特征数据, 确定各个类别的 用户数占比, 将该用户数占比作为该子用户群在所述第一特 征维度的群特 征数据。 8.如权利要求1所述的方法, 其中, 所述方法还 包括: 利用验证样本集中的各个训练样本对训练后的所述风险预测模型进行验证; 所述验证 样本集基于第二用户群包括的各个用户分别对应的历史用户数据而生成; 所述第一用户群 和所述第二用户群通过对第三用户群随机切分而得到; 利用测试样本集中的各个训练样本对所述风险预测模型进行测试, 以确定所述风险预 测模型的性能; 所述测试样本集基于第四用户群包括的各个用户分别对应的历史用户数据 而生成; 所述第四用户群和所述第三用户群通过对第五用户群随机切分而得到 。 9.一种用户群的业 务风险的确定方法, 所述方法包括: 获取风险预测模型, 所述风险预测模型根据权利要求1的方法训练得到, 并具有群特征权 利 要 求 书 1/3 页 2 CN 114936919 A 2数据的输入形式; 获取目标用户群中每 个用户在多个特 征维度的用户特 征数据; 将任一用户的用户特征数据转换为所述群特征数据的形式, 将转换后的特征数据输入 所述风险预测模型, 通过 所述风险预测模型输出 该用户的预测风险指标值; 根据所述目标用户群中每个用户的业务额度和该用户的预测风险指标值, 确定所述目 标用户群的预测风险指标值, 该预测风险指标值用于指示所述目标用户群的业务风险程 度。 10.如权利要求9所述的方法, 其中, 所述多个特征维度包括数值型特征和类别型特征; 所述将任一用户的用户特 征数据转换为所述群特 征数据的形式, 包括: 将任一用户的数值型 特征的特征数据, 直接作为所述群特 征数据的形式; 将任一用户的类别型特征的特征数据, 转化为该类别型特征的每种类别的用户数占 比, 将该占比作为所述群特 征数据的形式。 11.一种训练风险预测模型的装置, 所述装置包括: 获取单元, 用于获取第一用户群; 所述第一用户群包括的各个用户具有分别对应的历 史用户数据; 采样单元, 用于通过对所述获取单元获取的第一用户群进行多轮采样, 得到多个子用 户群; 确定单元, 用于基于所述采样单元得到的多个子用户群中任一子用户群包括的各个用 户的历史用户数据, 确定该子用户群的多个特征维度的群特征数据和该子用户群的风险指 标标签值, 作为 一个训练样本; 训练单元, 用于将所述确定单元得到的训练样本包括的子用户群的群特征数据输入风 险预测模型, 通过所述风险预测模型输出该子用户群的风险指标预测值, 根据该子用户群 的风险指标预测值和所述确定单元得到的该子用户群的风险指标标签值, 调整所述风险预 测模型的模型参数。 12.如权利要求11所述的装置, 其中, 所述历史用户数据为从用户进行目标业务行为之 后的第一时间长度内的用户数据, 所述第一时间长度超过了预设时间长度, 所述风险指标 标签值基于从用户进行目标业 务行为之后的预设时间长度内的历史用户数据计算得到 。 13.如权利要求11所述的装置, 其中, 所述风险指标标签值用于指示, 该子用户群在从 用户进行目标业务行为之后的预设时间长度内未发生与目标业务行为对应的履约行为的 违约风险。 14.如权利要求13所述的装置, 其中, 所述目标业务行为包括借款行为, 所述履约行为 包括还款行为。 15.如权利要求11所述的装置, 其中, 所述历史用户数据包括用户在所述多个特征维度 的用户特征数据; 所述多个特征维度包括第一特征维度; 所述确定单元, 具体用于对任一子 用户群包括的各个用户的第一特征维度的用户特征数据进 行聚合, 得到该子用户群在所述 第一特征维度的群特 征数据。 16.如权利要求15所述的装置, 其中, 所述第一特征维度为数值型特征; 所述确定单元, 具体用于对任一子用户群包括的各个用户的第一特征维度的用户特征数据求平均值, 得到 该子用户群在所述第一特 征维度的群特 征数据。权 利 要 求 书 2/3 页 3 CN 114936919 A 3
专利 训练风险预测模型、业务风险的确定方法和装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 06:24:53
上传分享
举报
下载
原文档
(677.8 KB)
分享
友情链接
T-CISA 045—2020 铬—锰—镍—氮系奥氏体不锈钢热轧钢板和钢带.pdf
中国联通 量子安全通信技术应用白皮书(2022).pdf
GB-T 39257-2020 绿色制造 制造企业绿色供应链管理 评价规范.pdf
GB-T 17314-2011 籼型杂交水稻三系原种生产技术操作规程.pdf
GB 3096-2008_声环境质量标准.pdf
GB-T 42017-2022 信息安全技术 网络预约汽车服务数据安全要求.pdf
T-CRAA 004—2024 观赏鱼评分规则 孔雀鱼.pdf
DB65-T 3253-2020 建筑消防设施质量检测评定规程 新疆维吾尔自治区.pdf
GB-T 20004.2-2018 团体标准化 第2部分:良好行为评价指南.pdf
GB-T 41009-2021 法庭科学 DNA数据库选用的基因座及其数据结构.pdf
freebuf 2021企业安全运营实践研究报告.pdf
DB5111-T 25-2022 嘉州菜 乐山甜皮鸭制作工艺规范 乐山市.pdf
GB-T 42381.130-2023 数据质量 第130部分:主数据:特征数据交换:准确性.pdf
GB-T 29505-2013 硅片平坦表面的表面粗糙度测量方法.pdf
DB13-T 5217-2020 河道人工湿地设计规范 河北省.pdf
法律法规 中华人民共和国电信条例2016-02-06.pdf
GB-T 24369.3-2017 金纳米棒表征 第3部分:表面电荷密度测量方法.pdf
DB61-T 1497-2021 人间充质干细胞库建设与管理规范 陕西省.pdf
民航 MH-T 4054-2022 城市场景轻小型无人驾驶航空器物流航线划设规范.pdf
DB3711-T 134-2023 化工企业投资项目节能报告编制指南 日照市.pdf
交流群
-->
1
/
3
18
评价文档
赞助2元 点击下载(677.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。