安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210568067.X (22)申请日 2022.05.24 (71)申请人 蚂蚁区块链科技 (上海) 有限公司 地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人 殷旭东 吴云崇 章鹏  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 孙欣欣 周良玉 (51)Int.Cl. G06Q 40/02(2012.01) G06K 9/62(2022.01) (54)发明名称 训练风险预测模 型、 业务风险的确定方法和 装置 (57)摘要 本说明书实施例提供一种训练风险预测模 型、 业务风险的确定方法和装置, 训练风险预测 模型的方法包括: 获取第一用户群; 第一用户群 包括的各个用户具有分别对应的历史用户数据; 通过对第一用户群进行多轮采样, 得到多个子用 户群; 基于任一子用户群包括的各个用户的历史 用户数据, 确定该子用户群的多个特征维度的群 特征数据和该子用户群的风险指标标签值, 作为 一个训练样 本; 将训练样本包括的子用户群的群 特征数据输入风险预测模型, 输出该子用户群的 风险指标预测值, 根据该子用户群的风险指标预 测值和该子用户群的风险指标标签值, 调整风险 预测模型的模 型参数。 能够在用户群中的用户无 风险表现期间, 预估该用户群的风险指标值。 并 且, 准确度高。 权利要求书3页 说明书11页 附图3页 CN 114936919 A 2022.08.23 CN 114936919 A 1.一种训练风险预测模型的方法, 所述方法包括: 获取第一用户群; 所述第一用户群包括的各个用户具有分别对应的历史用户数据; 通过对所述第一用户群进行多轮采样, 得到多个子用户群; 基于所述多个子用户群中任一子用户群包括的各个用户的历史用户数据, 确定该子用 户群的多个特 征维度的群特 征数据和该子用户群的风险指标 标签值, 作为 一个训练样本; 将所述训练样本包括的子用户群的群特征数据输入风险预测模型, 通过所述风险预测 模型输出该子用户群的风险指标预测值, 根据该子用户群的风险指标预测值和该子用户群 的风险指标 标签值, 调整所述 风险预测模型的模型参数。 2.如权利要求1所述的方法, 其中, 所述历史用户数据为从用户进行目标业务行为之后 的第一时间长度内的用户数据, 所述第一时间长度超过了预设时间长度, 所述风险指标标 签值基于从用户进行目标业 务行为之后的预设时间长度内的历史用户数据计算得到 。 3.如权利要求1所述的方法, 其中, 所述风险指标标签值用于指示, 该子用户群在从用 户进行目标业务行为之后的预设时间长度内未发生与目标业务行为对应的履约行为的违 约风险。 4.如权利要求3所述的方法, 其中, 所述目标业务行为包括借款行为, 所述履约行为包 括还款行为。 5.如权利要求1所述的方法, 其中, 所述历史用户数据包括用户在所述多个特征维度的 用户特征数据; 所述多个特征维度包括第一特征维度; 所述基于所述多个子用户群中任一 子用户群包括的各个用户的历史用户数据, 确定该子用户群的多个特征维度的群特征数 据, 包括: 对任一子用户群包括的各个用户的第 一特征维度的用户特征数据进行聚合, 得到该子 用户群在所述第一特 征维度的群特 征数据。 6.如权利要求5所述的方法, 其中, 所述第一特征维度为数值型特征; 所述对任一子用 户群包括的各个用户的第一特 征维度的用户特 征数据进行聚合, 包括: 对任一子用户群包括的各个用户的第 一特征维度的用户特征数据求平均值, 得到该子 用户群在所述第一特 征维度的群特 征数据。 7.如权利要求5所述的方法, 其中, 所述第一特征维度为类别型特征; 所述对任一子用 户群包括的各个用户的第一特 征维度的用户特 征数据进行聚合, 包括: 根据任一子用户群包括的各个用户的第 一特征维度的用户特征数据, 确定各个类别的 用户数占比, 将该用户数占比作为该子用户群在所述第一特 征维度的群特 征数据。 8.如权利要求1所述的方法, 其中, 所述方法还 包括: 利用验证样本集中的各个训练样本对训练后的所述风险预测模型进行验证; 所述验证 样本集基于第二用户群包括的各个用户分别对应的历史用户数据而生成; 所述第一用户群 和所述第二用户群通过对第三用户群随机切分而得到; 利用测试样本集中的各个训练样本对所述风险预测模型进行测试, 以确定所述风险预 测模型的性能; 所述测试样本集基于第四用户群包括的各个用户分别对应的历史用户数据 而生成; 所述第四用户群和所述第三用户群通过对第五用户群随机切分而得到 。 9.一种用户群的业 务风险的确定方法, 所述方法包括: 获取风险预测模型, 所述风险预测模型根据权利要求1的方法训练得到, 并具有群特征权 利 要 求 书 1/3 页 2 CN 114936919 A 2数据的输入形式; 获取目标用户群中每 个用户在多个特 征维度的用户特 征数据; 将任一用户的用户特征数据转换为所述群特征数据的形式, 将转换后的特征数据输入 所述风险预测模型, 通过 所述风险预测模型输出 该用户的预测风险指标值; 根据所述目标用户群中每个用户的业务额度和该用户的预测风险指标值, 确定所述目 标用户群的预测风险指标值, 该预测风险指标值用于指示所述目标用户群的业务风险程 度。 10.如权利要求9所述的方法, 其中, 所述多个特征维度包括数值型特征和类别型特征; 所述将任一用户的用户特 征数据转换为所述群特 征数据的形式, 包括: 将任一用户的数值型 特征的特征数据, 直接作为所述群特 征数据的形式; 将任一用户的类别型特征的特征数据, 转化为该类别型特征的每种类别的用户数占 比, 将该占比作为所述群特 征数据的形式。 11.一种训练风险预测模型的装置, 所述装置包括: 获取单元, 用于获取第一用户群; 所述第一用户群包括的各个用户具有分别对应的历 史用户数据; 采样单元, 用于通过对所述获取单元获取的第一用户群进行多轮采样, 得到多个子用 户群; 确定单元, 用于基于所述采样单元得到的多个子用户群中任一子用户群包括的各个用 户的历史用户数据, 确定该子用户群的多个特征维度的群特征数据和该子用户群的风险指 标标签值, 作为 一个训练样本; 训练单元, 用于将所述确定单元得到的训练样本包括的子用户群的群特征数据输入风 险预测模型, 通过所述风险预测模型输出该子用户群的风险指标预测值, 根据该子用户群 的风险指标预测值和所述确定单元得到的该子用户群的风险指标标签值, 调整所述风险预 测模型的模型参数。 12.如权利要求11所述的装置, 其中, 所述历史用户数据为从用户进行目标业务行为之 后的第一时间长度内的用户数据, 所述第一时间长度超过了预设时间长度, 所述风险指标 标签值基于从用户进行目标业 务行为之后的预设时间长度内的历史用户数据计算得到 。 13.如权利要求11所述的装置, 其中, 所述风险指标标签值用于指示, 该子用户群在从 用户进行目标业务行为之后的预设时间长度内未发生与目标业务行为对应的履约行为的 违约风险。 14.如权利要求13所述的装置, 其中, 所述目标业务行为包括借款行为, 所述履约行为 包括还款行为。 15.如权利要求11所述的装置, 其中, 所述历史用户数据包括用户在所述多个特征维度 的用户特征数据; 所述多个特征维度包括第一特征维度; 所述确定单元, 具体用于对任一子 用户群包括的各个用户的第一特征维度的用户特征数据进 行聚合, 得到该子用户群在所述 第一特征维度的群特 征数据。 16.如权利要求15所述的装置, 其中, 所述第一特征维度为数值型特征; 所述确定单元, 具体用于对任一子用户群包括的各个用户的第一特征维度的用户特征数据求平均值, 得到 该子用户群在所述第一特 征维度的群特 征数据。权 利 要 求 书 2/3 页 3 CN 114936919 A 3

.PDF文档 专利 训练风险预测模型、业务风险的确定方法和装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练风险预测模型、业务风险的确定方法和装置 第 1 页 专利 训练风险预测模型、业务风险的确定方法和装置 第 2 页 专利 训练风险预测模型、业务风险的确定方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:24:53上传分享
交流群
  • //public.wenku.github5.com/wodemyapi/22.png
-->
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。