安全公司报告
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211190845.2 (22)申请日 2022.09.28 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 袁田 梁强 张效铭 (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 马姣琴 刘芳 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 40/02(2012.01) (54)发明名称 数据处理方法、 装置和电子设备 (57)摘要 本申请提供了数据处理方法、 装置和电子设 备, 该数据处理方法包括: 获取待处理表单, 待处 理表单中具有目标空值; 在数据库中, 确定与待 处理表单匹配的多个目标源表, 待处理表单的第 一表名与目标源表的第二表名具有关联性; 在多 个目标源表中, 确定与目标空值具有相同关联信 息的目标字段值; 采用目标字段值填充待处理表 单中的目标空值, 得到目标表单。 本申请通过自 动化的方式对待处理表单中的空值进行准确快 速的填充, 得到符合 监管质量要求的目标表单。 权利要求书2页 说明书10页 附图5页 CN 115470861 A 2022.12.13 CN 115470861 A 1.一种数据处 理方法, 其特 征在于, 包括: 获取待处 理表单, 所述待处 理表单中具有目标空值; 在数据库中, 确定与所述待处理表单匹配的多个目标源表, 所述待处理表单的第一表 名与所述目标源表的第二表名具有关联性; 在所述多个目标源表中, 确定与所述目标空值具有相同关联信息的目标字段值; 采用所述目标字段值 填充所述待处 理表单中的所述目标空值, 得到目标表单。 2.根据权利要求1所述的数据处理方法, 其特征在于, 所述确定与所述待处理表单匹配 的多个目标源表, 包括: 确定与所述第一表名的字符串相似度大于相似度阈值的表名, 为所述第二表名; 确定具有所述第二表名的源表为所述目标源表。 3.根据权利要求2所述的数据处理方法, 其特征在于, 在未确定到与 所述第一表名的字 符串相似度大于相似度阈值的表名的情况下, 所述确定具有 所述第二表名的源表为所述目 标源表之前, 还 包括: 获取所述第一表名的目标 标签; 在所述数据库中, 确定表名属于所述目标 标签的多个源表; 在所述多个源表的表名中, 确定与所述第一表名的汉明距离小于预设距离阈值的表 名, 为所述第二表名。 4.根据权利要求3所述的数据处理方法, 其特征在于, 在未确定到与 所述第一表名的汉 明距离小于预设距离阈值的表名的情况下, 所述确定具有 所述第二表名的源表为所述目标 源表之前, 还 包括: 将所述数据库中的源表的表名和所述第一表名输入预先训练的自然语言处理模型进 行文本处理, 得到所述源表的表名对应的概率值, 所述第一表名和所述表名的相似度与所 述概率值呈正相关 关系; 确定所述 概率值大于概 率阈值的表名为所述第二表名。 5.根据权利要求 4所述的数据处 理方法, 其特 征在于, 还 包括: 确定所述目标字段值所属的目标源表的第三表名; 采用所述第三表名和所述第一表名作为 正例样本, 优化训练所述自然语言处 理模型。 6.根据权利要求1至5 中任一项所述的数据处理方法, 其特征在于, 所述关联信 息包括: 字段名称和相关信息, 所述在所述多个目标源表中, 确定与所述 目标空值具有相同关联信 息的目标字段值, 包括: 在所述待处 理表单中, 确定所述目标空值的字段名称和相关信息; 在所述多个目标源表中, 确定所述字段名称对应的字段值; 在所述字段值为多个的情况下, 在所述多个字段值中, 确定具有所述相关信息的字段 值为所述目标字段值。 7.根据权利要求1至5中任一项所述的数据处理方法, 其特征在于, 所述采用所述目标 字段值填充所述待处 理表单中的所述目标空值, 得到目标表单之后, 还 包括: 校验所述目标表单的格式和所述目标表单中的字符串, 得到校验通过的目标表单。 8.根据权利要求1至5中任一项所述的数据处理方法, 其特征在于, 所述采用所述目标 字段值填充所述待处 理表单中的所述目标空值, 得到目标表单之后还 包括:权 利 要 求 书 1/2 页 2 CN 115470861 A 2将所述目标表单发送给监管机构进行监管。 9.一种数据处 理装置, 其特 征在于, 包括: 获取模块, 用于获取待处 理表单, 所述待处 理表单中具有目标空值; 第一确定模块, 用于在数据库中, 确定与所述待处理表单匹配的多个目标源表, 所述待 处理表单的第一表名与所述目标源表的第二表名具有关联性; 第二确定模块, 用于在所述多个目标源表中, 确定与所述目标空值具有相同关联信息 的目标字段值; 填充模块, 用于采用所述目标字段值填充所述待处理表单中的所述目标空值, 得到目 标表单。 10.一种电子设备, 其特 征在于, 包括存 储器与处 理器; 其中, 所述存储器用于存 储程序代码; 所述处理器用于调用所述程序代码实现如权利要求1至8中任一项所述的数据处理方 法。权 利 要 求 书 2/2 页 3 CN 115470861 A 3
专利 数据处理方法、装置和电子设备
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 SC 于
2024-03-03 12:07:04
上传分享
举报
下载
原文档
(779.8 KB)
分享
友情链接
GB-T 43580-2023 区块链和分布式记账技术 存证通用服务指南.pdf
GB-T 40652-2021 信息安全技术 恶意软件事件预防和处理指南.pdf
DB11-T 1372-2016 自然灾害和事故灾难类预警信息发布流程 北京市.pdf
YD-T 2700-2014 电信网和互联网安全防护基线配置要求及检测要求-数据库.pdf
GM-T 0016-2023 智能密码钥匙密码应用接口规范.pdf
NB-T 47005-2021 板式蒸发装置.pdf
信息安全工程师 每日一记 高频考点口袋书 2022适用 .pdf
Cisco路由器安全配置基线.doc
GB-T 30279-2020 信息安全技术 网络安全漏洞分类分级指南.pdf
GB-T 33471-2016 全自动纸板袖套式裹包机.pdf
DB32-T 3721-2020 高标准农田建设项目制图及其图例规范 江苏省.pdf
T-SDL 3.2—2021 10 kV智能电缆系统技术规范 第 2 部分 智能电缆测控系统终端.pdf
关于举办《量子通信关键技术与示范应用及产业发展》高级研修班的通知.pdf
GB-T 5000-2018 日用陶瓷名词术语.pdf
DB13-T 5654-2023 补充耕地符合性评定与质量等级评价技术规程 河北省.pdf
GB-T 43436-2023 智能工厂 面向柔性制造的自动化系统 通用要求.pdf
DB37-T 3444-2018 学生资助服务规范 山东省.pdf
GB-T 15843.4-2024 信息技术 安全技术 实体鉴别 第4部分:采用密码校验函数的机制.pdf
GB-T 16902.5-2017 设备用图形符号表示规则 第5部分:图标的设计指南.pdf
T-SCCIA 013—2023 机器人通行领域的身份鉴别密码应用指南.pdf
1
/
18
评价文档
赞助2元 点击下载(779.8 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。