安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111662657.0 (22)申请日 2021.12.3 0 (71)申请人 天翼电子商务有限公司 地址 100037 北京市西城区阜成门外大街 31号4层429D (72)发明人 谢伟伟 陈彬  (51)Int.Cl. G06V 30/412(2022.01) G06V 30/19(2022.01) G06K 9/62(2022.01) G06Q 40/04(2012.01) G06Q 40/06(2012.01) (54)发明名称 一种提前获知基金交易状态的方法及系统 (57)摘要 本发明公开了一种提前获知基金交易状态 的方法及系统。 建立一个基金交易状态设置系 统, 通过接口, 去基金 公司官网, 获取基金产品公 告信息, 并通过OCR文字识别技术, 对基金公告内 容进行提取, 从而能够提前几个工作日, 提取到 基金交易状态信息。 本发明增加了基金行情交易 状态获取渠道, 并提高了行情获取的时效; 充分 利用了基金信息公开披露的特点, 能够获取了足 够多的OCR训练样本文件; 提高了OCR模型的准确 度; 能够准确的在基金行情文件下发之前, 获知 基金行情交易状态, 以支持投资者交易决策; 防 止因为行情变更, 产生的无效交易, 导致投资者 的资金冻结, 提高投资者资金使用效率。 权利要求书2页 说明书4页 附图4页 CN 114529921 A 2022.05.24 CN 114529921 A 1.一种提前获知基金交易状态系统, 其特征在于, 该系统包括获取基金产品公告信 息、 OCR文字识别、 存 储模块, 具体如下 所示: (1)获取基金产品公告信息: 获取基金产品公告信息模块主要用于收集、 下载、 筛选平台所有销售基金产品最新基 金运作公告信息, 并对公告信息进行存 储; (2)OCR文字识别: 对于OCR模型的训练是需要一套OCR数据训练集作 为支撑的, OCR数据训练集越多, 训练 出的模型也就越精 准, 但对于不同基金公司而言, 虽然 所有公告的发布, 都是基于证监会的 披露标准, 但是披露的公告格式和内容, 还是稍有差别, 例如有的基金公司披露公告日期格 式为YYYY年MM月DD日, 而有的公司日期格式为YYYY ‑MM‑DD; 因此针对行业里面, 不同基金公 司的基金公告样本进行训练, 变得 尤为必要; (3)存储模块: 保存提取到的最终基金暂停交易日行情数据, 在T ‑1日15: 00后 至T日9: 00之间, 基金公 司未下发行情信息之前, 所有交易, 交易之前首先都 需要去存储模块中, 查询T日行情信息, 如果匹配到T日行情数据对应基金产品状态为暂停交易, 则对交易进 行阻断, 避免无效交易 的产生。 2.基于权利要求1中系统的提前获知基金交易状态的方法, 其特征在于, 包括以下步 骤: 步骤S1: 通过elasticjob, 触发定时任务, 定时轮询, 通过http协议获取基金官网最新 公告信息; 步骤S2: 获取到基金官网最新公告信 息后, 首先去存储模块, 查看该公告是否已经存储 过, 如果已经存储过, 则说明该产品公告, 没有更新, 转入步骤S3, 如果未存储, 则进入步骤 S4; 步骤S3: 待下一次轮询执 行; 步骤S4: 将基金产品最 新的公告, 保存 存储到存储模块, 并进入步骤S5; 步骤S5: 通过OCR提取公告中关键信息, 进行OCR模型训练, 具体流 程如下: S51, 对初始公告图像样本进行标注以生成OCR训练库; 具体地, 初始图像样本, 即拿到 不同基金公司OCR模型的样本公告图片; 而对初始图像样本进行标注, 即根据需要通过OCR 模型进行识别的图像的应用场景, 对初始图像样本需要识别的地方(基金代码, 日期)进行 标注处理, 并将标注和对应内容形成文本文件; 优选地可以采用人工标注, 标注的越准确, OCR模型的准确度越高; 生 成OCR训练集, 即根据初始图像样本以及 对于样本的关键字汇总, 生成能够用于训练OCR模型的OCR训练集; 关键字内容包括但不仅限于: 特定数字, 年月日, 特殊节日, 特定 字符串(产品代码); 步骤S52, 在待训练的OCR模型中输入OCR训练库进行训练, 得到OCR模型; 具体地, 将通 过初始图像样本获得的OCR训练集输入到待训练的OCR模型, 训练模型能够针对OCR训练集 进行重复训练, 得到OCR模型, 并将提取到的基金暂停交易行情信息, 保存到存 储模块; 步骤S53, 利用基金公司推送的历史行情数据, 里面的暂停交易的交易日期, 和S2中提 取到的交易日期, 进行对比, 若发生数据不一致, 则可以找到原公告, 和OCR识别 结果, 查找 识别错误的原因, 对OCR训练库标注和对应内容进行修 订;权 利 要 求 书 1/2 页 2 CN 114529921 A 2步骤S54, 重复上述步骤, 重复进行训练和对训练模型进行修订直到OCR模型提取到的 数据, 跟基金公司推送的历史行情能够完全匹配上, 并将训练之后的模型用来提取公告, 并 进行步骤S6; 步骤S6: 将提取到的暂停交易的交易日, 保存并存储到存储模块, 以便作为交易的时 候, 进行判断, 当前时间, 是否能够进行基金交易。权 利 要 求 书 2/2 页 3 CN 114529921 A 3

.PDF文档 专利 一种提前获知基金交易状态的方法及系统

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种提前获知基金交易状态的方法及系统 第 1 页 专利 一种提前获知基金交易状态的方法及系统 第 2 页 专利 一种提前获知基金交易状态的方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 04:42:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。