安全公司报告
知识图谱在智能产业分析领域的应用 -基于产业原子的产业知识图谱构建实践 中数智源(北京)科技有限公司 2022年3月 李春华 138-105-27024 核心探讨的几个问题 1、如何利用基于知识图谱的智能工具进行产业分析 2、什么是产业原子,如何利用产业原子构建产业知识图谱 3、产业原子的表示、特点、提取算法 4、基于产业原子的知识图谱系统整体架构 基于知识图谱的智能产业分析工具介绍 间接客户: 目标客户: 政府/园区 金融机构 知识产权 服务公司 咨询公司 企业 投融资服 务公司 产业投资 基金 万因(VentureSights)智能分析工具 产业分析 商机挖掘 融资分析 并购分析 智能分析引擎 产业分析引擎:解决要素之间匹配的核心逻辑是产业脉络,因此利用人工智 能技术挖掘产业上下游关系,对创新要素做评估,以及各种要素之间的动态 匹配和推荐是价值发现的核心。 中数智源(北京)科技有限公司 产品核心功能 万因(VentureSights)智能分析工具 1 产业分析 • • • 自定义产业链构建 企业清单生成 分 析 图 表 生 成 /下 载 2 商机挖掘 • 企业上下游合作分析 3 融资分析 • • 推荐投资基金 基金详情查询 4 并购分析 • 上 市 公 司并购分析 中数智源(北京)科技有限公司 产品使用流程 系统预装报告图表 系统预装产业链 我的工作台 自定义产业链工具 企业搜索 • 多条路径, 多种方法, 筛选相关 企业,并 以企业数 据为基础, 构建产业 分析模型 生成企业清单 • • • 主营业务判断 区域筛选 企业评估得分 筛选 • 专利搜索 更新企业清单 基于企业清 单,支持自 由组合,形 成定制化报 表 定制化报告图表 下载报告图表 产业图谱搜索 • 支持企业清 单下载 企业详情 生成产业分析报告 基金查询 中数智源(北京)科技有限公司 产业链分析 系统预装多条产业链, 同时也支持用户自定义 产业链结构 所有预装产业链内企业都已经 梳理好,并支持用户保存清单 中的企业 中数智源(北京)科技有限公司 产业链分析 系统预装多条产业链,并提供产业分析框架,以及相应图表,所有图表支持下载,有助于分析师快速形成报告 中数智源(北京)科技有限公司 自定义产业链设计工具 功能开发 背景 产业链构 建目的 产业链构 建步骤 没有最正确的产业链定义,只有最适合自己的视角。为满足“千人千面” 的产业链分析视角,VentureSights推出了“自定义产业链”功能,用 户可依据自己的逻辑生产更符合个人认知的产业链结构,并按照这个结 构来组织各种数据和分析。 形成以产业链为基础的针对链内每个产业节点的企业清单及数据统计, 以便后续的产业分析。 产业链构建界面 1. 绘制产业链树形结构 2. 针对产业链内每个产业节点编写检索式: 检索式编写界面 a) 检索式需按系统规定规则进行书写 b) 支持检索的字段有:企业名称/企业描述/企业注册资本金/注 册时间/注册地址/企业所在省份/专利名称/专利描述/专利分 类号/专利类型等 3. 系统按照检索式自动找出符合条件的的企业 中数智源(北京)科技有限公司 企业清单生成与分析 企业清单创建目的 分析师可随时查看和维护企业清单,按照各 种维度条件进行优质企业清单筛选(例如招 商标的筛选)。后续系统会根据最终企业清 单生成各维度数据图表,以便分析师进行分 析和解读 企业清单创建步骤 当产业链构建完成后,系统即可按用户编写 的检索式生成企业清单。用户也可以直接使 用系统内已经筛选好的热门产业链企业清; 用户可按照各个字段对企业进行增删改查, 提高清单内企业的准确性, 生成的企业清单包含企业各维度数据 企业名称/主营业务/企业所在省市/企业所在 区县/注册时间/注册资本/上市板块/融资额度 /专利数量/资质数量/社保人数/... 中数智源(北京)科技有限公司 企业评估 中数智源(北京)科技有限公司 专利评估 按技术节点查询相应专利,通过计算“相似专利”得到可对比专利范围 中数智源(北京)科技有限公司 商机挖掘:上下游合作分析 风电装备产业生态上下游挖掘词云 o 基于以上对于酒泉市/肃州区新能源装备制造产业数据分析显示,目前肃州区产业布局重点和优势体现在“风力发电装备”行业。以风力发 电装备为核心节点,进行生态上下游挖掘:“数控机床”“数控磨床”“抛光机”等对风电产业生态有着至关重要的作用。 o 风电装备变速箱体属于大型箱体,且结构复杂。主轴、风轮和塔架也均为大型构件。加工难度大、进度要求高,各部件的制造和维护需要不 同机床设备进行加工,所以风电装备对于机床的工具和工艺要求十分苛刻;风电装备大规模轴承、齿轮以及叶片均需采用数控磨床、抛光机 等设备进行打磨,对相关机械的切削速度也有着极高的要求;所以引入或合作“数控机床”“数控磨床”“抛光机”的企业,也是风电装备 生产运维产业发展的必要条件之一。 中数智源(北京)科技有限公司 商机挖掘:上下游合作分析 o 利用产业图谱挖掘风电装备产业生态上下游,关联度最高的 节点为“碳纤维”。(关联度是指产业节点在产业图谱中的 拓扑重要性) o “碳纤维及其复合材料”在风电领域使用广泛,风电机组的 大型化需要碳纤维叶片助力实现。传统的风电叶片制造材料 主要为玻璃纤维复合材料,但随着风机功率的增加、叶片长 度不断加长,自身重量不断增大,因此具备高强高模、低密 度的碳纤维材料是目前风电叶片发展方向的重点。 利用产业图 谱挖掘风电 生态上下游, 其中关联度 最高的节点 为“碳纤维” o 引入或合作“碳纤维复合材料”对风电领发展有极大的促进 作用。 中数智源(北京)科技有限公司 融资分析:根据产业方向推荐投资基金 中数智源(北京)科技有限公司 并购分析:针对上市公司,推荐潜在并购方向 基于“贝特瑞”企业画像分析、贝特瑞相关资讯,并利用“贝特瑞” 并购方向词云,挖掘到推荐并购方向有“电池材料”、“电池回收”、 “湿法冶金”、“搅拌设备”。其中“湿法冶金”、“搅拌设备”作 为生产电池材料原材料的重要技术手段及设备之一可完善“贝特瑞” 电池材料生产流程。 中数智源(北京)科技有限公司 产业原子介绍 产业原子定义:产业原子用来描述一个细分产业的最细粒度的概念,产业原子具备明确的范围和边 界,产业原子可以是一个产品或者服务,也可以是原材料、零部件、生产工具等。 人工智能 企业 投资机构 知识产权 产业园区 产业原子 产业节点 产业链 产业政策 …… 人的智能 中数智源(北京)科技有限公司 产业报告 产业原子的特点 1、产业原子不能够再进行细分。 2、产业原子之间描述的概念可以有交集。 3、任何两个产业原子之间都可以存在关系,关系有多种类型,并可以通过距离来描述远近。 4、产业原子的数量庞大(目前有2800万左右),能够充分表述整个产业的方方面面。 5、产业原子可以组合成产业节点,通过产业原子组合能够描述范围更大、更准确的细分产业。 6、产业原子可以关联其他相关的实体,如企业、投资机构、园区、知识产权、产业政策等。 7、产业节点可以与其关联的任何实体计算空间距离。 中数智源(北京)科技有限公司 产业原子的表示 1、每个产业原子采用一个256维的向量表示 2、向量距离产业原子之间的相似度,距离越近越相似 3、产业原子向量基于“Graph Embedding”方式构建 4、产业原子向量可用于推荐算法的召回、排序过程。 房地产 智能汽车 智能家居 无人机 人工智能 …… 0.45234,0.5323,0.84324,0.424323. …… 0.2345,0.9311 0.1234,0.5323,0.84324,0.424323. …… 0.2345,0.9731 0.7234,0.5323,0.84324,0.424323. …… 0.2345,0.8737 0.1234,0.5323,0.84324,0.424323. …… 0.2345,0.9736 0.1344,0.5323,0.84324,0.424323. …… 0.2345,0.9732 核心算法- 产业原子名称NER 3、更新合法词判 断模型、规则 1、原始语料生成 2、提取原始词表 4、自动化标注 5、训练NER模型 6、产生新词 7、过滤新词 8、合并词表 过程1、采用多维规则(句法规则、词性规则、特征词规则)引擎提取短语,生成短语训练语料。 过程2、基于多种特定的规则提取产业原子名称词汇,生成原始词表。 过程3、基于过程2生成的词表对词语合法性判断模型、规则进行更新。 过程4、采用过程2生成的词表对过程1的语料进行自动化标注,生成训练样本。 过程5、使用BERT+TRANSFORMER+CRF模型对过程4的训练样本进行学习,生成NER模型。 过程6、使用过程5的NER模型,对过程1产生的语料进行实体识别,生成新词列表。 过程7、基于过程3产生的模型和规则对新词进行过滤,生成新词列表。 过程8、对新词和老词进行合并,重复过程4到过程8,直到足量级的词表产生。 注:过程3在整体循环中,也需要根据情况随时调整 核心算法- Semantic Deep Walk Based on Heterogeneous Network Deep Walk算法是一种知识图谱的向量化(Graph Embedding)的优秀算法,能够把图映射到一个多维 空间,但传统的Deep Walk算法节点智能是单一类型的节点,而且没有考虑节点之间的语义关系,而 这两点恰恰是产业、企业向量化必须要考虑的核心内容,为此我们对Deep Walk算法进行了改进,完 美的解决了多类型节点、复杂关系网络的向量化难点。

pdf文档 中数智源 李春华 知识图谱在产业分析领域的应用

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
中数智源 李春华 知识图谱在产业分析领域的应用 第 1 页 中数智源 李春华 知识图谱在产业分析领域的应用 第 2 页 中数智源 李春华 知识图谱在产业分析领域的应用 第 3 页
下载文档到电脑,方便使用
本文档由 路人甲 于 2022-08-13 07:03:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。