地址: 深圳湾科技生态园5栋D座1302室
客服电话: 4008400488
邮箱: bd@rainxn.com
墨客星球
友情链接
© 2019 深圳雨本信息技术有限公司 | 粤ICP备17123203号 | 网站建设:中企动力 深圳
联系我们
知识图谱如何赋能金融?
知因智慧正式成立于2016年4月,是一家基于金融行业大数据和知识图谱的金融科技公司。
伴随着AI时代的到来,知因智慧针对高度依赖专家个人能力的匠人时代产品的劣势,提出了一种全新的解决思路——模型工厂。模型工厂基于高效的自助建模平台与数据的封装标准化治理、特征参数的多种成熟泛化应用,令大规模高效率的模型算法应用,不再完全依赖建模专家的经验,形成一整套在数据处理、模型训练、参数调用及场景化应用等方面均已成熟的解决方案。
截止目前,知因智慧已经积累5000万企业数据、2000+标签、200万事件数据、100+模型。这些模型涵盖公司金融、零售金融、小微金融、供应链金融等业务领域,聚焦客户洞察、智能营销和智能风控等专题,通过提供如下模型类别来帮助金融机构快速提升业务决策能力:企业关联洞察、产业链洞察、智能风控、反欺诈、智能营销、智能小微信贷、智能供应链金融、事件分析;并提供四种交付方式以满足金融机构的多样化需求:模型开箱即用、模型+专业服务、模型组合+项目制服务、内容流量服务。
另外,公司创始人任亮先生也非常值得一提:
任亮毕业于中科院大学软件工程(金融数据挖掘方向),对于金融大数据风控等领域有着二十余年的经验,也是中国银行企业风险预警系统最早的一批建设者。
他是知识图谱、金融风险领域的资深专家,历任中国科学院教授、中国科学院大数据实验室副主任等职务。2006年,曾作为核心成员参与银监会客户风险预警工程,创建了奥斯卡模型并成功预警了100多个类“德隆系”风险事件。2009 年,任亮将这个方法商业化,在国内五家大型金融机构启动,同时在学术上把这种方法总结成基于企业关联关系和现代行为的一种全新方法。半年内这套风险模型筛选出的前500名高危客户,发生风险涉及金额达到121.7亿元。2012 年,任 IBM GBS全球企业咨询服务部EMM解决方案负责人,带领研发了一系列金融风险以及营销模型和解决方案。
近日,我们梳理了任亮先生的一些精彩观点。
AI如何赋能金融?
任亮:赋能金融,首先要看给谁赋能,用什么手段,解决什么问题。
概括来讲,赋能的对象一端是产业,分为对公和对个人,他们需要的是精准的金融服务;另一端是金融,包括做信贷、做资管和做投资等繁多的金融业态,他们需要的是质地良好的资产。使这两端充分地连接就意味着两端都需要被赋能。
在知因智慧看来,赋能的手段就是产业知识图谱。首先将产业的要素识别出来,如集团内各企业间的关系;企业的担保链、供应链关系;企业和消费者之间的经济往来等都是产业知识图谱涵盖的范围。把这些依据于不同关系的形态链条打通,利用大数据定量描述,寻找他们的画像,再通过机器学习,计量他们之间的关系和影响,帮助金融机构更好地识别风险和获取客户。作为赋能的核心手段其涵盖大数据,人工智能,云服务,用知识图谱的方式呈现。其目的是把交易方的风险或商机显示出来,帮助金融机构判别,更好地了解交易对手,继而提升他们对产业的金融服务水平。另一方面,金融的本质就是通过风险进行获利,这个过程中被赋能的两端都是获益的。
金融场景该如何应用知识图谱?
任亮:在这个体系之下,最底层是3K平台,KW、KE、KG,这是知识图谱的三个核心组建。KE解决的是知识的进化过程,是包含AI算法的建模平台;KG是知识可视化平台;KW是核心的知识仓储,我们一直在采集大数据,但这些数据如何能够变成我们场景所需要的核心体系,在这里面我们叫知识仓储。举一个例子,比如说这里有实体库、关系库、标签库、事件库、语料库等等。
我们以前识别一个人或者企业的时候需要分析它的ID,但如果没有ID该怎么办,怎么判断它是同一个企业?比如说IBM,IBM是一个简称,2016年大裁员是一个风险事件,而我们银行记录的是国际商业技术有限公司,这是一个全称,这两个词不匹配就不能纳入模型变量里,实体库就是解决这个问题。很多这样的内容我们把它打包在一起叫做知识仓储,通过这些支撑来建立客户谱系,我们把原来那些孤立的个体变成一个网络,包括产业谱系,客户谱系还有它的画像以及事件,原来我们看风险舆情,是客户经理自己去辨别,现在我们用机器能够读懂舆情,能够把舆情纳入到风险变量里,整个体系我们称之为AI盒子,通过AI盒子我们把这些工作整合在一起,赋能给公司金融、小微金融、风险管理、大资管、大零售等具体场景。
知识图谱与深度学习的区别?
知识图谱,就是AI领域里的系统网络。AI有很多细分方向,为人熟知的“深度学习”,只是AI五个方向中的一个流派。知识图谱是符号流派,但是在金融行业这种高度知识密集型的产业里,知识图谱是更加契合的技术方向。知识图谱融合了AI算法、复杂网络、自然语言处理、深度学习、集成学习等等很多技术,集合成一个系统。,
人工智能、云计算和产业知识图谱的基础是大量数据,与金融机构相比,金融科技公司在数据使用方法上有何不同?
任亮:产业知识图谱的数据分散在政府,金融市场,互联网,企业以及金融机构的内部,包括企业的工商数据、企业在金融市场的表现数据,与企业发生投资担保等重大关系的关联企业的数据以及金融机构的交易数据等。过去这些数据都是孤立的,由于数据可得性的不同,不同机构的数据使用者只能依靠某个领域的数据来做决策。产业知识图谱本身是网状的,是整合碎片化数据的有效手段。它把目前相对公开且没有法律问题的各类数据收集整合,再用知识图谱进行串联,使得这些数据不再是孤岛,呈现出更多的信息。
过去金融机构的做法是对数据进行简单的购买和整合,很难完整地识别;而除了数据本身,还要识别集团客户或系客户各种复杂的显性和隐性的规则和关系。如果金融机构不在全网和全量的企业数据中利用先进的手段分析,是无法得到完整的穿透性的链条,但是同样的数据经过产业知识图谱的处理就会产生不同的结果。
金融机构进行自我赋能来提高自身能力可行性如何?
任亮:金融机构自我赋能存在很多壁垒,比如数据壁垒,规则和技术上的壁垒,业务壁垒等。对大型金融机构,会努力自建这个能力。但更多的金融机构需要的可能是一个拿来即用的产品,而不是从零开始研发。此时产业知识图谱是最好的手段,将信息关联性显性地呈现出来。
金融方面我们其实一直在学习西方,同时也落后于西方,但是从产业知识图谱这个角度来看,中国反倒走在前列,为什么?
任亮:因为我们有自己的现实问题,也有自己的独特条件,我们面对的现实问题是中国的企业关系网络高度复杂,而且风险频发,比如说十年前德隆系风险事件发生后造成了连锁性风险蔓延,所以这是我们面对的问题。另外我们中国的数据又比较集中,因为我们有强势的政府和监管,政府会收集大量的跨领域的数据,这为我们建模型创造了条件。