专访丨文因互联CEO鲍捷:连接一切,建起金融数据的高速公路

栏目: 数据库 · 发布时间: 5年前

内容简介:新一代科技革命蓬勃发展,不断催生新的产业形态和商业模式。金融行业在历经电子化、移动化之后,也进入了金融与科技相结合的新阶段-智能金融时代。因为与数据高度相关,金融行业也一直被认为是人工智能落地最好、最快、最有商业价值的场景。2018年12月14至16日,由中国人工智能学会、永泰县人民政府主办,中国科学技术出版社协办的第二期全球高校《人工智能导论》师资培训班在福州永泰县召开。文因互联CEO鲍捷在现场带来了关于知识图谱的报告。会后,亿欧就智能金融和人工智能等相关问题专访了鲍捷。

专访丨文因互联CEO鲍捷:连接一切,建起金融数据的高速公路

新一代科技革命蓬勃发展,不断催生新的产业形态和商业模式。金融行业在历经电子化、移动化之后,也进入了金融与科技相结合的新阶段-智能金融时代。因为与数据高度相关,金融行业也一直被认为是人工智能落地最好、最快、最有商业价值的场景。

2018年12月14至16日,由中国人工智能学会、永泰县人民政府主办,中国科学技术出版社协办的第二期全球高校《人工智能导论》师资培训班在福州永泰县召开。文因互联CEO鲍捷在现场带来了关于知识图谱的报告。会后,亿欧就智能金融和人工智能等相关问题专访了鲍捷。

文因互联是一家智能金融解决方案提供商,主要利用自然语言处理和知识图谱技术,对金融数据进行结构化提取和智能化分析。整合金融机构内外部数据,从而利用银行、监管机构,基金证券等持有的海量数据,实现监管、获客、风控等场景的自动化。累计服务了招商银行、平安银行、南京银行、普华永道、天风证券等多家金融机构。目前,文因互联正在进行下一轮的融资。

知识图谱-催化剂、浓缩轴和打折卡

当我们谈到智能金融的技术基石时,更多的人会说机器学习、自然语言理解等,但很少有人会提到知识图谱。但是在众多的智能金融应用场景中,如智能风控、智能投顾、智能投研、智能监管等,很多时候都是机器学习和知识图谱共同发挥作用的结果。

知识图谱最早由Google公司在2012年提出。从学术的角度,我们可以对知识图谱给一个这样的定义: 知识图谱本质上是一种叫做语义网络的知识库 。从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图。

鲍捷从1998年开始从事人工智能方面的研究,主要聚焦在语义网/知识图谱。鲍捷表示,他对具体算法过程不感兴趣,如何解决问题才是他的兴趣所在。他本人有个穷尽一生想要解决的目标,那就是将世界所有的知识联系在一起,而知识图谱能帮助他完成这一目标。

知识图谱可以说是一种应用于诸多人工智能相关领域的关键技术,它主要应用于数据结构化处理、解析、关联和后续的分析与推理。按照鲍捷的话说, 知识图谱是一种催化剂,浓缩轴和打折卡。一方面它能加速价值的产生,在数据聚合中产生新的数据,例如本体映射;另一方面它可以提炼大量知识和数据,是一种流动性好,摩擦力特别小的数据,例如百科数据;它同时也是能降低成本,利用先验知识大幅提高价值的数据,例如基因本体。

“目前国内做智能金融的企业主要聚焦在智能投顾和智能投研方面,人工智能应用在金融行业应用的切入点不应该是这样的。”鲍捷表示,我们所讲的金融大工业化,增强的不应该只是一两个人的能力,而是多人协作的能力。 它的核心问题是如何实现金融知识结构的沉淀和业务流程的自动化。

这个难点在于怎样做到用机器理解文档,并且让机器理解金融知识。前一项技术涉及自然语言处理技术,后一项技术涉及知识图谱技术。文因互联所做的事情就是结合这两项技术,在金融行业进行落地。这就要求企业具备全链条的数据结构化能力,包括财务报表的公开化提取能力,还有公告、研报、法规的解析,解析后再进行实体链接,映射到知识图谱上,之后是规则建模与推理、语义搜索、自然语言问答。

鲍捷告诉亿欧,希望能在5年时间内,在所有的金融机构、政府、研究机构间构造出一个巨大的近乎实时的数据分发网络,即“金融数据高速公路”,加快各金融机构间的信息流通速度。

实现AI,不一定需要先了解人脑

历史上,人工智能经历了三起两落。鲍捷表示,未来30年,人工智能会也会继续呈现这种上下波动的趋势。但是这次的热潮肯定跟前几次的不一样,鲍捷给出了以下几点理由:

首先,AI已经结合很多具体场景落地到产业上,有些行业已经创造了几十亿的产值;其次,从投资上看,之前的AI发展主要靠政府和军方在做支撑,而这次资本的入驻已经给AI的发展提供了大量的助推器;此外, 工智能的发展,离不开其他技术的支持,如大数据、云。举个简单的例子,假设我们想造一辆车,光拥有AI这么一块内燃机是不够的。云、大数据、运维系统,这一整套相当于我们车的轮子,传送机制,保险机制。只有结合这些东西,才能造出一辆车,在公路上飞速驰骋。

“我们现在的AI就好像一个破破烂烂的车子,经常漏气漏油,但起码还能用。”鲍捷笑着说道。

事实上,现在在人工智能领域已经产生了一条特别长的产业链条。比如上游有上百万的数据标注师,下游有各种各样的应用场景。一个产业的成熟一定是建立在产业链完善的基础上的。任何行业都会存在泡沫,AI继续崩盘的情况也有可能会出现。但是当浪潮退去,剩下一地鸡毛后,能留下来的都是人才,都是好的企业。

现在很多人都认为要实现AI,需要建立在先了解大脑机制的基础上。鲍捷并不赞成这样的观点。举个简单的例子,飞机飞上天时,我们还没有空气动力学这样的理论;在内燃机出现的时候,也还不存在热力学这一理论。AI也是如此。 只有当产业界做出产品并开始盈利后,才能形成持续回馈科学的机制,带动学界去给我们解释为什么,然后再靠科学带我们冲出这片“无人区”。

“产业界讲究成本。工程师们往往需要混合使用几百种方法,去不断地试错来完成项目,就像用浆糊把各种零件贴在一起一样。在缺乏足够理论知识下,我们今天做的事跟当年的阿波罗登月项目差不多,就是要用落后的技术实现20年后的效果。”鲍捷说。

专访人物

鲍捷,文因互联CEO,联合创始人。研究领域涉及人工智能多个方向,如自然语言处理、语义网、机器学习、描述逻辑、语义维基、上下文建模、语义信息论、规则语言、封闭世界推理、策略建模、语义数据集成、模块化本体、协作本体构建、网络隐私保护、神经网络、数据挖掘和图像识别等。在International Joint Conferences on Artificial Intelligence(IJCAI)、International Semantic Web Conference (ISWC)、Extended/European Semantic Web Conference (ESWC),和Asian Semantic Web Conference (ASWC)等期刊和会议上发表70多篇论文。曾任W3C OWL(Web本体语言)工作组成员,在此期间,合作撰写了OWL2的W3C规范文档。先后参与组织50多场国际学术会议和学术研讨会,并任中国中文信息学会语言与知识计算专业委员会委员、W3C顾问委员会委员、中国计算机协会会刊编委,中文开放知识图谱联盟(OpenKG)发起人之一。

版权声明

凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

程序员2010精华本

程序员2010精华本

程序员杂志社 / 电子工业 / 2011-1 / 49.00元

《程序员(2010精华本)》主要内容:《程序员》创刊10年来,每年末编辑部精心打造的“合订本”已经形成一个品牌,得到广大读者的认可和喜爱。今年,《程序员》杂志内容再次进行了优化整合,除了每期推出的一个大型专题策划,各版块也纷纷以专题、策划的形式,将每月的重点进行了整合,让内容非常具有凝聚力,如专题篇、人物篇、实践篇等。另外杂志的版式、色彩方面也有了很大的飞跃,给读者带来耳目一新的阅读体验。一起来看看 《程序员2010精华本》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具