金融科技领域的自然语言交互技术应用

栏目: 编程工具 · 发布时间: 5年前

REAL MAN :最近600570股票怎么样?

机器人 :近一月,市场对600570关注度强,走势强于大盘,强于行业。

REAL MAN :are you ok?

机器人 ::musical_note:~III mean 粉丝们, are you ok?

REAL MAN :我离火星的距离有多远?

机器人 :很远很远…

…… 

从感到新奇却又伸回手,到了解之后充满怀疑,再到现在几乎人手一台、网络各路大神测评的盛况,基于自然语言交互的 智能音箱和机器人 是否正式迎来了它的春天?

金融科技领域的自然语言交互技术应用

业内知名财经主持机器人晓鲸的研发者——鲁建凡,近日作为恒生“金融科技”专题讲师,以业内人的角度,带我们深入智能语音交互领域的核心技术以及在金融科技领域的场景应用。

会话式的交互体验的兴起

目前,生活中不同场景越来越多地出现了会话式的智能交互体验,大家最熟悉的语音助手——SIRI,就是典型的例子,用户可以通过会话式的自然语言交互进行天气、日程等信息查询,资料检索等应用交互。支持购物的智能语音助手 ALEXA,支持金融投资资讯问答的晓鲸机器人。甚至一些科幻电影也对未来进行了畅想,诸如一些机器人角色的设置:Jarvis——钢铁侠的机器人助手,NS-5美国USR公司的超能机器人,他们可以充当人类的助手,无论是提取信息或者是执行命令。

在这些现实应用场景里,基于智能音箱服务的自然会话购物过程中,商品推荐过程更加直接,可能会削弱大品牌商的影响力。同样,在金融服务的场景中,基于自然语言会话的交互模式让用户通过更加简单的方式访问金融服务,提升用户体验。因此, 会话式的交互体验(Conversational User Interface, CUI),有可能成为新一代人机交互方式。

自然语言理解

在会话式交互过程中,从语音识别到语言的理解以及整个对话状态的管理和最后答案的生成,构成了整个问答服务的基本架构。在这个架构中,有一部分叫做 自然语言理解

金融科技领域的自然语言交互技术应用

自然语言理解现在有很大的挑战,一个是 语音识别的成功率 ,比如很多人说话,对于拾音的效果造成非常大的干扰,会对语音识别造成很大的困扰。第二是 语义环境的不确定性 ,不同场景下,同样的语言含义是不一样的,同样是“谈谈对今天大盘的看法”,上午9点可能问的是研判,傍晚6点问的是总结。第三个是 口语化表达环境下,重复、停顿、叠词、语气词 等会给我们后面的语言理解带来非常大的困难。

语音转化成文字的过程中,有大量的转换错误。即使是在文字输入过程中也会出现各种问题,大家使用过各种拼音输入法,有的时候输入太快、输入法推荐等也会很容易造成同音、近似音词语的输入错误(据统计这类错误大于6%),我们需要用 预处理 的模块把噪音处理和计算。

在命名实体识别过程中, 除了使用RNN、biLSTM这些模型和语料训练调优之外,如何利用现有金融领域里面存在大量的结构化资讯信息,也有很多讲究。可以通过维护好这些高质量的实体数据,来帮助提升实体识别准确率。 在意图识别过程中 ,所以我们也会用SVM、CNN等分类模型,把用户的问题定义到子领域,子领域用优选的方法来具体细分。

SVM模型

金融科技领域的自然语言交互技术应用

支持向量机(support vector machine,SVM),通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

SVM在很多诸如文本分类,图像分类,生物序列分析和生物数据挖掘,手写字符识别等领域有很多的应用,但SVM可以成功应用的领域远远超出现在已经在开发应用了的领域。 一个文本分类系统不仅是一个自然语言处理系统,也是一个典型的模式识别系统,系统的输入是需要进行分类处理的文本,系统的输出则是与文本关联的类别。

CNN模型

金融科技领域的自然语言交互技术应用

卷积神经网络CNN用于图像识别时就是一层一层把图片的信息都抓取出来,从局部的颜色,到全局的轮廓,逐层抓取。

局部条件不足下的歧义消解

比如恒生等权重指数, 切词优先级 的差别对语义理解的影响也非常大。比如星期六好想你,做股票的可能知道,好想你是卖枣子的,星期六是卖鞋子的,如果放在某一个特定的领域里面或者是不同的环境下面说个话,传递信息的差别非常大,这里也会影响到用户体验,所以,区分歧义,是 真歧义还是假歧义 也尤为重要。因此,需要有专门的语义计算逻辑来做区分理解。

在app应用环境中可以有一些辅助手段提升意图识别率。大家经常看到一些输入的联想,通过这个联想提示可以避免一些输入性错误;也可以加一些问题选项卡或者是引导卡,我们统计下来通过这一类操作可以非常高地提升准确率,但是这里面也有负面的影响,很多时候也会屏蔽掉用户想要问的问题,这里需要做一些平衡。

科技进步可以分为两类,一类是委屈的,一类是不委屈的。区别在于:前者是大众期望走在科技进步前面;后者是大众期望走在科技进步后面。

聊天机器人属于很委屈的一类——因为所有人都知道一个好的聊天机器人应该是什么样的。自1950年被图灵提出,聊天机器人就成为了人类对于人工智能的“终极想象”。从《星球大战》里可爱而话痨的C-3PO,到《钢铁侠》里堪称全能助手的Javis,再到电影《Her》中有着寡姐声线和近乎完美设定的Samantha——人类对于聊天机器人一开始就直盯着结局,相比之下,现实中无论哪款聊天机器人都越看越像“人工智障”。

智能语音交互还有很长的路要走,但是外界的眼光和过高的期望不能阻止研究者的脚步,终有一天,你的机器人会通过数据的方式比所有人更懂你。

金融科技领域的自然语言交互技术应用

推荐阅读:

NLP:人工智能的诗与远方

深度学习丨追踪川普、随机应变?这个AI市场预测有点皮

失落的alpha宇宙


以上所述就是小编给大家介绍的《金融科技领域的自然语言交互技术应用》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Python编程实践

Python编程实践

Jennifer Campbell、Paul Gries、Jason Montojo、Greg Wilson / 唐学韬 / 机械工业出版社华章公司 / 2011-12-31 / 49.00元

Python是当今世界流行的编程语言之一。本书共15章,通过一些短小精悍的交互式Python脚本帮助学生进行练习,并在这个过程中掌握诸如数据结构、排序和搜索算法、面向对象编程、数据库访问、图形用户界面等基本概念以及良好的程序设计风格。本书既是一本注重科学的计算机科学专业教材,也是一本目标明确的Python参考书。 本书语言风格言简意赅,图表丰富,简单实用,是一本优秀的Python入门级读物,......一起来看看 《Python编程实践》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具