打破语音垄断,Mozilla Common Voice 支持更多语言

栏目: IT资讯 · 发布时间: 5年前

内容简介:Mozilla 宣布它正在使其众包项目 Common Voice 支持更多语言。 Common Voice 是一个旨在创建开源语音识别数据集的项目,于去年6月发布,它邀请来自世界各地的志愿者通过网络和移动应用程序,用他们的声音记录文本...

Mozilla 宣布它正在使其众包项目 Common Voice 支持更多语言

Common Voice 是一个旨在创建开源语音识别数据集的项目,于去年6月发布,它邀请来自世界各地的志愿者通过网络和移动应用程序,用他们的声音记录文本片段。

业内普遍认为语音将成为下一个重要的技术平台,近年来随着人工智能理论与技术的迅猛发展,语音识别技术在不断突破,通过语音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司将收集到的用户语音数据归为公司自己所有,这些数据的价值或许目前很难被外界看出来,但是在信息化高度发达,特别是今天这样一个大数据和人工智能时代,为开发机器学习模型提供语音数据集怎么看都是一件有深远意义的事,这些语音数据的意义会慢慢体现。而最终当它们的价值逐渐显现,人们会发现在这背后亚马逊、谷歌、苹果和微软等公司已经牢牢锁住了语音技术的命门,主导了这场语音市场之争。

Common Voice 项目就是为了避免这样的事情而诞生的,它的目的是将收集到的语音数据集开源给公众,使得任何人都可以自由使用这些数据集来将语音识别技术智能地构建到各种应用程序和服务中。Mozilla 已经在去年11月公布了 Common Voice 英语数据集的第一批成果,其中收录了20000个人录制的40万个录音、大约500小时的演讲。此次 Mozilla 又宣布它正式开始收集法语、德语和威尔士语三种语言的语音数据,同时也在为收集另外40种语言做准备,巴西葡萄牙语、印度尼西亚语、波兰语和荷兰语等已经准备好启动众包语音数据收集。

Mozilla 首席创新官 Katharina Borchert 在他的博客中写到:“我们希望用户使用自己的语言甚至方言的时候是可以被机器理解的,但是我们相信这些技术上的接口不应该由少数几家公司控制,他们不能像守门员一样来完全把控语音服务。”

Common Voice 项目的意义与用于打击私人平台的开放许可证项目类似,OpenStreetMap 就是一个很好的例子。OpenStreetMap 为开发者提供了开放且可自由使用的世界地图,使得开发商不再需要依赖于 Google Maps 这样的竞争对手,不仅降低了成本开销,技术上也不再受到限制。

“使用多种语言标志着 Common Voice 迈出了重要的一步,我们希望它对整体语音技术来说也是一大步”,Mozilla Common Voice 项目的数字策略师 Michael Henretty 补充到:“语音技术的民主化不仅会降低全球创新的障碍,也会让人们获取信息更加便捷。”


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

实战Java高并发程序设计

实战Java高并发程序设计

葛一鸣、郭超 / 电子工业出版社 / 2015-10-1 / CNY 69.00

在过去单核CPU时代,单任务在一个时间点只能执行单一程序,随着多核CPU的发展,并行程序开发就显得尤为重要。 《实战Java高并发程序设计》主要介绍基于Java的并行程序设计基础、思路、方法和实战。第一,立足于并发程序基础,详细介绍Java中进行并行程序设计的基本方法。第二,进一步详细介绍JDK中对并行程序的强大支持,帮助读者快速、稳健地进行并行程序开发。第三,详细讨论有关“锁”的优化和提高......一起来看看 《实战Java高并发程序设计》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具