阿里巴巴 NLP 新进展:隔离场景噪音,提取清晰目标声音

栏目: 编程工具 · 发布时间: 5年前

阿里巴巴数据科学研究所 (Alibaba Institute of Data Science) 近期在进行一项研究,该项目希望在嘈杂环境下进行语音识别,比如在拥挤的地铁系统或会议中心里,通过隔离噪声,从而获得目标对象清晰的声音。

阿里巴巴的解决方案一部分依靠硬件,一部分靠软件:通过一个远场麦克风阵列和复杂的深度学习算法在人群中隔离声音,大幅降低错误率。

相比之下,“最好”的语音识别技术单靠麦克风阵列才能达到 84% 的准确率,而阿里巴巴表示,他们的模式准确率在说话人口音很重的情况下,仍可以保持在 94% 至 95% 之间。据了解,这一技术已经被部署在上海的一个语音地铁售票系统中,阿里巴巴正在考虑将其推广到更多城市。

语音并不是阿里巴巴唯一研究的领域。利用自然语言处理,在云端实时执行自动翻译,让来自俄罗斯、马来西亚等国的阿里巴巴零售客户可以用母语与客服进行对话,也是阿里巴巴研究的项目之一。阿里巴巴的客服中心每天都会接到数以万计的呼叫,他们也正在利用算法处理其中的一部分工作,名为 Alime 的智能客户服务引擎就是这一研究的成果。

Alime 就像谷歌的 Duplex 系统一样,可以进行电话交谈,回答基本问题不需要人工参与。在聊天环境中,它还能够从客户提供的文档中自动提取文本和图像。

自然语言处理技术的应用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市场上,阿里巴巴部署了一款定价机器人,可以与买家谈判,以确定价格。

这款机器人的开发并非易事,它需要学习谈判策略和有效的生成文本的方法,以激励反复谈判。但最终取得的效果还是不错的:应用这款机器人的用户比其他人的成交率高出 20%。

该项目负责人表示:大多数用户不是专业卖家,不清楚应该如何定价,也不清楚如何与买家沟通,这款机器人可以很好地解决这个问题。

原文链接:

https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

JavaScript

JavaScript

Douglas Crockford / Yahoo Press / 2008-5 / GBP 23.99

Most programming languages contain good and bad parts, but JavaScript has more than its share of the bad, having been developed and released in a hurry before it could be refined. This authoritative b......一起来看看 《JavaScript》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

在线进制转换器
在线进制转换器

各进制数互转换器

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换