Apple Machine Learning Journal 21 November 2018

栏目: 数据库 · 发布时间: 5年前

内容简介:这篇博客解读了Apple公司的机器学习博客里的文章。 https://machinelearning.apple.com/图像识别领域里,模型训练的一个困难点在于缺少足够多的具备label的真实图像数据集。生成合成图像样本是一个方法,但是对合成图像的质量有较高要求,必须要足够接近真实样本的分布,否则将会误导模型训练的走向。这篇文章设计了一种方法来提高合成图像的质量,使得模型在真实应用时具有满意的泛化能力。Improving Neural Network Acoustic Models by Cross-b

这篇博客解读了Apple公司的机器学习博客里的文章。 https://machinelearning.apple.com/

Improving the Realism of Synthetic Images

图像识别领域里,模型训练的一个困难点在于缺少足够多的具备label的真实图像数据集。生成合成图像样本是一个方法,但是对合成图像的质量有较高要求,必须要足够接近真实样本的分布,否则将会误导模型训练的走向。这篇文章设计了一种方法来提高合成图像的质量,使得模型在真实应用时具有满意的泛化能力。

Improving Neural Network Acoustic Models by Cross-bandwidth and Cross-lingual Initialization

语音识别领域里,同样缺乏特定语言下的标签样本数据。这篇文章设计了迁移学习方法,从训练好的另一种语言的Acoustic Model迁移数据。

Inverse Text Normalization as a Labeling Problem

语音转文字领域里,inverse text normalization (ITN)是要把语音转文本时遇到的日期、时间、地点、价钱等内容以合理的形式显示出来。这篇文章把这一个问题当做Labeling Problem,用统计学模型来解决。

Deep Learning for Siri’s Voice: On-device Deep Mixture Density Networks for Hybrid Unit Selection Synthesis

人声语音合成领域里,有两种技术,unit selection synthesis 和 parametric synthesis。unit selection synthesis在具备足够多的高质量素材的情况下能够提供高质量的输出。parametric synthesis在具备少量素材的情况下能够提供流畅易懂的输出。hybrid system指的就是两者的结合,使用parametric approach来进行unit selection,称作Hybrid unit selection methods。这篇文章介绍了使用深度学习技术为Siri实现更自然的语音合成。

Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters

在手写输入识别中,汉字等符号类文字的识别可以借助深度学习达到极高的准确率。

Hey Siri: An On-device DNN-powered Voice Trigger for Apple’s Personal Assistant

语音识别领域里,Siri支持的hey siri功能需要一个小的speech detector来持续接收声音并处理。它的要求是要以最低的功耗监听和识别出hey siri这个词。

An On-device Deep Neural Network for Face Detection

人脸识别技术,已经被应用到手机设备上,无需依赖网络服务器。在Apple的图像架构基础API中CIDetector提供了人脸识别功能,可以用所有APP调用。早期的版本使用的是Viola-Jones算法。这篇文章介绍了如何利用深度学习方法实现更好的效果。

Learning with Privacy at Scale

移动设备为了提供更好的使用体验,需要收集用户的使用习惯数据。为了在数据收集和隐私保护之间平衡折中,这篇文章设计了一套学习系统。

Personalized Hey Siri

人声识别时语音识别中的一个分支。speaker recognition的核心目标不是判断语音的内容是什么,而是要判断是不是目标人物的声音。

Finding Local Destinations with Siri’s Regionally Specific Language Models for Speech Recognition

语音识别领域里,Siri借助地理位置信息来增强语音识别的效果,因为许多语音素材,比如地名,和地域范围有一定联系。

Can Global Semantic Context Improve Neural Language Models?

输入预测是NLP的一个应用场景,苹果设备中的QuickType keyboard支持在多种App下进行输入预测。本篇文章介绍了其所使用global semantic context来训练word embedding和NLP model。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

微交互

微交互

塞弗 (Dan Saffer) / 李松峰 / 人民邮电出版社 / 2013-11-1 / 35.00元

平庸的产品与伟大的产品差就差在细节上。作者Dan Saffer将通过这本书展示怎么设计微交互,即位于功能之内或周边的那些交互细节。你的手机怎么静音?你怎么知道有新邮件了?怎么修改应用的设置?诸如此类的交互细节,既可以毁掉一个产品,也可以成就一个产品。高效而有趣的微交互 ,涉及触发器、规则、循环和模式,还有反馈。透过书中生动、真实的设备及应用示例,读者将理解微交互对于塑造产品个性、赋予产品卖点的重要......一起来看看 《微交互》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具