本帖最后由 yingliu 于 2019-4-19 16:28 编辑
语音识别技术正在改变我们与机器进行交互的方式,不过目前可供使用的系统都相当昂贵并且是专有的技术。
为此谋智基金会(Mozilla)目前已经推出 Common Voice 项目,旨在让语音识别技术变得更好也能免费使用。
项目依靠全球用户捐赠的语音数据库可以让任何人或开发者快速轻松地训练出能够识别任何语音的应用程序。
此外作为配套设施谋智基金会还在构建名为 Deep Speech 的开源语音识别引擎且同样是为所有人免费使用。
为什么项目如此重要:
对于人类来说说话依然还是我们相互沟通最自然的方式,而语音技术将这种方便感带到计算机和移动设备上。
谋智基金会希望开发者能够打造效果极好的语音识别程序,比如实时翻译器和语音数字助理类应用程序等等。
但此时大多数打造这类应用所必须的语音数据都是私有且昂贵的,我们希望收集的数据能够满足开发者需求。
项目地址:
贡献语音: https://voice.mozilla.org/zh-CN/speak 判断语音: https://voice.mozilla.org/zh-CN/listen
需要你贡献中文语音集:
现在谋智基金会正在全球发起号召邀请用户参与项目构建,用户只需按示例读出屏幕上的文字进行提交即可。
目前中文语音集也在收集中,如果你觉得你的口音不标准也没关系,语音识别也需要不同的口音来加强判断。
与英语系相比国内目前参与项目的用户并不多,所以需要更多用户录制语音为项目提供足够使用的中文语音。
也可以帮助进行人工识别:
如果你不想录制自己的语音的话也可以参与项目,将其他社区成员贡献的语音进行人工识别判断是否准确等。
目前中文语音集也已经有不少语音片段,单纯靠机器识别的准确率并没有那么高,所以需要你帮助辅助判断。
只需要前往项目网站播放语音片段然后与对应的文字内容核对即可,判断完成后点击是或者否提交判断结果。
原标题:谋智基金会邀请你参与开源语音数据库项目贡献自己的声音
本文来源 蓝点网 ,由 山外的鸭子哥 整理编辑
以上所述就是小编给大家介绍的《Mozilla 邀请你参与开源语音数据库项目贡献自己的声音》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 数据堂开源1505小时中文普通话语音数据集
- 开源声码器 WORLD 在语音合成中的应用
- 1400 小时数据,Common Voice 成最大开源人类语音数据集
- 1400 小时数据,Common Voice 成最大开源人类语音数据集
- 资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳
- 绝佳的ASR学习方案:这是一套开源的中文语音识别系统
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
About Face 3 交互设计精髓
Alan Cooper、Robert Reimann、David Cronin / 刘松涛 / 电子工业出版社 / 2008-11 / 72.00元
本书是一本数字产品和系统的交互设计指南,全面系统地讲述了交互设计过程、原理和方法,涉及的产品和系统有个人电脑上的个人和商务软件、Web应用、手持设备、信息亭、数字医疗系统、数字工业系统等。运用本书的交互设计过程和方法,有助于了解使用者和产品之间的交互行为,进而更好地设计出更具吸引力和更具市场竞争力的产品。 全书分成3篇:第1篇描述了“目标导向设计”,详细讨论了用户和设计的过程及思想;第2篇讲......一起来看看 《About Face 3 交互设计精髓》 这本书的介绍吧!