谷歌开源人工智能图像识别模型和 VR 音频工具

栏目: IT资讯 · 发布时间: 6年前

内容简介:谷歌近日宣布开源两个重要项目:一个是谷歌最新的语义图像分割人工智能模型 DeepLab-V3+,另外一个是谷歌的空间音频 SDK——Resonance Audio。 “语义图像分割”指计算机识别照片或者视频中多个物体并用自然语言命...

谷歌近日宣布开源两个重要项目:一个是谷歌最新的语义图像分割人工智能模型 DeepLab-V3+,另外一个是谷歌的空间音频 SDK——Resonance Audio。

谷歌开源人工智能图像识别模型和 VR 音频工具

“语义图像分割”指计算机识别照片或者视频中多个物体并用自然语言命名的过程。例如谷歌自家产品Google Photo不仅能够发现照片中的狗狗图像,还能够正确地将其标注为“狗”。在官方技术博客中,Google指出Pixel2的单镜头人像模式也适用该技术,但是Google表示DeepLab-V3+并未在Pixel2的拍照技术中应用。

Resonance Audio是Google去年发布的空间音频SDK,直到上周三才得以开源,该技术利用位置数据和声音过滤器在VR或AR应用中提供定位准确逼真的环绕立体声效果。Google在博客中指出,Resonance Audio将帮助开发者在移动端或桌面创建体验更棒的VR或AR应用,并且该SDK已经在《星战:绝地武士挑战》这个APP中得到应用。

上述两个 工具 的链接如下:

DeepLab-V3+ 、 Resonance Audio

来自:IT 经理网


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

算法概论

算法概论

Sanjoy Dasgupta、Christos Papadimitriou、Umesh Vazirani / 钱枫 注、邹恒明 注 / 机械工业出版社 / 2009-1 / 55.00元

《算法概论(注释版)》源自加州大学伯克利分校和加州大学圣迭戈分校本科生的算法课讲义,以独特的视角展现了算法设计的精巧技术及魅力。在表达每一种技术时,强调每个算法背后的简洁数学思想,分析其时间和空间效率,运用与其他技术类比的方法来说明特征,并提供了大量实例。《算法概论(注释版)》以人类最古老的算法(算术运算)为起点,将各种算法中优美而有代表性的内容囊括书中,并以最前沿的理论(量子算法)结束,构成了较......一起来看看 《算法概论》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

在线进制转换器
在线进制转换器

各进制数互转换器

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具