你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

栏目: 软件资讯 · 发布时间: 5年前

内容简介:一只不停地变换姿势,都能

圆栗子 发自 凹非寺

量子位 报道 | 公众号 QbitAI

一只 手势识别AI ,怎样才算得上 (优) 秀啊?

不停地变换姿势,都能 实时输出Emoji ,大约是很秀了:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

:vulcan_salute:是守卫 (误) ,是来自《星际旅行》瓦肯的举手礼。不大常用,做起来甚至有难度。

是好运,一般会两只手一起比。不过,也不是人类通用的手势。

即便这样,AI依然机智地识别出来。并且, 它是在浏览器上跑,也几乎没有延时

AI的爸爸,名字叫Nick Bourdakos (简称“尼克”) ,是来自IBM的程序猿。

尼克把自己的调教成果发了推特,揽下 2.8万赞

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

666

尼克用的是 TensorFlow.js ,实时识别毫无压力。

他把算法 开源 了,说大家都可以试一试。

半小时就好

尼克说这个模型很简单,就是 SSD-MobileNet

MobileNet是分类,SSD是目标检测,搭配食用也是常规方法。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

他是用IBM云上的GPU训练的, 免费的k80 ,半小时就训练好了。

在训练开始之前,要先准备数据:AI吃的是 标注过的手势图

准备就绪,就来安装模型吧:

1$ npm install -g cloud-annotations

然后,可以开始训练了:

 1$ cacli
2┌─────────────────────────────┐
3│ (C)loud (A)nnotations (CLI) │
4│ version 1.0.12
5└─────────────────────────────┘
6
7Usage: cacli <command>
8
9where <command> is one of:
10 init Interactively create a config.yaml file
11 train Start a training run
12 logs Monitor the logs of a training run
13 progress Monitor the progress of a training run
14 list List all training runs
15 download Download a trained model
16
17cacli <cmd> -h quick help on <cmd>

当然,也不是非要用IBM云,也不是非要用GPU。拿 CPU 也能调教AI,大概要几小时吧。

训练完成,该在浏览器上跑了。GitHub项目里,自带了转换为TensorFlow.js模型的脚本。

把模型添加到 React App 里面。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

最后,写一句nmp start,用浏览器打开 http://localhost:3000

耶,这样就可以对着屏幕随意舞动手指了,你的AI会明白的:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

当然,这只机智的AI,才不是只能识别手指。

喝点什么

只看你用什么样的数据去投喂AI了。

曾经,尼克就帮AI修炼了分辨汽水的眼力。

第一题:一瓶雪碧,一瓶Canada Dry,都是绿色。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

不管调换位置、还是侧过瓶身,AI都不会被迷惑。定格一看:

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

第二题:加大难度,两瓶都是Mountain Dew,一瓶普通一瓶低糖。

AI依然分得清楚,毫不犹豫。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

分辨手势,分辨汽水,都不失水准。

那么问题来了, 你想让AI识别什么呢?

想好了就开始调教吧,代码在这里:

https://github.com/cloud-annotations/training/

P.S. 推特评论区,已经有小伙伴亲测成功,并表示Easy。

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

再把识别结果,显示成Emoji就完美了

— 完 —

小程序|get更多AI学习干货

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;

欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

量子位  QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

UCD火花集

UCD火花集

UCDChina / 人民邮电出版社 / 2009 / 25.00元

本书收集了UCDChina上线以来推出的13个话题,内容涵盖了产品设计的全部流程,按顺序集结到第一到第十三章中,讨论了如何研究用户、如何将用户需求应用到产品设计中、如何传达和协作。在第十四章,几位设计师分享了生活中的UE故事。第十五章,列举了一些实例和实践者的观点。本书适合有一定工作经验,从事产品设计、产品策划、交互设计、视觉设计、用户研究、前端开发、网站运营,以及所有与互联网有关的从业人员阅读。一起来看看 《UCD火花集》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

URL 编码/解码
URL 编码/解码

URL 编码/解码

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具