+AI场景,3步懂图像识别产品

栏目: 编程工具 · 发布时间: 5年前

内容简介:本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。我们正处于各种图像识别的场景里,你去某些生鲜超市不用手机可以实现刷脸支付,去银行ATM机不用卡片可以刷脸取现,在很多城市的许多十字路口没有交警但是你如果违规驾驶你的车辆被AI摄像头识别的清清楚楚等等场景里均有机器视觉的应用图像识别的产品应用。

本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于 Python 语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。

+AI场景,3步懂图像识别产品

我们正处于各种图像识别的场景里,你去某些生鲜超市不用手机可以实现刷脸支付,去银行ATM机不用卡片可以刷脸取现,在很多城市的许多十字路口没有交警但是你如果违规驾驶你的车辆被AI摄像头识别的清清楚楚等等场景里均有机器视觉的应用图像识别的产品应用。

本文不复述图像识别在安防、金融、旅游等方面的产品应用过程,本文仅仅用AI子任务图像识别技术来看AI产品实现的过程,为啥AI产品要懂实现过程?

因为目前的AI处于快速发展时期,无论是对AI产品、AI技术还是AI从业相关的AI爱好者,在AI快速发展的时期跟随AI技术懂AI产品的实现过程是非常有意义的事情。

因此本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。

一、首先实现 工具 介绍

语言:Python

产品开发工具平台:下载某度AI项目下的SDK

产品开发设计工具:Tkinker,Python的GUI设计工具有Tkinter,Wxpython,PyQt 等各有优缺点。Tkinter是 Python自带的标准GUI 库,安装Python 后直接使用 Tkinter,不需额外安装,使用前用 from tkinter import*导入 tkinter。第三方 GUI界面设计后经过转换成Python语言才可使用。

产品开发的关键技术:

设计产品是,利用Tkinter技术开发GUI界面,基于某度AI提供的开源技术,实现5个功能:人脸检测、动物识别、植物识别、车型识别、文字识别。用户选择图片后,单击对应的按钮,获得识别结果,其中文字识别的结果以 txt形式保存在硬盘上,其余结果显示在窗体上。

某度AI结果抓取:

某度AI提供的结果信息量大,用户需要对其中数据进行抓取。下列代码对某度人脸检测功能颜值结果进行抓取,结果存放在变量,详情知识点见链接 http://996.pm/MeANw

resul=result[‘result’]
resul=resul[‘face_list’]
res=resu[0]
linelian=res[‘beauty’]

二、其次功能实现过程

1. 产品界面设计实现过程

程序运行后,首先显示欢迎界面(核心代码是,tkinter、messagebox、showinfo( 欢’迎’,”某度AI人工智能”+”\n”+”2018年11月出品”))。

界面设计,在界面上设置3个标签,5 个按钮等控件。3 个标签分别显示图片,某度AI结果,运行时间等。7个按钮有“选择图片”,“结束”以及五个实现某度图像功能按钮。

采用place函数设置各个控件的位置,以下代码分别实现标签和按钮的位置:

btn=button(root,text=”选择图片”,command=xz)。place(x=120,y=20)
label=Label(root,width=23,height=6,bg=’blue’,fg=’white’)。
place(x=450,y=150)

2. 选择图片功能实现过程

选择图片,按钮打开选择文件对话框,并将其显示在界面的标签Label上,其核心代码是:

pilImage=tkinter。filedialog。askopenfilename()
pil=Image。open(pilImage)
tkImage=ImageTk。PhotoImage(image=pilImage)
label=Label(root,image=tkImage,width=ww,height=hh)

3. 识别按钮功能设计实现过程

采用def函数功能将按钮与某度AI结果进行定义。以下代码实现,动物检测,按钮与某度AI结果的链接。

def dongwujiance
client=AipImageClassify(APP_ID,API_KEY,SECRET_KEY)
def get _file_content(filePath):
with open(filePath,’rb’) as fp:
return fp.read()
byn=Button(root,text=”动物识别”,command=dongwujiance)

4. 菜单设计实现过程

菜单设计的代码是:

smenul=Menu(fmenul,tearoff=0)
fmenul.add_cascade(label=’关于’,menu=smenul)
for item in[‘版权信息’]:
smenul.add_command(label=item,command=syu)
root[‘menu’]=fmenul

5. 版权信息的代码实现过程

defsyu():
tkinter.messagebox.showinfo(‘版权’,’版本号0.5.2’+’\n’+’制作:LineLian的微信号是firstodytm赋能团队’)

6. 生成可执行文件实现过程

编写代码后进行测试。测试后,删除全部断点及部分注释,生成可执行文件,提供给用户使用。生成可执行文件exe的方法是在DOS中输入代码:

>pip install pyinstaller
>pyinstaller – F-w python.py

三、然后实现结果

应用程序执行“车型识别”界面如下图:

+AI场景,3步懂图像识别产品

文字识别保存在:“d:\ocr。txt”。

功能结果如下图:

+AI场景,3步懂图像识别产品

四、总结+AI产品实现的关键要素

  1.  +AI的场景例如本文用于识别车辆、文字等场景。
  2.  +AI的产品需要的技术本文是调用用成熟的第三方图像识别接口,这也是典型的对+AI型产品快速实现的方法,同时也是区别于纯AI、AI+的特征。
  3. 对算力的需求,如果公司产生图像的业务比较稳定发展,可以借用第三方云服务来实现。

最后AI助力图像识别、文本识别效率比较高,关键是商业化应用,有商业意义的地方本文图像识别技术落地就更更符合产品逻辑,不会像有的AI技术朋友问笔者:“你不是应该更关注产品怎么吸引用户吗?为何还要懂技术呢?”

答案是:AI处于快速发展时期,对于从事AI产品和AI领域相关的人非常有必要懂AI实现的过程。因为AI技术和AI的相关都处于快速发展状态下。不像传统技术那么死板和已经技术固话,所以很多产品懂AI相关的技术更能创新应用AI。

进一步知识点见链接: http://996.pm/MeANw

#专栏作家#

连诗路,公众号:LineLian。人人都是产品经理专栏作家,《产品进化论:AI+时代产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多交流。

本文原创发布于人人都是产品经理。未经许可,禁止转载。


以上所述就是小编给大家介绍的《+AI场景,3步懂图像识别产品》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构

数据结构

殷人昆 / 清华大学 / 2007-6 / 39.00元

《数据结构》(第2版)“数据结构”是计算机专业的核心课程,是从事计算机软件开发和应用人员必备的专业基础。随着计算机的日益普及,“数据结构”课程也在不断地发展。《数据结构》(第2版)按照清华大学计算机系本科“数据结构”大纲的要求,从面向对象的概念、对象类设计的风格和数据结构的层次开始,从线性结构到非线性结构,从简单到复杂,深入地讨论了各种数据结构内在的逻辑关系及其在计算机中的实现方式和使用。此外,对......一起来看看 《数据结构》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

MD5 加密
MD5 加密

MD5 加密工具

SHA 加密
SHA 加密

SHA 加密工具