Google 工程師手把手教學!用 Arduino 和 TensorFlow 自組圖像識別小汽車

栏目: 服务器 · 发布时间: 7年前

内容简介:Google 工程師手把手教學!用 Arduino 和 TensorFlow 自組圖像識別小汽車

Google 工程師手把手教學!用 Arduino 和 TensorFlow 自組圖像識別小汽車

【我們為什麼挑選這篇文章】現在網路上的開源軟體、平台、資源、 工具 這麼豐富,只要事先掌握一兩樣工具,並找到合適的資源,任何人都可以在家開發新產品。這篇文由 Google 軟體工程師分享打造一台具圖像識別功能的小車,需要哪些工具和資源?不僅詳解組裝步驟,連程式碼都幫大家寫好了。(責任編輯:曾宜婷)

作者/趙智沉,Google 軟體工程師 

從買第一個 Arduino 套裝開始,我接觸機器人有好幾年了,但直到最近才開始做完整的課題。期間有兩項技能為我打開了新世界的大門:Python 和 Linux。他們背後,是強大的開源社區。掌握了這兩樣工具的工具(元工具),你感覺網上遍地是趁手的兵器。

上週在公司內部程式設計培訓時,有一句話深得我心: 我們是軟體工程師,不是程式師。我們的工作不是寫程式,而是合理使用工具解決問題。在 Google,如果你覺得自己不得不從零開始寫某項功能,只是你還沒有找到相應的工具罷了。 在開源社區更是如此。

這是一個遙控小車,通過紅外遙控或無線鍵盤可以控制小車的行動和攝像頭的角度。TensorFlow 即時監測攝像頭拍攝到的畫面,語音讀出它識別出的物體。所有代碼都放在我的 GitHub 上。

Google 工程師手把手教學!用 Arduino 和 TensorFlow 自組圖像識別小汽車

這個想法不是我的原創,來自 Lukas Biewald 去年九月寫的這篇 網誌 。核心部分,TensorFlow 識別攝像頭圖像並語音輸出,是我司人工智慧工程師 Pete Warden 的 開源工作 。和原網誌不同的是,製作過程中我加入了 Arduino 作為機械總控,也瞭解了 Arduino 和樹莓派對話的方法(串口通信)。期間用到了許多有用的技能和工具,在這裡整理一下,歡迎同好們留言交流!

整個課題在命令列環境完成,沒有圖形介面。如果你不懂 Linux 系統,可能有些吃力。但是,你都開始玩機器人了,怎麼能不學 Linux 呢?我是通過 《鳥哥的 Linux 私房菜》 自學 Linux 的,後來又嘗試 從原始程式碼搭建 Linux ,終於克服在 Windows 系統環境長大產生的對命令列的抗拒心理。相信我,克服這個障礙,你將打開新世界的大門。何況,用命令列工作才顯得更酷更極客,不是嗎?除了 Linux,你還要懂 C++和 Python 來完成這個課題。

另外,這篇文章主要介紹電子部分,不講機械和美工。如你看到的,這個小車醜破了我的審美底線,我沒花心思在外觀上。我希望以後做一些兼具美學和功能的電子課題,或許會和設計師朋友們合作!

一、樹莓派

首先,你需要一個最新款的 Raspberry Pi ,安裝好定制的 Linux 系統,連上無線網。你還需要一個 官配攝像頭 ,並在樹莓派中 設置為可用 。你可以將樹莓派通過 HDMI 連接到顯示器,但更方便的做法是 ssh 遠端登入,這樣你就不用在調試過程中反復地把樹莓派從小車上拔線、取下、連螢幕、然後安裝回小車了,你可以即時遠端修改小車的內核。甚至,我的 Arduino 程式也是通過樹莓派編寫、上傳、通信的,於是也免去了電腦連接 Arduino 的步驟,讓一切更流暢無縫。

樹莓派的 Linux 系統支援圖形桌面,你可以使用 RealVNC(用於 Windows)或 TightVNC(用於 Mac)遠端登入圖形桌面。(這個課題裡不需要)

二、TensorFlow

這是課題的核心部分,反而操作起來最簡單,因為一切都在 這裡 寫清楚了,按部就班就行。運行代碼在 這裡

注意:這裡用了訓練好的模型,即 TensorFlow 中預先給定了訓練好的參數集,訓練圖片庫是 ImageNet 。也就是說,小車識別出的物體只能是圖片庫裡包含的 labels,也沒有「學習」的過程。

三、小車

小車套件(robot chassis)很多,選你喜歡的一款。標準的套件包括一個基座,兩組馬達+輪子,一個萬向輪,一個電池盒。這個課題不需要四驅,而且之後要用到的馬達控制器可能只支持兩個馬達。我用的是張堯姐送給我的第一個 DIY 套件:一個戳了很多洞的木板和 3D 列印出來的輪子和連接部件。這個恐怕是蘿蔔太辣最早的套件,來自矽谷的創客空間。

現在, 蘿蔔太辣 正式出品的「起源」套件已很完善,線上也有成熟的教學資源。這個課題裡用到的舵機和金屬連接部件都來自堯姐送給我的第二個套件——「起源」套件。但從感情上來講,那套粗糙的木板套件讓我更親近,符合「用最簡單的材料實現原型」的理念。

電源:樹莓派需要 5V、2A 電源,放在小車上的話需要一個電流足夠大的充電寶。連接樹莓派和 Arduino 的連接線同時也為 Arduino 供電。但是,馬達我用了外部電源(電池盒)。你會發現即使沒有外部電源,充電寶依然可以帶動馬達(儘管很慢)。但是,好的習慣是機械部分獨立供電;邏輯電路部分由充電寶提供。

下一步,操控小車。這裡有兩個方案,第一個不需要 Arduino。我使用的是第二個。

3.1 樹莓派作為機械總控

我認為單片機的精髓,不是尺寸小,而是豐富的 GPIO(General Purpose Input-Output),它們是程式與外部世界對話的視窗。你看到的各種電子部件、探頭、焊接、麵包板,都是在和 GPIO 打交道。你需要瞭解基本的電路知識,也需要知道它們在單片機上的 排布 。樹莓派有一個非常好用的 GPIO Python 庫: gpiozero ,使用方法一目了然。

通常用四個埠控制馬達,分別連接兩個馬達的正負級,通過每個馬達的正向/逆向旋轉來實現小車的前進/後退/轉向。實現雙向電流的標準電路模型是 H 橋接。你可以選購一款最基本的 H-bridge 模組。

因為我手頭沒有 H 橋接 ,所以這個方案我沒有實現。

3.2 Arduino 作為機械總控

我沒有 H 橋接,但有一個用於 Arduino 的 Motor stacking shield,即 Arduino 上的 H 橋接。於是我乾脆用 Arduino 負責機械(馬達+舵機),相當於身體;樹莓派只負責圖像識別,相當於大腦。

Arduino 不是 Linux 系統,不能直接 ssh 進去寫程式,需要在外寫好後編譯上傳。我用資料線連接了樹莓派和 Arduino,在樹莓派上寫好程式後上傳。我發現一個非常好用的命令列 IDE:PlatformIO(也有很棒的圖形介面編輯器)。Linux 上的 安裝過程 基於 Python 2.7。你需要一些初始化,如果像我一樣是 Arduino Uno 主機板,輸入以下命令即可:

pio init -b uno

Arduino 的 C++原始程式碼在 這裡 。進入 這個資料夾 後,輸入以下命令即可上傳:

pio run –target upload

後來我發現 PlatformIO 對於 Arduino 主機板好像不支持 C++11,如果你有這個需要,可以考慮 inotool。

四、無線遙控

同樣有兩個方案:無線鍵盤,紅外遙控。兩個方案我都實現了。

4.1 無線鍵盤

如果你在上一步用了 3.1,無線鍵盤操控模組就可以直接嵌入到機械操控代碼中(我沒有實現)。如果你在上一步用了 3.2,那麼需要在樹莓派上將按鍵操作轉為機械控制信號(文本形式),通過串口通信(Serial Port)操控 Arduino。

python 代碼在 這裡 ,用到了我 自己寫的庫 ,用來檢測鍵盤按鍵。這個庫將單次按鍵匹配到前進/後退/轉/停止等行為;但我希望實現的是長按鍵前進/後退/轉,不按鍵時停止。但我始終沒有找到現成的庫(Update:據說在 PyGame 裡有)。

後來我試著通過背景執行緒(threading)和系統延時的方法 寫了一個庫 ,但效果不太理想,系統延時和程式執行時間帶來的誤差總是匹配不好,就放棄了。現在代碼裡用的是單次按鍵行動/停止的方案。如果讀者有好的庫,請推薦!

有一點要注意,使用串口通信前需要 disable login(既然你已經 ssh 遠端登入了), 這篇 解釋比較清楚。

4.2 紅外遙控

紅外的長按返回的是一個單獨的值(REPEAT),這點就可以讓我很容易實現「長按-車動,不按-車停」。此外,紅外遙控的代碼直接寫在 Arduino 的 C++代碼裡,不需要通過樹莓派和串口通信,更符合 Arduino 作為機械總控的設計原則。

PlatformIO 不自帶紅外的庫,我用的是 這個 。PlatformIO 使用協力廠商庫實在太簡單了,不需要下載安裝,直接在配置里加上 GitHub 連結即可,參考我的 設定檔

還有一點,每一個紅外遙控都不一樣。家裡的電視機、音響、空調遙控都可以用,你只需要在使用前匹配好按鍵和對應的碼。我在 代碼 裡 define 的一堆 KEY 只適用於我的遙控器。你可以用 這個代碼 來獲得鍵碼。注意:紅外遙控有幾種模式,我的遙控用的是最常見的 NEC 模式,如果你匹配出來一堆亂碼,可以考慮庫裡的其他幾個模式。

對了,如果你用紅外遙控,你還需要在車上裝一個 IR Receiver。我裝在 Arduino 上,用 8 號埠。

如果你用了方案 3.1,你也可以直接將 IR Receiver 裝在樹莓派的 GPIO 上。

五、其他

這些已經夠你開車上路了。我在車上裝了舵機(Servo),控制攝像頭的上下轉動。操作很直觀,看代碼就能理解。我沒有裝超聲探頭,這個可以幫助你檢測障礙,在撞牆前強行停止。

如果你想遠端看攝像頭的即時畫面,VNC 不能勝任。可以考慮 這個方案 。但這樣的話 TensorFlow 就不能再用攝像頭了。應該有一個共用的方案,我沒有探究。

差不多就這些了,我的代碼沒有太多注釋,等有空往上加。如果你有疑問,可以留言問我。

福利: 這裡 有一個延時攝影的簡單程式,我在 crontab 裡設置為每隔一分鐘拍一張照,然後每天半夜將當天拍的照轉成錄影。下週打算帶到公司裡,找個風景好的位置,放幾天,拍紐約的 24 小時風景。

延伸閱讀

(本文經合作夥伴雷鋒網授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 Google 工程師:教你用樹莓派+Arduino+TensorFlow 搭建圖像識別小車 〉。首圖來源: Pixabay ,CC Licensed)


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

亿级流量网站架构核心技术

亿级流量网站架构核心技术

张开涛 / 电子工业出版社 / 2017-4 / 99

《亿级流量网站架构核心技术》一书总结并梳理了亿级流量网站高可用和高并发原则,通过实例详细介绍了如何落地这些原则。本书分为四部分:概述、高可用原则、高并发原则、案例实战。从负载均衡、限流、降级、隔离、超时与重试、回滚机制、压测与预案、缓存、池化、异步化、扩容、队列等多方面详细介绍了亿级流量网站的架构核心技术,让读者看后能快速运用到实践项目中。 不管是软件开发人员,还是运维人员,通过阅读《亿级流......一起来看看 《亿级流量网站架构核心技术》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具