OpenPose 是 Carnegie Mellon University(CMU)論文實作的開源函式庫,提供的功能主要就是可以偵測人體的各部位在什麼地方,例如可以在影像中找到臉、身體、手等等地方的特徵點。但他厲害的地方在於可以一次偵測很多人,看看下面這張圖就知道:
這個 repository 仍然相當地 active,有兩個 CMU 的學生常常在 Github 上面解 issue。這次因為筆者需要在 Windows 上面安裝 OpenPose 並呼叫 Python API,所以跟開發者有不少互動,才想到乾脆來寫一篇教學,讓之後想要使用 OpenPose 的讀者可以省去好幾天的環境安裝 debug。
OpenPose 演算法簡介
上面是 OpenPose 的架構圖,輸入會是一張大小為 w x h 的彩色影像;接著會先經過 Stage 0 的 VGG-19 Network,得到輸入影像的 feature map;然後會在 Stage 1 經過一些 CNN 來得到身體各部位的 confidence map。Stage 1 分成兩個 branch,branch 1 可以產生某特定部位的 confidence map,例如左肩的 confidence map:
branch 2 則是產生不同身體部位之間的關聯性,例如脖子跟左肩的關係:
最後結合這些結果就可以得到全身各部位大致在什麼地方,還有彼此相對位置的關係。以上的講法有點過於簡化,有興趣的讀者可以看看延伸閱讀 1 的原始論文。
Windows 安裝步驟
-
確認一下你的硬體跟作業系統符合 OpenPose 要求
-
Clone OpenPose 的原始碼
因為我們要使用 Python API,所以不能只是下載已經編譯好的 library 文件,必須要從原始碼開始編譯。我推薦大家可以用 Github Desktop 來下載原始碼 & 管理。
-
下載並安裝 CMake GUI
可以上 CMake 的網站 下載,Windows 的話請下載
cmake-X.X.X-win64-x64.msi
。 -
安裝 Visual Studio 2015
OpenPose 的官方要求是 Visual Studio 2015 Enterprise Update 3,但似乎也有人用 Visual Studio 2015 Community 安裝成功。筆者是用 Enterprise 版本安裝成功的。
-
安裝 CUDA
官方推薦的版本是 CUDA 8。這一步要在安裝完 Visual Studio 之後做,因為安裝過程會產生一些 Visual Studio 需要的檔案。
-
安裝 cuDNN
官方建議安裝 5.1 版本。安裝方法很簡單,只要把下載的壓縮檔內容解壓縮到
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
路徑就好。(cuDNN 壓縮檔裡面會有三個資料夾,可以對應到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
裡面也有的資料夾,分別把檔案放到對應的資料夾就好)。 -
開始設定 CMake 來準備編譯需要的檔案
-
設定檔案路徑(在 clone 下來的路徑中自己創一個 build 資料夾,並設定成
Where to build the binaries
) -
按下 Configure 按鈕(generator 記得選 Visual Studio 14 2015 Win64)
-
等待 Configure Done
-
勾選 BUILD_PYTHON
-
按下 Generate
-
-
用 Visual Studio 2015 打開
build/OpenPose.sln
檔案 - 切換到 Release Mode 並 Build Project
這一步很重要,因為只用 Debug Mode build 會讓後面的 Python API 啟動失敗。詳見 issue 1026 。
Python API 呼叫步驟
如果上面的步驟都做完,應該可以在 openpose\build\python\openpose\Release
看到 openpose_python.cp36-win_amd64.pyd
library 文件。(OpenPose 原生是用 C++ 寫的,是用 pybind11 包成 Python 可以呼叫的 library)。
接著,我們準備要來跑 openpose\build\examples\tutorial_api_python\1_body_from_image.py
,要記得把裡面的 library 搜尋路徑改成自己的:
我可以跑起來的範例如下:
# Import Openpose (Windows/Ubuntu/OSX) dir_path = os.path.dirname(os.path.realpath(__file__)) try: # Windows Import if platform == "win32": # Change these variables to point to the correct folder (Release/x64 etc.) sys.path.append(dir_path + '/../../python/openpose/Release'); os.environ['PATH'] = os.environ['PATH'] + ';' + dir_path + '/../../x64/Release;' + dir_path + '/../../bin;' import openpose_python as op
這時,你就可以去 cmd.exe 執行,執行下列步驟
::切換到你自己的 openpose 路徑 cd openpose\build\examples\tutorial_api_python python 1_body_from_image.py
然後跑出下面的結果:
總結
今天跟大家介紹了 CMU 的 OpenPose 要怎麼安裝,也稍微介紹了 Python API 要怎麼使用,理論上學完這篇教學的內容後,你就可以用 Python 呼叫 OpenPose 的 API 來實作自己想要的更高階功能了。希望對你的研究或 project 有幫助!
以上所述就是小编给大家介绍的《如何在 Windows 安裝 OpenPose 跟使用 Python API 來偵測人體姿態》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- RecyclerView使用指南(一)—— 基本使用
- 如何使用Meteorjs使用URL参数
- 使用 defer 还是不使用 defer?
- 使用 Typescript 加强 Vuex 使用体验
- [译] 何时使用 Rust?何时使用 Go?
- UDP协议的正确使用场合(谨慎使用)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Web Development Recipes
Brian P. Hogan、Chris Warren、Mike Weber、Chris Johnson、Aaron Godin / Pragmatic Bookshelf / 2012-1-22 / USD 35.00
You'll see a full spectrum of cutting-edge web development techniques, from UI and eye candy recipes to solutions for data analysis, testing, and web hosting. Make buttons and content stand out with s......一起来看看 《Web Development Recipes》 这本书的介绍吧!