BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

栏目: 编程工具 · 发布时间: 6年前

内容简介:Yunsheng Li, Lu Yuan, Nuno Vasconcelos.CVPR 2019 PaperPaper link :

Yunsheng Li, Lu Yuan, Nuno Vasconcelos. “Bidirectional Learning for Domain Adaptation of Semantic Segmentation” . In CVPR’19.

CVPR 2019 Paper

Paper link : https://arxiv.org/abs/1904.10620

Github (May.02.2019,尚未釋出) : https://github.com/liyunsheng13/BDL

前備知識

如果不清楚 Domain Adaptation 或是 Domain Shift 的,

可以先看我之前寫過的 AdaptSegNet簡介

簡介

以往常見的 Domain Adaptation 的方式是透過 GAN-based 的方法,

此文也是基於此方法作延伸,

對 GAN-based 方法不清楚的可以看 AdaptSegNet簡介

此文提出 Bidirectional learning framework,

其框架包含兩個部分

  • Image-to-Image 模型做轉換,此處使用 Cycle GAN
  • Segmentation adaptation model 其包含 Semantic Segmentation model 以及 Discriminator

Image-to-Image 的想法是將 Source domain(S) 的畫風轉換為 Target domain(T) 來減緩 domain shift 所帶來的傷害(降低準確度)。

特別的是此論文的 Image-to-Image 模型會依據 Semantic Segmentation 的結果做訓練。

因此稱為 Bidirectional learning~

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

除此之外還提出 Self-supervised(SSL) 的方式來提升準確度。

問題設定

通常 Unsupervised domain adaptation (UDA) 在語義分割(Semantic segmentation)的任務中的定義如下

  • Source Domain:圖片 Xs,有標注正解的圖片 Ys
  • Target Domain:圖片 Xt,沒標注正解圖片

架構

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

Bidirectional Learning

首先訓練 Image-to-Image 的模型,

使用 S 與 T 的圖片做訓練,

訓練方式相似於以往的 Cycle-GAN。

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation
BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

提出了新的 Perceptual loss !!

使用轉換完的圖片輸入至 Semantic Segmentation 去做預測,

那直覺的想法是如果圖片轉換的夠好的話,

那麼輸入進模型的預測結果應該也會差不多,

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

備註:

F-1 可以理解使用另一個分支 T -> S,將 S’(相似 T) 轉回 S,

再來訓練 Segmentation Adaptation Model,

使用常見的 Semantic loss 以及 Adversarial 的方法訓練,

使用的事 Image-to-Image 所生成的 S’ (經由 S -> T 的分支生成) 作為輸入。

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

Self-supervised Learning(SSL)

如果 S 以及 T 的資料集都有 GT 的話,

那都使用 Fully Supervised 的方法做訓練是較佳的,

但是 DA 的問題是 T 的資料集沒有 GT,

但我們可以使用預測出來的 Yt 來做訓練,

這邊是選用 Yt 中擁有較高自信分數(> threshold)的 pixel 去做訓練,

對於有較高分數的 pixel 我們稱做 Y^t,

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

因此訓練 Segmentation adaptation model 會多一個 Segmentation loss,

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation
BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

上圖左方的 Step1 指的是使用 Segmentation adaptation model 完的效果,

而 Step2 指的是使用 Self-supervised Learning(SSL) 完的效果,

訓練流程步驟

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation
  • K 為 iteration 次數:實驗設定為 2,可看下方 table 1 實驗。
  • Threshold:設定為 0.9,可看下方 table 3 實驗。
  • N 為 SSL 的次數:設定為 2,可看下方 table 4 實驗。

參數細節有點多,有興趣自己去看論文理解好了。。。

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation
BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

成果

對於 Row 4, 5 的 mIoU 47.2 -> 44.3 那部分挺特別的,

有興趣的去看論文,講得有點抽象呢!

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation
BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

參考資料:

Bidirectional Learning for Domain Adaptation of Semantic Segmentation

AdaptSegNet簡介

AdaptSegNet:Learning to Adapt Structured Output Space for Semantic Segmentation

同步發表於: Xiaosean的個人網站


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

The Linux Command Line

The Linux Command Line

William E. Shotts Jr. / No Starch Press, Incorporated / 2012-1-17 / USD 39.95

You've experienced the shiny, point-and-click surface of your Linux computer-now dive below and explore its depths with the power of the command line. The Linux Command Line takes you from your very ......一起来看看 《The Linux Command Line》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

MD5 加密
MD5 加密

MD5 加密工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具