BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

内容简介：Yunsheng Li, Lu Yuan, Nuno Vasconcelos.CVPR 2019 PaperPaper link :

Yunsheng Li, Lu Yuan, Nuno Vasconcelos. “Bidirectional Learning for Domain Adaptation of Semantic Segmentation” . In CVPR’19.

CVPR 2019 Paper

Paper link : https://arxiv.org/abs/1904.10620

Github (May.02.2019，尚未釋出) : https://github.com/liyunsheng13/BDL

前備知識

如果不清楚 Domain Adaptation 或是 Domain Shift 的，

可以先看我之前寫過的 AdaptSegNet簡介

簡介

以往常見的 Domain Adaptation 的方式是透過 GAN-based 的方法，

此文也是基於此方法作延伸，

對 GAN-based 方法不清楚的可以看 AdaptSegNet簡介。

此文提出 Bidirectional learning framework，

其框架包含兩個部分

Image-to-Image 模型做轉換，此處使用 Cycle GAN
Segmentation adaptation model 其包含 Semantic Segmentation model 以及 Discriminator

Image-to-Image 的想法是將 Source domain(Ｓ) 的畫風轉換為 Target domain(Ｔ) 來減緩 domain shift 所帶來的傷害(降低準確度)。

特別的是此論文的 Image-to-Image 模型會依據 Semantic Segmentation 的結果做訓練。

因此稱為 Bidirectional learning～

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

除此之外還提出 Self-supervised(SSL) 的方式來提升準確度。

問題設定

通常 Unsupervised domain adaptation (UDA) 在語義分割（Semantic segmentation）的任務中的定義如下

Source Domain：圖片 Xs，有標注正解的圖片 Ys
Target Domain：圖片 Xt，沒標注正解圖片

架構

Bidirectional Learning

首先訓練 Image-to-Image 的模型，

使用 S 與 T 的圖片做訓練，

訓練方式相似於以往的 Cycle-GAN。

提出了新的 Perceptual loss !!

使用轉換完的圖片輸入至 Semantic Segmentation 去做預測，

那直覺的想法是如果圖片轉換的夠好的話，

那麼輸入進模型的預測結果應該也會差不多，

備註：

F-1 可以理解使用另一個分支 T -> S，將 S’(相似 T) 轉回 S，

再來訓練 Segmentation Adaptation Model，

使用常見的 Semantic loss 以及 Adversarial 的方法訓練，

使用的事 Image-to-Image 所生成的 S’ (經由 S -> T 的分支生成) 作為輸入。

Self-supervised Learning(SSL)

如果 S 以及 T 的資料集都有 GT 的話，

那都使用 Fully Supervised 的方法做訓練是較佳的，

但是 DA 的問題是 T 的資料集沒有 GT，

但我們可以使用預測出來的 Yt 來做訓練，

這邊是選用 Yt 中擁有較高自信分數(> threshold)的 pixel 去做訓練，

對於有較高分數的 pixel 我們稱做 Y^t，

因此訓練 Segmentation adaptation model 會多一個 Segmentation loss，

上圖左方的 Step1 指的是使用 Segmentation adaptation model 完的效果，

而 Step2 指的是使用 Self-supervised Learning(SSL) 完的效果，

訓練流程步驟

K 為 iteration 次數：實驗設定為 2，可看下方 table 1 實驗。
Threshold：設定為 0.9，可看下方 table 3 實驗。
N 為 SSL 的次數：設定為 2，可看下方 table 4 實驗。

參數細節有點多，有興趣自己去看論文理解好了。。。

成果

對於 Row 4, 5 的 mIoU 47.2 -> 44.3 那部分挺特別的，

有興趣的去看論文，講得有點抽象呢！

參考資料：

Bidirectional Learning for Domain Adaptation of Semantic Segmentation

AdaptSegNet簡介

AdaptSegNet:Learning to Adapt Structured Output Space for Semantic Segmentation

同步發表於： Xiaosean的個人網站

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

BDL簡介 — Bidirectional Learning for Domain Adaptation of Semantic Segmentation

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

程序员代码面试指南：IT名企算法与数据结构题目最优解（第2版）

左程云 / 电子工业出版社 / 109.00元

《程序员代码面试指南：IT名企算法与数据结构题目最优解（第2版）》是一本程序员代码面试"神书”！书中对IT名企代码面试各类题目的最优解进行了总结，并提供了相关代码实现。针对当前程序员面试缺乏权威题目汇总这一痛点，本书选取将近300道真实出现过的经典代码面试题，帮助广大程序员的面试准备做到接近万无一失。"刷”完本书后，你就是"题王”！《程序员代码面试指南：IT名企算法与数据结构题目最优解（第2版）》......一起来看看《程序员代码面试指南：IT名企算法与数据结构题目最优解（第2版）》这本书的介绍吧!

码农工具