谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

栏目: IT资讯 · 发布时间: 6年前

内容简介:Google 研究团队开源在 Tensorflow 中进行语义图像分割(Semantic Image Segmentation)模型 DeepLab-v3+,包括 Google Pixel 2 和 Pixel 2XL 手机上的人像模式(Portrait Mode),以及 YouTube 为影片实时更换背...

Google 研究团队开源在 Tensorflow 中进行语义图像分割(Semantic Image Segmentation)模型 DeepLab-v3+,包括 Google Pixel 2 和 Pixel 2XL 手机上的人像模式(Portrait Mode),以及 YouTube 为影片实时更换背景功能,都是这项技术的应用。

谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

Google 研究软件工程师 Liang-Chieh Chen 以及 Yukun Zhu 表示,语义图像分割的主要目的是为每个像素指定语义标签,例如路、天空、人或是狗等物体,不少的程序需要这样的功能,像是合成浅景深效果(Synthetic Shallow Depth-of-field)效果,应用在手机 Pixel 2 和 Pixel 2XL 上提供的人像模式(Portrait Mode),能自动模糊人物的背景,作出类似单镜头反光相机的景深效果。

谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

另外,在多数摄影 App 都会提供的实时影像分割(Video Segmentation),例如最近 YouTube 发表的新功能,为影片换背景的功能,也是语义影像分割的应用。

DeepLab-v3+ 在 Tensorflow 上进行,使用部署于服务器端的卷积神经网络(CNN)骨干架构,以获取最佳的结果。除了代码之外,研究团队也同时公开了 Tensorflow 模型训练以及评估程序,以及使用 Pascal VOC 2012 与 Cityscapes 资料集训练的模型。

DeepLab-v3+ 技术是基于三年前的 DeepLab 模型,期间改进了卷积神经网络特征萃取器、物体比例塑造模型以及同化前后内容的技术,再加上进步的模型训练过程,还有软硬件的升级,从 DeepLab-v2 到 DeepLab-v3,直到现在发表的 DeepLab-v3+,效果一代比一代好。

DeepLab-v3+ 是由 DeepLab-v3 扩充而来,研究团队增加了解码器模组,能够细化分割结果,能够更精准的处理物体的边缘,并进一步将深度卷积神经网络应用在空间金字塔池化(Spatial Pyramid Pooling,SPP)和解码器上,大幅提升处理物体大小以及不同长宽比例的能力,最后得到强而有力的语义分割编码解码器网络。

谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

Liang-Chieh Chen 以及 Yukun Zhu 特别提到,随着软硬件的升级,建构在卷积神经网路上的现代语义图像分割功能,可以达到的水准已经远远超过5年前。

来自:research.googleblog


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算机系统基础

计算机系统基础

袁春风 / 机械工业出版社 / 2014-7-1 / CNY 49.00

《计算机类专业系统能力培养系列教材:计算机系统基础》主要介绍与计算机系统相关的核心概念,解释这些概念如何相互关联并最终影响程序执行的结果和性能。共分8章,主要内容包括数据的表示和运算、程序的转换及机器级表示、程序的链接、程序的执行、存储器层次结构、虚拟存储器、异常控制流和I/O操作的实现等。内容详尽,反映现实,概念清楚,通俗易懂,实例丰富,并提供大量典型习题供读者练习。本书可以作为计算机专业本科或......一起来看看 《计算机系统基础》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试