更少的标签,更好的学习,谷歌半监督学习算法FixMatch

栏目: IT技术 · 发布时间: 4年前

内容简介:本文向大家推荐谷歌前段时间发布的论文 FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence ,该文提出了新的简单又有效的半监督学习算法该文作者信息:

点击 我爱计算机视觉 标星,更快获取CVML新技术

本文向大家推荐谷歌前段时间发布的论文 FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence ,该文提出了新的简单又有效的半监督学习算法 FixMatch ,结合伪标签(pseudo labeling)和一致性正则化(Consistency regularization)两种半监督学习方法,取得了显著的效果提升。

该文作者信息:

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

作者均来自谷歌研究院。

半监督学习算法,即利用少量有标签数据和大量无标签数据的机器学习算法,最近获得了大量关注。

如何利用无标签数据是半监督学习的关键,一种常见的学习策略,使用在少量有标签数据中训练的模型对大量无标签数据进行预测,使用预测的结果标签重新训练模型。该类方法被称为 伪标签

该文提出的方法,用下面这张图即可完全概括:

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

首先,使用有标签数据训练Model;

然后,对于无标签数据,将其进行弱数据增广(比如反转、拉伸、缩放等),然后交给Model预测,对于置信度高过某阈值的样本,使用one-hot编码打上伪标签;

最后,使用上述伪标签数据训练Model,此时对数据进行强数据增广(无监督数据增广UDA、Mixup等),使得训练后的模型对强数据增广的数据作出的预测与伪标签匹配,使用标准的交叉熵损失函数。

下表为FixMatch方法与其他半监督学习算法的比较:

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

下图为作者在CIFAR-10、CIFAR-100、SVHN数据上半监督学习分类结果:

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

相比以往的State-of-the-art,FixMatch取得了显著的精度提升,在仅使用40个标签数据( 每类4个样本 )时于CIFAR-10数据集上 取得了 88.61%正确率 ,在使用250个标签数据( 每类25个样本 )时取得了 94.93%正确率

在STL-10数据集上,同样取得了精度提升:

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

作者又做了一个极端的实验,CIFAR-10数据集每类仅用 1 个标签样本,仍然取得了 78% 正确率。

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

作者针对学习策略、数据增广策略等做了很多消融实验,欢迎阅读原论文。

总之,该文提出的方法简单又有效,将有助于半监督学习投入更多实用场景,代码已开源,欢迎大家继续研究。

论文地址:

https://arxiv.org/abs/2001.07685

代码地址:

https://github.com/google-research/fixmatch (官方)

https://github.com/kekmodel/FixMatch-pytorch (非官方)

在我爱计算机视觉公众号后台回复“ FixMatch ”,即可收到论文下载地址。

推荐阅读:

半监督学习价值凸显!谷歌大脑83页PPT介绍最新进展

半监督学习交流群

关注最新最前沿的 半监督学习 技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

请务必注明:半监督 ):

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

喜欢在QQ交流的童鞋可以加52CV官方QQ群: 805388940

(不会时时在线,如果没能及时通过还请见谅)

更少的标签,更好的学习,谷歌半监督学习算法FixMatch

长按关注 我爱计算机视觉


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

失控的未来

失控的未来

[美]约翰·C·黑文斯 / 仝琳 / 中信出版集团 / 2017-4-1 / 59.00元

【编辑推荐】 20年前,尼古拉•尼葛洛庞帝的《数字化生存》描绘了数字科技给人们的工作、生活、教育和娱乐带来的冲击和各种值得思考的问题。数字化生存是一种社会生存状态,即以数字化形式显现的存在状态。20年后,本书以一种畅想的形式,展望了未来智能机器人与人类工作、生活紧密相联的场景。作者尤其对智能机器人与人类的关系,通过假设的场景进行了大胆有趣的描述,提出了人工智能的未来可能会面临的一些问题。黑文......一起来看看 《失控的未来》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具