Contextual Diversity for Active Learning


语境多样性主动学习(ECCV2020)

Abstract

  • 先进的AL方法通常依赖于视觉多样性或预测不确定性的测量,这无法有效地捕捉空间环境中的变化
  • 现代CNN架构大量使用空间背景来实现高精度的预测。由于在缺乏真值标签的情况下,环境很难评估,因此我们引入了情境多样性的概念,它能够捕获与空间共存其他相关类的特征
  • 情境多样性(CD)取决于一个重要的观察结果,即由CNN预测的一个感兴趣区域的概率向量通常包含来自更大的接受域的信息
  • 利用这一观察结果,结合两个AL框架提出了CD度量:基于核心集的策略和基于强化学习的策略,用于主动帧选择

Introduction

  • 传统的AL技术大多以不确定性为基础,利用模型预测输出的模糊性。由于大多数采用的不确定性措施是基于单个样本的预测,这种方法在批量AL设置中经常导致高度相关的选择。因此,最近的AL技术试图通过遵循基于所选样本的多样性和代表性的策略来减少这种关联性。现有的利用这些线索的方法仍然不足以充分捕捉到图像内和整个数据集的空间和语义背景。
  • 不确定性,通常通过熵来衡量,也不能捕获类负责产生的不确定性。
  • 视觉多样性和代表性能够捕获图像样本中的语义上下文,但通常使用特征空间中的全局线索来测量,而不保留图像组成对象的空间位置或相对位置的信息。
  • 空间语境是 CNN 的一个重要方面,由于空间语境的接受域大,使得 CNN 能够学习有区别的语义特征。
  • 一个基于CNN的分类器的错误分类不只是简单地归结于真实类中的对象,还可能出现在对象的空间邻域中的其他类。这一关键的观察结果还指出了人工智能文献中的一个重要空白,即现有的测量方法无法捕捉图像中空间和语义上下文的多样性所产生的不确定性。
  • 将模型预测的不确定性与基于空间语境和语义语境的样本间的多样性统一起来,引入了一种新的信息理论距离度量,上下文多样性(CD),以捕获数据集中各种对象类别的空间和语义上下文的多样性。

Core-Set

  • 将主动学习建模为卷积神经网络(cnn)学习的特征空间中的核心集选择问题。core-set被定义为一个选定的点子集,这些点周围半径为δ的球的并集包含所有剩余的未标记点。
  • 该方法的主要优势在于其理论保证,即在所有样本上平均的损失与在选定子集上平均的损失之间的差不取决于所选子集中的样本数量,而只取决于半径δ。
  • 使用近似算法来解决在特征空间中使用欧氏距离度量的设施选址问题。在高维特征空间中依赖欧氏距离是无效的。上下文多样性测度依赖于KL散度,它被认为是概率空间中距离的有效替代品。由于我们的度量具有类似距离的特性,所提出的方法被称为基于上下文多样性的使用核心集的主动学习,既尊重核心集的理论保证,又不受维度诅咒的影响。

Learning Loss

  • 通过学习预测数据样本的损失值,提出了一种新的不确定性测量方法。根据预测损失值得到的排名来取样数据。
  • 但是,还不清楚产生最大损失的样本是否也是导致最大性能增益的样本。损失最大的样本可能是异常值或标签噪声,将它们包含在训练集中可能会误导网络。
  • 该技术的另一个缺点是,没有明显的方法来选择不同的样本根据预测的损失值。

Reinforcement Learning for Active Learning

Method

CDAL

  • 语境多样性CD,CD 的核心是我们对模型预测不确定性的量化,其定义为伪标记样本的softmax后验概率的混合。
  • 这种混合分布有效地捕捉了一组图像上的空间和语义上下文。

Contextual Diversity

实验结果

CDAL实验结果图


文章作者: Yang Shiyu
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Yang Shiyu !
  目录