Code: https://github.com/clovaai/CutMix-PyTorch
Motivation
Regional Dropout可以提高分类任务准确性,引导模型关注较弱判别性的区域,使得模型具有更好的泛化能力。
这些方法通过覆盖黑色像素或者加入随机噪声补丁来取出训练数据上的信息,这样导致部分信息丢失,而且训练效率较低。
Methods
本文将Mixup与Cutout相结合,在其中一张图像中裁剪一块覆盖在另一张图像相同位置上,对应的label按照patch大小进行等比例混合。 \[ \tilde{x}=\mathbf{M} \odot x_{A}+(\mathbf{1}-\mathbf{M}) \odot x_{B} \]
\[ \tilde{y} =\lambda y_A + (1-\lambda)y_B \]
边界框的坐标采样自均匀分布 \[ \begin{array}{l} r_{x} \sim \text { Unif }(0, W), \quad r_{w}=W \sqrt{1-\lambda} \\ r_{y} \sim \text { Unif }(0, H), \quad r_{h}=H \sqrt{1-\lambda} \end{array} \]
\[ \frac{r_wr_h}{WH}=1-\lambda \]
Motivation shared by Cutout,确保两个武器能够从一张图像中识别出两个目标的部分视角,从而提高训练效率。Cutout能够使模型关注目标的less discriminative部分,部分像素未使用,导致训练效率较低。Mixup引入了伪影使得图像不自然。CutMix能够精确定位两个目标,有效改进了Cutout。