R语言标签平滑是什么

这篇文章主要介绍“R语言标签平滑是什么”，在日常操作中，相信很多人在R语言标签平滑是什么问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”R语言标签平滑是什么”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

广河网站制作公司哪家好，找成都创新互联公司！从网页设计、网站建设、微信开发、APP开发、响应式网站设计等网站项目制作，到程序开发，运营维护。成都创新互联公司从2013年开始到现在10年的时间，我们拥有了丰富的建站经验和运维经验，来保证我们的工作的顺利进行。专注于网站建设就选成都创新互联公司。

什么是标签平滑？

标签平滑是一种损失函数的修正，已被证明是非常有效的训练深度学习网络的方法。标签平滑提高了图像分类、翻译甚至语音识别的准确性。我们的团队用它来打破许多 FastAI 排行榜记录：

R语言标签平滑是什么

在我们的FastAI训练代码中调用了标签平滑

简单的解释是，它将神经网络的训练目标从“1”调整为“1-label smoothing adjustment”，这意味着神经网络被训练得对自己的答案不那么自信。默认值通常是 0.1，这意味着目标答案是 0.9(1 - 0.1)而不是 1。

例如:假设我们要将图像分类为狗和猫。如果我们看到一张狗的照片，我们训练 NN(通过交叉熵损失)向 1 表示狗，0 表示猫的方向移动。如果是一只猫，我们训练的方向正好相反，1 代表猫，0 代表狗。换句话说，这是一个 binary 或者说“hard”的答案。

然而，NN 有一个坏习惯，就是在训练过程中对预测变得“过于自信”，这可能会降低它们的泛化能力，从而在新的、看不见的未来数据上表现得同样出色。此外，大型数据集通常会包含标签错误的数据，这意味着神经网络在本质上应该对“正确答案”持怀疑态度，以减少一定程度上围绕错误答案的极端情况下的建模。

因此，标签平滑所做的就是通过训练 NN 向“1-adjustment”目标移动，然后在其余的类上除以这个 adjustment，从而使它对自己的答案不那么自信，而不是简单的设为 1。

对于我们的二分类猫/狗示例，0.1 的标签平滑意味着目标答案将是 0.90(90%确信)这是一个狗的图像，而 0.10(10%确信)这是一只猫，而不是先前的向 1 或 0 移动的结果。由于不太确定，它作为一种正则化形式，提高了它对新数据的预测能力。

可以看到，代码中的标签平滑有助于理解它如何比通常的数学运算更好地工作(来自 FastAI github)。ε 是标签平滑调整因子：

R语言标签平滑是什么

标签平滑的FastAI实现

标签平滑对神经网络的影响

现在我们进入文章的核心部分，直观地展示标签平滑对神经网络分类处理的影响。

首先，AlexNet 在训练中对“飞机、汽车和鸟类”进行分类。

R语言标签平滑是什么

左：没有使用标签平滑进行训练，右：使用标签标签平滑进行训练

验证集上的表现:

R语言标签平滑是什么

你可以看到的，标签平滑强制对分类进行更紧密的分组，同时强制在聚类之间进行更等距的间隔。

“河狸、海豚和水獭”的 ResNet 例子更能说明问题：

R语言标签平滑是什么

ResNet训练用于分类3个图像类别…请注意在聚类紧密性方面的巨大差异

R语言标签平滑是什么

ResNet验证集结果，标签平滑提高了最终的精度。请注意，在训练中，标签平滑会将激活值驱动到紧密的簇中，而在验证集中，它会在中心周围传播，并充分覆盖了预测的置信度范围

正如图像所显示的，标签平滑为最终的激活产生了更紧密的聚类和更大的类别间的分离。

这是为什么标签平滑可以产生更多的正则化和鲁棒的神经网络的主要原因，重要的是趋向于更好地泛化未来的数据。然而，除了得到了更好的激活值的中心，还有额外的好处。

标签平滑的隐式网络校正功能

在本文中，Hinton 等人从可视化过程出发，展示了如何在不需要手动调节温度的情况下，自动校准网络，减少网络校准误差。

以前的研究(Guo et al)表明，神经网络常常过于自信，相对于它们的真实准确性校准得很差。为了证明这一点，Guo 等人开发了一种名为 ECE(预期校准误差)的校准度量。通过使用这种度量方法，他们能够使用一种称为温度缩放的训练后的修改器来调整给定神经网络的校准值，并使网络更好地与它的真实能力保持一致(减少 ECE)，从而提高最终精度。(在传递给 softmax 函数之前，通过将最终 logits 与温度标量相乘来执行温度缩放)。

这篇论文展示了一些例子，但是最好的例子是在 ImageNet 上使用和不使用标签平滑训练的 ResNet，并将这两个网络与温度调整网络进行了比较。

R语言标签平滑是什么