当前位置:首页 > 体育

tempered 谷歌提出新分类损失函数:将噪声对训练结果影响降到最低

小茶来自奥菲寺

训练数据集中的标签通常是不正确的,比如图像分类。如果有人把猫误标为狗,会对训练结果造成不良影响。

如何在不改变训练样本的情况下,将这类噪声数据对机器学习模型的影响降到最低?

最近Google提出了一个新的损失函数,解决了机器学习算法被噪声困扰的一个大问题。

逻辑损失函数的问题

机器学习模型处理噪声训练数据的能力很大程度上取决于训练过程中使用的损失函数。

Logistic损失函数通常用于训练图像分类,但它有两个主要缺点,导致在处理有噪声的数据时存在以下缺点:

1.远处的异常值将主导整体损失

逻辑损失函数对异常值非常敏感。这是因为损失函数没有上界,错误标注的数据往往远离决策边界。

这导致异常大的误差值拉伸决策边界,对训练结果造成不利影响,并可能牺牲其他正确的样本。

2.错误标签的影响将扩展到分类的边界

神经网络的输出是向量激活值。一般对于分类问题,我们使用softmax,将激活值表示为属于每个分类的概率。

由于这个逻辑损失传递函数的尾部是指数衰减的,训练过程会倾向于使边界更接近错误标记的例子,从而保证不属于这个分类的函数值更接近于0。

因此,即使标签噪声水平低,网络的泛化性能也会立即恶化。

△二进制分类的可视化结果,噪声会导致决策边界扩大,产生分类误差和两个参数可调的损失函数

Google通过引入两个可调参数的双回火Logistic损失解决了上述两个问题。这两个参数分别是温度)t1和尾重)t2。尾部重量实际上是指传递函数尾部下降的速率。

当t1和t2都等于1时,这个双稳态函数退化为普通的逻辑损失函数。

温度参数t1是一个介于0和1之间的参数,它的值越小,对逻辑损失函数极限的约束越严格。

尾重t2定义为大于等于1的参数。数值越大,尾部越厚,衰减相对于指数函数越慢。

△温度(左)和尾部重量(右)对损失函数结果的影响

也可以通过Google的在线Demo观察t1和t2参数的损失函数的变化。

对噪声数据集的影响

为了证明不同温度t1的影响,Google在合成数据集上训练了一个双层神经网络的二元分类问题。蓝点和红点表示数据的实际类别,两个不同的颜色区域表示神经网络的训练结果,白色是决策边界。

Google使用标准逻辑损失函数和不同温度参数的损失函数来比较无噪声数据集、小余量噪声数据集、大余量噪声数据集和随机噪声数据集这四种情况下的实验结果。

在没有噪声的情况下,两种损失都能产生良好的决策边界,从而成功地分离了这两类损失。

小余量噪声,即噪声数据接近决策边界。可以看出,由于softmax尾部的快速衰减,逻辑损耗会将边界拉伸到更靠近噪声点,以补偿它们的低概率。然而,双稳态损失函数有一个沉重的尾部,并保持边界远离噪声样本。

大余量噪声意味着噪声数据远离决策边界。由于双稳态损失函数的有界性,可以防止这些远离边界的噪声点拉离决策边界。

最后一个实验是随机噪声,噪声点随机分布在向量空之间。逻辑损失受到噪声样本的高度干扰,并且不能收敛到良好的判定边界。然而,双稳态损耗可以收敛到与无噪声情况几乎相同的结果。

门户网站

在线演示:

https://google.github.io/bi-tempered-loss/

博客地址:

https://ai . googleblog . com/2019/08/bi-回火-后勤-以培训换损失. html

论文链接:

https://arxiv.org/abs/1906.03361

1.《tempered 谷歌提出新分类损失函数:将噪声对训练结果影响降到最低》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《tempered 谷歌提出新分类损失函数:将噪声对训练结果影响降到最低》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/tiyu/1080014.html

上一篇

亲爱的麻洋街马晓晓和谁在一起了 欧小剑为什么成了混混结局心疼

下一篇

亲爱的麻洋街电视剧免费观看 全37集资源西瓜视频播放

tara李雅琳 曾被“巨魔”刘花英霸凌,还diss函数fx,这位tara前成员宣布结婚

  • tara李雅琳 曾被“巨魔”刘花英霸凌,还diss函数fx,这位tara前成员宣布结婚
  • tara李雅琳 曾被“巨魔”刘花英霸凌,还diss函数fx,这位tara前成员宣布结婚
  • tara李雅琳 曾被“巨魔”刘花英霸凌,还diss函数fx,这位tara前成员宣布结婚

2016房价走势最新消息:楼市进入高烧模式 楼市暴跌谁损失惨重?

2016年10月25日房价走势最新消息:楼市进入高烧模式,谁损失惨重?说到买房和房价,这应该是每个成年人都会关注的事情。尤其是作为90后,边肖更是感慨万千。看到房价一天比一天贵,我们该计划什么时候买房?在哪里?我们还要等多...

个人信息泄露一年损失915亿元 个人信息在裸奔安全怎么保障?

个人信息泄露一年损失915亿元 个人信息在裸奔安全怎么保障?

12月20日,个人信息泄露,一年损失915亿。如何保证个人信息裸奔的安全? Struts 2漏洞事件 2013年Struts 2漏洞事件是互联网领域最大的网络安全事件之一。Struts是Apache Foundation的...

爱琴海地震已致土耳其92死994伤 地震损失评估有多少

  • 爱琴海地震已致土耳其92死994伤 地震损失评估有多少
  • 爱琴海地震已致土耳其92死994伤 地震损失评估有多少
  • 爱琴海地震已致土耳其92死994伤 地震损失评估有多少

代驾将车开进水池 车主也要损失三成?

2008年1月12日,开车入池的车主也赔了30%?最近有一代司机把车开进池子里,说下雨的时候看不清路。“当时天很黑,还下着雨。司机没有注意到酒店门口的路况,直接把车开进了酒店门口的水池里。车被吊起来的时候已经是7号凌晨3点...

弧度角度 Excel角度弧度转换函数degrees,radians,pi

  • 弧度角度 Excel角度弧度转换函数degrees,radians,pi
  • 弧度角度 Excel角度弧度转换函数degrees,radians,pi
  • 弧度角度 Excel角度弧度转换函数degrees,radians,pi

psf 工程点扩展函数技术可以实现高精度3D成像

  • psf 工程点扩展函数技术可以实现高精度3D成像
  • psf 工程点扩展函数技术可以实现高精度3D成像
  • psf 工程点扩展函数技术可以实现高精度3D成像

环卫车撞上兰博基尼损失超10万 到底什么情况呢?

由于这两天环卫车撞兰博基尼损失超过10万,网上关注度相当高,很多小伙伴可能也关注过环卫车撞兰博基尼超过10万的损失。当然,有些小伙伴不太清楚环卫车撞兰博基尼超过10万的损失,所以无所谓。想知道现在撞兰博基尼的环卫车损失超过...