网易首页 > 网易号 > 正文 申请入驻

从熵到交叉熵损失的直观通俗的解释

0
分享至

对于机器学习和数据科学的初学者来说,必须清楚熵和交叉熵的概念。 它们是构建树、降维和图像分类的关键基础。

在本文中,我将尝试从信息论的角度解释有关熵的概念,当我第一次尝试掌握这个概念时,这非常有帮助。 让我们看看它是如何进行的。

什么是-log(p)?

信息论的主要关注点之一是量化编码和传输事件所需的总比特数:罕见的事件即概率较低的事件,需要表示更多位,而频繁事件不需要很多位。因此我们可以从编码器和通信机的角度出发,将-log(p)定义为编码和传输符合p概率分布的事件所需的总比特数,即信息。 小 p(罕见事件)导致大 -log(p)(更多位)。

-log P(x) = log (1/P(x))

从事件观察者的角度来看,我们可以将 -log(p)理解为是观察事件的“惊讶”的程度(事件发生的概率越小,我们的惊讶程度越高)。 例如如果抛硬币的 p(head) = 0.99 和 p(tail) = 0.01,如果抛硬币是tail人们肯定会惊讶。 计算 -log(p(tail)) = 6.644,远大于 -log(p(head)) = 0.014。这就是 -log(p) 的直观含义。

熵,意料之中的惊喜

在上面讨论之后,我们可以定义概率分布为p(x)的事件的预期以外惊讶程度并称其为熵。正式一些的说法是:熵是量化事件可能结果中固有的不确定性水平(对我们来说不确定性带来的就是意外的惊喜,当然也有可能是惊吓)。 对于连续变量 x,熵可以写为,

回到信息论,从编码器和通信机的角度来看,这量化了表示遵循概率分布p(x)的随机选择事件所需的比特数。例如一个包含圆形和三角形的盒子并回忆化学课上熵的概念! 偏态分布(许多圆圈和少量三角形)意味着低熵,因为选择不确定性水平很低,这意味着确信选择圆圈的概率更大。

交叉熵,用于机器学习

现在让我们切换一下思路,机器学习的主要目标是找到并声明一个最能模拟(近似)真实数据分布的概率分布。 交叉熵提供了一种使用分布 Q 来量化按照分布 P 编码数据所需的平均位数的方法。

听着很绕口对吧,下面这个概念可能更复杂。这个量Q可以通过以下关系从熵中获得:(原始比特)+(额外比特)=(总比特)。 (额外比特)部分就是所谓的 KL 散度,在统计学中常用来衡量两个分布之间的距离,也被称为相对熵。

在图像分类中,经常会遇到对于 N 类的交叉熵损失,如下表示,其中 y{i} 和 {y{i}}冒 分别是实际标签和预测。 当 N = 2时交叉熵损失将简单地变成逻辑回归中使用的log损失。

总结

· -log(p) 只是表达对以概率 p 观察到事件的惊讶程度的一种奇特方式。罕见事件(低 p)导致惊讶程度高。

· 如果整合所有事件的”惊讶程度“,就会得到预期的”惊讶“,我们称之为熵。如果高熵则意味着事件的可能结果中固有的不确定性水平很高。

· 交叉熵考虑了近似于真实分布 P 的分布 Q,并使用分布 Q 测量表示遵循分布 P 的数据所需的比特数。

· 交叉熵损失是量化我们的机器学习模型对数据真实分布 (P) 的近似 (Q) 的好坏程度 (Q) 的好方法。请注意,Log损失只是一个二元交叉熵损失。

希望本篇文章能够帮助你对熵是什么以及它如何连接到交叉熵以进行机器学习有了更好的了解。

作者:david.h.kang

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何超盈携女在5亿别墅过圣诞,母女穿亲子装,三层豪宅尽显气派

何超盈携女在5亿别墅过圣诞,母女穿亲子装,三层豪宅尽显气派

喜欢历史的阿繁
2025-12-17 10:35:08
马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

马斯克收心了?官宣了39岁印度裔伴侣:相貌普通为他生了4个孩子

丰谭笔录
2025-12-12 11:16:23
我退休后回老家养老,村书记摆架子要给我上一课,不料县长来考察

我退休后回老家养老,村书记摆架子要给我上一课,不料县长来考察

五元讲堂
2025-12-04 11:49:42
演员张澍:许亚军为她放弃买第二套房子,何晴儿子对她称呼太有爱

演员张澍:许亚军为她放弃买第二套房子,何晴儿子对她称呼太有爱

娱说瑜悦
2025-12-18 17:20:46
中国不丹争议地区加速收回,4500 平方公里,中国建村固边难挡

中国不丹争议地区加速收回,4500 平方公里,中国建村固边难挡

墨兰史书
2025-12-12 02:05:03
广东擒广州!专家点评:外援都主动给徐杰!杜峰:批球员不专注!

广东擒广州!专家点评:外援都主动给徐杰!杜峰:批球员不专注!

独坐山巅前
2025-12-20 06:44:49
张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

张含韵的奶欲更勾人,36岁依旧童颜,身材却饱满成熟韵味满满

草莓解说体育
2025-11-20 13:10:19
这才对嘛!卢伟弃用强援,重用辽篮双星,斩获大胜,新星空砍32分

这才对嘛!卢伟弃用强援,重用辽篮双星,斩获大胜,新星空砍32分

萌兰聊个球
2025-12-19 21:45:02
郭士强世预赛该带他?徐杰17+9+5三分完胜郭艾伦 总助攻超王仕鹏

郭士强世预赛该带他?徐杰17+9+5三分完胜郭艾伦 总助攻超王仕鹏

醉卧浮生
2025-12-19 21:49:22
罗永浩炮轰上海电信后终于理解为何运营商要喜欢光猫拨号了

罗永浩炮轰上海电信后终于理解为何运营商要喜欢光猫拨号了

林子说事
2025-12-20 05:45:35
贝壳这一出,不是蠢,就是坏!

贝壳这一出,不是蠢,就是坏!

大嘴説
2025-12-18 10:02:11
结婚前因为什么事最后退婚?网友:准婆婆想立规矩 结果人家不嫁了

结婚前因为什么事最后退婚?网友:准婆婆想立规矩 结果人家不嫁了

另子维爱读史
2025-12-17 22:34:17
夫妻凌晨吵架“互曝猛料”:我酒驾,她也酒驾

夫妻凌晨吵架“互曝猛料”:我酒驾,她也酒驾

现代快报
2025-12-19 12:46:05
朱孝天风波升级!柴智屏吐槽他不太世故,性格20多年依旧没变

朱孝天风波升级!柴智屏吐槽他不太世故,性格20多年依旧没变

小徐讲八卦
2025-12-18 14:41:46
102岁医生分享活到100岁的7个长寿习惯:原来这么简单!

102岁医生分享活到100岁的7个长寿习惯:原来这么简单!

原来仙女不讲理
2025-12-18 20:07:00
中国为什么迟迟不收复台湾,普京一句话道出其中原委!台精辟!

中国为什么迟迟不收复台湾,普京一句话道出其中原委!台精辟!

老澽爆笑大聪明
2025-12-20 06:46:28
向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

面包夹知识
2025-12-19 18:22:06
杨瀚森再遭教练弃用惹众怒,开拓者领先18分被追平,加时险些翻车

杨瀚森再遭教练弃用惹众怒,开拓者领先18分被追平,加时险些翻车

二哥聊球
2025-12-19 21:07:06
韩国海警举旗冲锋苏岩礁!强拆中方设施反被围,中方贴脸开大了

韩国海警举旗冲锋苏岩礁!强拆中方设施反被围,中方贴脸开大了

观察者小海风
2025-12-18 19:48:04
向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

音乐时光的娱乐
2025-12-20 00:52:25
2025-12-20 08:03:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1864文章数 1440关注度
往期回顾 全部

科技要闻

许四清:具身智能的"ChatGPT时刻"还未到来

头条要闻

普京罕见回应私人生活 大方承认正在恋爱中

头条要闻

普京罕见回应私人生活 大方承认正在恋爱中

体育要闻

“恶龙”埃托奥,正在毁灭喀麦隆足球

娱乐要闻

曲协表态仅6天,郭德纲担心的事还是发生

财经要闻

日元加息,恐慌来了?货币三国杀

汽车要闻

“一体压铸”再引热议 一旦受损真的修不起吗?

态度原创

旅游
本地
手机
时尚
公开课

旅游要闻

黑龙江哈尔滨:“冷资源”点亮热经济

本地新闻

云游安徽|访黄山云海古村,读一城山水风骨

手机要闻

iOS 26.1停止签名,苹果iPhone 17等用户升级iOS 26.2后无法降级

痛经的女性,正在猛灌中男“保健酒”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版