介绍

通过最大似然估计值来衡量损失。
最大似然估计的原理是：找到一组估计值，使得未知参数取该组估计值时，观察值以最大概率出现。

设总体 $X$ 为离散型随机变量，其分布律为 $P(X=xk)=p(xk,θ),k=1,2…P(X=x_k)=p(x_k,\theta), k=1,2\dots$ ，其中 $θ\theta$ 是待估参数，则 $X1=x−1，X2=x2,…,XN=xnX_1=x-1，X_2=x_2,\dots,X_N=x_n$ 的概率为：
$P(X1=x−1，X2=x2,…,XN=xn)=∏k=1nP(Xk=xk)=∏k=1np(xk,θ)P(X_1=x-1，X_2=x_2,\dots,X_N=x_n)=\prod\limits_{k=1}\limits^{n}P(X_k=x_k)=\prod\limits_{k=1}\limits^{n}p(x_k,\theta)$ .
上式是 $θ\theta$ 的函数，称为 似然函数，记为 $L(θ)L(\theta)$ ，即
$L(θ)=L(θ;x1,x2,⋯,xn)=∏k=1np(xk,θ)L(\theta)=L(\theta;x_1,x_2,\cdots,x_n)=\prod\limits_{k=1}\limits^{n}p(x_k,\theta)$

上式完全是乘积的形式，大多数情况下会取个对数，方便求解或者不会溢出。

从另外一个角度来理解似然函数：当似然函数取最大值时，意味着这组参数一定程度上非常贴合所给数据分布，也就是说，在这组参数下，模型预测的值和真实值相对来说比较接近，也就是损失函数较小。

为了能够直接利用上述似然函数来表达损失函数的定义【损失值越小越好】，对取了对数的似然函数再取个负号。

参考资料

[1] 对数损失函数是如何度量损失的？-知乎
[2]《概率统计与数据处理》-曹菊生；魏国强

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 162202241@qq.com 举报，一经查实，本站将立刻删除。

1313e

如何理解对数似然损失函数

介绍

参考资料

取消回复欢迎您发表评论:

默认分类  校内比赛单词序列

默认分类  牛客-网易2018，第四题，游历魔法王国

默认分类  一本通洛谷——P1120 小木棍［数据加强版］——题解

默认分类  window服务器cpu过高的排查_一次简单的服务器 cpu 占用率高的快速排查实战

数据库  django同一个项目中连接多个数据库

1313e

如何理解对数似然损失函数

介绍

参考资料

取消回复欢迎您发表评论:

默认分类 校内比赛 单词序列

默认分类 牛客-网易2018，第四题，游历魔法王国

默认分类 一本通洛谷——P1120 小木棍 ［数据加强版］——题解

默认分类 window服务器cpu过高的排查_一次简单的服务器 cpu 占用率高的快速排查实战

数据库 django同一个项目中连接多个数据库

默认分类校内比赛单词序列

默认分类牛客-网易2018，第四题，游历魔法王国

默认分类一本通洛谷——P1120 小木棍［数据加强版］——题解