之前在《 》一文中提过,Logit应该理解成Log-it,这里的it指的是Odds(“胜率”,等于P/1-P)。一个 Logit变换 就是从概率P到的过程,如下图所示:
当我们讨论Logit的模型时候,指的是下面这种形式:
注意,等号的右边是自变量的 线性组合 。
我记得以前在学《数学建模》的时候,有一个 人口增长模型 :(1)如果没有资源限制的话,人口随时间的变化率 和总人口的数量( )呈 线性 关系(人口越多,繁殖的越快)——这就是 指数增长模型 (Exponential Growth,见下图左侧)。(2)实际情况下,由于受到环境、资源等各方面的限制,人口变化曲线一般呈S-型——起初人口数量较少的时候增长率较低,然后随着时间的推移逐渐增加;当达到资源限制的瓶颈(K)的时候,增长率又下降至零——我们把这种 非线性 的S-型增长模型称之为 Logistic Growth ,如下图右侧所示。
求解上图右侧(Logistic Growth)对应的微分方程 。令 可得:
结合初始条件 时 ,可以得到微分方程的解为:
由于人口数量N总是小于阈值K(在 时刻的人口数量 小于K),所以 ,故而 是一个大于0的数。我们总能找到一个常数 使得 成立。这样上式就可以简化为:
更进一步:用 替换 、 替换 ,然后再把自变量换成 ,可以得到一个看起来更加舒服的式子:
(2)式即为 Logistic函数 。有没有觉得这个式子很眼熟?
对于(1)式的Logit模型,只考虑一个自变量时:
两边同时做指数运算(求e次方):
然后整理可得:
(2)、(3)不是一样的么?
所以,Logit 模型和Logistic模型是一回事。
当我们说 Logit模型 的时候,一般指的就是这个式子:
当我们说 Logistic模型 的时候,一般指的是这个式子:
小结一下:
(1)Logit模型的左侧是Odds的对数,而Logistic模型的左侧是概率。
(2)Logit模型的右侧是一个线性结构,而Logistic模型的右侧是非线性的。
(3)二者可以相互转化。
题外话:Logit模型是基于 效用理论 (可以参见上一篇文章: )推导出来的,而Logistic函数可以通过求解微分方程得到。两者最后竟然异曲同工——不得不承认数学的神奇!
【本篇完】
关注【DCM笔记】公众号,私信作者获取相关专栏文章中的 练习数据 和 代码:
标签:模型,Logit,Logistic