说是“弦长公式”,其实是两点间的距离公式——由于斜率k已知了,所以就能用斜率、横坐标(或纵坐标)表示的式子了。
由于这个公式经常用于求圆锥曲线上的两点间的距离,所以通常就把它叫做“弦长公式”了推导如下:由 直线的斜率公式:k = (y1 - y2) / (x1 - x2)
得y1 - y2 = k(x1 - x2) 或 x1 - x2 = (y1 - y2)/k
分别代入两点间的距离公式:|AB| = √[(x1 - x2) + (y1 - y2) ]
稍加整理即得
AIC实际上是对样本内误差(In Sample Error)的估计量,即在训练样本的基础上,保持自变量不变,观察到一组新的Y‘ (我没看明白这里新的Y‘是根据Y的分布随机生成的,还是根据Y在自变量X的条件分布生成的),然后计算模型在这个新样本中得到的误差的期望值。见Element of Statistical Learning, P229-P232.
如果用的是平方损失函数,系数中的-2来自于E(y-f(x))^2的中间项-2y*f(x)。
Optimism bias - estimates of prediction error
如果是对数似然损失函数,系数中的-2来自于离差前面的-2.
Deviance (statistics)