1.已知
-
假设样本 $x$ 是正样本的概率:
-
将上面这个 $sigmoid$ 函数看做是 $f(x)$ 这个$f(x)$特点:
- $loss \, function$:
2. 推导过程
-
上面的 $loss \, function$ 等价于
-
将上面的式子写成一个式子
- 训练集的总的代价:
-
为了简单起见,公式中的 $x$ ,$w$ 用增广向量表示,用 $f(wx)$ 来表示 $p(y=1 x)$ 。那么:
- 对式子关于$w$求导: