深度学习(26)随机梯度下降四: 损失函数的梯度
生活随笔
收集整理的這篇文章主要介紹了
深度学习(26)随机梯度下降四: 损失函数的梯度
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
深度學習(26)隨機梯度下降四: 損失函數的梯度
- 1. Mean Squared Error(MSE)
- 2. Cross Entropy Loss
- CrossEntropy
- 3. Softmax
- (1) Derivative
- (2) Crossentropy gradient
Outline
- Mean Squared Error
- Cross Entropy Loss
1. Mean Squared Error(MSE)
- loss=∑[y?fθ(x)]2loss=∑[y-f_θ (x)]^2loss=∑[y?fθ?(x)]2
- ?loss?θ=2∑[y?fθ(x)]??fθ(x)?θ\frac{?loss}{?θ}=2∑[y-f_θ (x)] *\frac{?f_θ (x)}{?θ}?θ?loss?=2∑[y?fθ?(x)]??θ?fθ?(x)?
- fθ(x)=sigmoid(XW+b)f_θ (x)=sigmoid(XW+b)fθ?(x)=sigmoid(XW+b)
- fθ(x)=relu(XW+b)f_θ (x)=relu(XW+b)fθ?(x)=relu(XW+b)
MSE Gradient
注: 如果不寫tape.watch([w, b])的話,就需要將w和b手動轉換為Variable類型。
2. Cross Entropy Loss
CrossEntropy
- H([0,1,0],[p0,p1,p2])=DKL(p│q)=?1log??p1H([0,1,0],[p_0,p_1,p_2 ])=D_{KL} (p│q)=-1 \log?{p_1}H([0,1,0],[p0?,p1?,p2?])=DKL?(p│q)=?1log?p1?
- ddxlog?2?(x)=1x?ln?(2)\fracozvdkddzhkzd{dx} \log_2?{(x)}=\frac{1}{x?ln?(2)}dxd?log2??(x)=x?ln?(2)1?
- p=softmax(logits)p=softmax(logits)p=softmax(logits)
3. Softmax
- soft version of max
(1) Derivative
(2) Crossentropy gradient
參考文獻:
[1] 龍良曲:《深度學習與TensorFlow2入門實戰》
總結
以上是生活随笔為你收集整理的深度学习(26)随机梯度下降四: 损失函数的梯度的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微软推出 Xbox Series “星空
- 下一篇: 深度学习(27)随机梯度下降五: 单输出