當前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习（28）随机梯度下降六: 多输出感知机梯度

發布時間：2023/12/15 pytorch 26 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习（28）随机梯度下降六: 多输出感知机梯度小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Perceptron
單輸出感知機梯度

$?E?wj0=(O01?t)O0(1?O0)xj0\frac{?E}{?w_{j0}}=(O_0^1-t)O_0 (1-O_0)x_j^0$

如上圖所示，共有 $n \times m$ 個連接（即權重）;

損失函數 $l o s s$ 為:
$E=12(O0i?ti)2E=\frac{1}{2} (O_0^i-t_i)^2$
對 $w_{jk}$ 求偏導數:
$?E?wjk=(Ok?tk)?Ok?wjk\frac{?E}{?w_{jk}}=(O_k-t_k)\frac{?O_k}{?w_{jk}}$
$O_k=σ(x_k)$ :
$?E?wjk=(Ok?tk)?σ(xk)?wjk\frac{?E}{?w_{jk}}=(O_k-t_k)\frac{?σ(x_k)}{?w_{jk}}$
$?σ(xk)?wjk=?σ(xk)?xk??xk?wjk\frac{?σ(x_k)}{?w_{jk}}=\frac{?σ(x_k)}{?x_k }\cdot\frac{?x_k}{?w_{jk}}$ ，其中 $?σ(xk)?xk=σ(xk)(1?σ(xk))\frac{?σ(x_k)}{?x_k }=σ(x_k)(1-σ(x_k))$ :
$?E?wjk=(Ok?tk)σ(xk)(1?σ(xk))?xk1?wjk\frac{?E}{?w_{jk}}=(O_k-t_k)σ(x_k)(1-σ(x_k))\frac{?x_k^1}{?w_{jk}}$
$O_k=σ(x_k)$ :
$?E?wjk=(Ok?tk)Ok(1?Ok)?xk1?wjk\frac{?E}{?w_{jk}}=(O_k-t_k)O_k (1-O_k)\frac{?x_k^1}{?w_{jk}}$
因為 $x_k^1=x_0^0 w_{0k}^1+x_1^0 w_{1k}^1+x_2^0 w_{2k}^1+?+x_j^0 w_{jk}^1+?+x_n^0 w_{nk}^1$ ，所以:
$?E?wjk=(Ok?tk)Ok(1?Ok)?xk1?wjk=(Ok?tk)Ok(1?Ok)xj0\frac{?E}{?w_{jk}}=(O_k-t_k)O_k (1-O_k)\frac{?x_k^1}{?w_{jk}} =(O_k-t_k)O_k (1-O_k)x_j^0$

綜上所述，單輸出感知機梯度為:
$?E?wjk=(Ok?tk)Ok(1?Ok)xj0\frac{?E}{?w_{jk}}=(O_k-t_k)O_k (1-O_k)x_j^0$

參考文獻:
[1] 龍良曲:《深度學習與TensorFlow2入門實戰》

以上是生活随笔為你收集整理的深度学习（28）随机梯度下降六: 多输出感知机梯度的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。