Cyan's Blog

Search

Search IconIcon to open search

D2L-22-权重衰减

Last updated Feb 12, 2022 Edit Source

# 权重衰减

2022-02-12

Tags: #Regularization #DeepLearning

Links:

# Intuition

Norm in Regularization - Intuition


# 推导3

对于以下损失函数: $$L(\mathbf{w}, b)=\frac{1}{n} \sum_{i=1}^{n} \frac{1}{2}\left(\mathbf{w}^{\top} \mathbf{x}^{(i)}+b-y^{(i)}\right)^{2}$$

$$\mathbf{w} \leftarrow(1-\eta \lambda) \mathbf{w}-\frac{\eta}{|\mathcal{B}|} \sum_{i \in \mathcal{B}} \mathbf{x}^{(i)}\left(\mathbf{w}^{\top} \mathbf{x}^{(i)}+b-y^{(i)}\right)$$

# 两种限制方式的等价性

# Tikhonov Regularization

# 实现


  1. 4.6. 暂退法(Dropout) — 动手学深度学习 2.0.0-beta0 documentation ↩︎

  2. 4.5. 权重衰减 — 动手学深度学习 2.0.0-beta0 documentation ↩︎

  3. 4.5. 权重衰减 — 动手学深度学习 2.0.0-beta0 documentation ↩︎

  4. 吉洪诺夫正则化 - 维基百科,自由的百科全书 English: Tikhonov regularization - Wikipedia ↩︎

  5. 就是写 PRML 那本书 的 Bishop ↩︎

  6. 13 丢弃法【动手学深度学习v2】_哔哩哔哩_bilibili ↩︎