Cyan's Blog

Search

Search IconIcon to open search

D2L-56-门控循环单元GRU

Last updated Apr 3, 2022 Edit Source

# Gated Recurrent Units (GRU)

2022-04-03

Tags: #GRU #RNN #DeepLearning

GRU

# Gated Hidden State

# Reset Gate and Update Gate

这两个门的公式都是一样的, 使用input $\mathbf{X}{t}$ 和前一个隐状态 $\mathbf{H}{t-1}$ 作为输入, 利用Sigmoid映射到 $(0,1)$ 区间: $$\begin{aligned} &\mathbf{R}{t}=\sigma\left(\mathbf{X}{t} \mathbf{W}{x r}+\mathbf{H}{t-1} \mathbf{W}{h r}+\mathbf{b}{r}\right) \\ &\mathbf{Z}{t}=\sigma\left(\mathbf{X}{t} \mathbf{W}{x z}+\mathbf{H}{t-1} \mathbf{W}{h z}+\mathbf{b}{z}\right) \end{aligned}$$ 不同的是使用它们的方式:

# 候选隐状态

顾名思义, 就是用来生成结果的隐状态, 使用重置门 $\mathbf{R}{t}$, input $\mathbf{X}{t}$ 和前一个隐状态 $\mathbf{H}{t-1}$ 作为输入, 使用tanh激活函数将结果映射到 $(-1,1)$ 区间: $$\tilde{\mathbf{H}}{t}=\tanh \left(\mathbf{X}{t} \mathbf{W}{x h}+\left(\mathbf{R}{t} \odot \mathbf{H}{t-1}\right) \mathbf{W}{h h}+\mathbf{b}{h}\right)$$

# 输出隐状态

总之,门控循环单元具有以下两个显著特征: