pytorch中nn.RNN()怎么使用-编程学习网

这篇文章主要介绍“pytorch中nn.RNN()怎么使用”，在日常操作中，相信很多人在pytorch中nn.RNN()怎么使用问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”pytorch中nn.RNN()怎么使用”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

参数说明

input_size输入特征的维度，一般rnn中输入的是词向量，那么 input_size 就等于一个词向量的维度
hidden_size隐藏层神经元个数，或者也叫输出的维度（因为rnn输出为各个时间步上的隐藏状态）
num_layers网络的层数
nonlinearity激活函数
bias是否使用偏置
batch_first输入数据的形式，默认是 False，就是这样形式，(seq(num_step), batch, input_dim)，也就是将序列长度放在第一位，batch 放在第二位
dropout是否应用dropout, 默认不使用，如若使用将其设置成一个0-1的数字即可
birdirectional是否使用双向的 rnn，默认是 False
注意某些参数的默认值在中已注明

输入输出shape

input_shape = [时间步数, 批量大小, 特征维度] = [num_steps(seq_length), batch_size, input_dim]
在前向计算后会分别返回输出和隐藏状态h，其中输出指的是隐藏层在各个时间步上计算并输出的隐藏状态，它们通常作为后续输出层的输⼊。需要强调的是，该“输出”本身并不涉及输出层计算，形状为(时间步数, 批量大小, 隐藏单元个数)；隐藏状态指的是隐藏层在最后时间步的隐藏状态：当隐藏层有多层时，每⼀层的隐藏状态都会记录在该变量中；对于像⻓短期记忆（LSTM），隐藏状态是⼀个元组(h, c)，即hidden state和cell state(此处普通rnn只有一个值)隐藏状态h的形状为(层数, 批量大小,隐藏单元个数)

代码

rnn_layer = nn.RNN(input_size=vocab_size, hidden_size=num_hiddens, )# 定义模型， 其中vocab_size = 1027, hidden_size = 256

num_steps = 35batch_size = 2state = None    # 初始隐藏层状态可以不定义X = torch.rand(num_steps, batch_size, vocab_size)Y, state_new = rnn_layer(X, state)print(Y.shape, len(state_new), state_new.shape)

输出

torch.Size([35, 2, 256]) 1 torch.Size([1, 2, 256])

具体计算过程
H t = i n p u t &lowast; W x h + H t − 1 &lowast; W h h + b i a s H_t = input * W_{xh} + H_{t-1} * W_{hh} + bias Ht=input&lowast;Wxh+Ht−1&lowast;Whh+bias
[batch_size, input_dim] * [input_dim, num_hiddens] + [batch_size, num_hiddens] *[num_hiddens, num_hiddens] +bias
可以发现每个隐藏状态形状都是[batch_size, num_hiddens], 起始输出也是一样的
注意：上面为了方便假设num_step=1

GRU/LSTM等参数同上面RNN

到此，关于“pytorch中nn.RNN()怎么使用”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注编程网网站，小编会继续努力为大家带来更多实用的文章！

文章详情

pytorch中nn.RNN()怎么使用

参数说明

输入输出shape

代码

GRU/LSTM等参数同上面RNN

软考中级精品资料免费领

相关文章

猜你喜欢

pytorch中nn.RNN()怎么使用

Python中Pytorch怎么使用

PyTorch中torch.utils.data.DataLoader怎么使用

pytorch中nn.Dropout怎么使用

pytorch中[..., 0]怎么使用

Pytorch中怎么使用TensorBoard

pytorch中with torch.no_grad()怎么使用

PyTorch中的nn.Embedding怎么使用

pytorch中Parameter函数怎么使用

Pytorch中的torch.distributions库怎么使用

PyTorch中torch.matmul()函数怎么使用

PyTorch中的nn.Module类怎么使用

PyTorch torch.utils.data.Dataset怎么使用

Pytorch nn.Dropout怎么使用

怎么在pytorch中使用float64训练

Pytorch中的model.train()和model.eval()怎么使用

pytorch中的view()函数怎么使用

Pytorch怎么使用transforms

BCELoss和BCEWithLogitsLoss怎么在Pytorch中使用

Optimizer与optimizer.step()怎么在pytorch中使用