base_network

外界导入包 from utils import *

“”"Bi-LSTM Encoder

    Args:input_size: (int) vocab word2vec dimhidden_size: (int) hidden size in Bi-LSTMnum_layers: (int) num_layers in Bi-LSTMbi: (boolean) Bi-direction"""

初始化 Bi-LSTM参数

    self.input_size = input_sizeself.hidden_size = hidden_sizeself.num_layers = num_layersself.bi = bi

Model

nn.LSTM(self.input_size,
self.hidden_size,
num_layers=self.num_layers,
batch_first=True,
bidirectional=self.bi)

前向

def forward(self, *input):self.rnn.flatten_parameters()x_emb, x_len, return_type = input  # (batch_size, max_len, word2vec_dim) (batch_size, )# BiLSTMtotal_length = x_len.max()x_packed = nn.utils.rnn.pack_padded_sequence(x_emb, x_len.cpu(), batch_first=True, enforce_sorted=False)out_lstm, hidden = self.rnn(x_packed)out, _ = nn.utils.rnn.pad_packed_sequence(out_lstm, batch_first=True, total_length=total_length)# vector representif return_type == 'mean_pooling':out = out.sum(dim=1).div(x_len.float().unsqueeze(-1))  # (batch_size, num_directions * hidden_size)elif return_type == 'all_return':  # (batch_size, max_len, num_directions * hidden_size)passreturn out

代码解释

self.rnn.flatten_parameters()
重置参数数据指针，以遍使用更快的代码路径。

nn.utils.rnn.pack_padded_sequence

在使用pytorch处理数据时，一般是采用batch的形式同时处理多个样本序列，而每个batch中的样本序列是不等长的，导致rnn无法处理。所以，通常的做法是先将每个batch按照最长的序列进行padding处理等长的形式
（通常，将每个batch按照最长的序列进行padding处理等长的方式）

但padding操作会带来一个问题，那就是对于多数进行padding过的序列，会导致rnn对它的表示多了很多无用的字符，我们希望的是在最后一个有用的字符后就可以输出该序列的向量表示，而不是在很多padding字符后。

这时候，pack操作就派上场了，可以理解成，它是将一个经过padding后的变长序列压紧****，压缩后就不含padding的字符0了。具体操作就是：

第一步，padding后的输入序列先经过nn.utils.rnn.pack_padded_sequence，这样会得到一个PackedSequence类型的object，可以直接传给RNN（RNN的源码中的forward函数里上来就是判断输入是否是PackedSequence的实例，进而采取不同的操作，如果是则输出也是该类型。）；
第二步，得到的PackedSequence类型的object，正常直接传给RNN，得到的同样是该类型的输出；
第三步，再经过nn.utils.rnn.pad_packed_sequence，也就是对经过RNN后的输出重新进行padding操作，得到正常的每个batch等长的序列。

向量表示

if return_type == ‘mean_pooling’:
out = out.sum(dim=1).div(x_len.float().unsqueeze(-1)) # (batch_size, num_directions * hidden_size)
elif return_type == ‘all_return’: # (batch_size, max_len, num_directions * hidden_size)
pass
return out

会自己调整输出压缩至-1维度。

慢慢的自己将其研究透彻，都行啦的回事与打算。
明天自己把双向LSTM也看一看，都行啦，自己将其研究透彻都行啦的回事与打算。
把模型看看，然后自己对比以下代码，经模型经过给其搞透彻。
全部要学会掌握，都行啦的样子与打算。慢慢的自己整理都行啦的回事与打算。

上一篇：tomcat 如何启动的 spring-ioc 容器

下一篇：一种信息系统免疫安全防护架构

base_network

base_network

外界导入包 from utils import *

初始化 Bi-LSTM参数

Model

前向

代码解释

nn.utils.rnn.pack_padded_sequence

向量表示

会自己调整输出压缩至-1维度。

相关内容

热门资讯