Source code for daart.models.rnn

"""RNN models (LSTM/GRU) implemented in PyTorch."""

from torch import nn
from daart.models.base import BaseModel

# to ignore imports for sphix-autoapidoc
__all__ = ['RNN']


[docs]class RNN(BaseModel):

    def __init__(self, hparams, type='encoder', in_size=None, hid_size=None, out_size=None):
        super().__init__()
        self.hparams = hparams
        self.backbone = hparams.get('backbone', 'lstm').lower()
        self.model = nn.ModuleList()
        if type == 'encoder':
            in_size_ = hparams['input_size'] if in_size is None else in_size
            hid_size_ = hparams['n_hid_units'] if hid_size is None else hid_size
            out_size_ = hparams['n_hid_units'] if out_size is None else out_size
            self._build_rnn(
                in_size=in_size_, hid_size=hid_size_, out_size=out_size_, global_layer_num=0)
        else:
            in_size_ = hparams['n_hid_units'] if in_size is None else in_size
            hid_size_ = hparams['n_hid_units'] if hid_size is None else hid_size
            out_size_ = hparams['input_size'] if out_size is None else out_size
            self._build_rnn(
                in_size=in_size_, hid_size=hid_size_, out_size=out_size_, global_layer_num=0)

    def _build_rnn(self, in_size, hid_size, out_size, global_layer_num=0):

        # RNN layers
        if self.backbone == 'lstm':
            layer = nn.LSTM(
                input_size=in_size,
                hidden_size=hid_size,
                num_layers=self.hparams['n_hid_layers'],
                batch_first=True,
                bidirectional=self.hparams['bidirectional'])
            name = str('LSTM_layer_%02i' % global_layer_num)
        elif self.backbone == 'gru':
            layer = nn.GRU(
                input_size=in_size,
                hidden_size=hid_size,
                num_layers=self.hparams['n_hid_layers'],
                batch_first=True,
                bidirectional=self.hparams['bidirectional'])
            name = str('GRU_layer_%02i' % global_layer_num)
        else:
            raise NotImplementedError(
                'Invalid backbone "%s"; must choose "lstm" or "gru"' % self.model_type)
        self.model.add_module(name, layer)

        # update layer info
        global_layer_num += 1

        # final linear layer
        final_encoder_size = (int(self.hparams['bidirectional']) + 1) * hid_size
        layer = nn.Linear(in_features=final_encoder_size, out_features=out_size)
        name = str('dense(prediction)_layer_%02i' % global_layer_num)
        self.model.add_module(name, layer)

        # update layer info
        global_layer_num += 1

        return global_layer_num

[docs]    def forward(self, x, **kwargs):
        """Process input data.

        Parameters
        ----------
        x : torch.Tensor object
            input data of shape (n_sequences, sequence_length, n_markers)

        Returns
        -------
        torch.Tensor
            shape (n_sequences, sequence_length, n) where n is the embedding dimension if an
            encoder, or n_markers if a decoder/predictor

        """

        # push data through encoder to get latent embedding
        # x = B x T x N (e.g. B = 2, T = 500, N = 16)
        for name, layer in self.model.named_children():
            if name[:4] == 'LSTM' or name[:3] == 'GRU':
                x, _ = layer(x)
            else:
                x = layer(x)

        return x