Source code for zoo.models.recommendation.txt

#
# Copyright 2018 Analytics Zoo Authors.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#

from mxnet import gluon
from gluonnlp.model.transformer import TransformerEncoder, TransformerEncoderCell


[docs]class MeanMaxPooling(gluon.nn.HybridBlock):
    def __init__(self, axis=1, dropout=0.0, prefix=None, params=None, **kwargs):
        super(MeanMaxPooling, self).__init__(**kwargs)
        # super().__init__(prefix=prefix, params=params)
        self.axis = axis
        self.dropout = dropout

[docs]    def hybrid_forward(self, F, inputs):
        mean_out = F.mean(data=inputs, axis=self.axis)
        max_out = F.max(data=inputs, axis=self.axis)
        outputs = F.concat(mean_out, max_out, dim=1)
        if self.dropout:
            outputs = F.Dropout(data=outputs, p=self.dropout)
        # outputs = F.LayerNorm(outputs)
        return outputs


[docs]class SequenceTransformer(gluon.nn.HybridBlock):
    def __init__(self, num_items, item_embed, item_hidden_size, item_max_length, item_num_heads,
                 item_num_layers, item_transformer_dropout, item_pooling_dropout, cross_size,
                 prefix=None, params=None, **kwargs):
        super(SequenceTransformer, self).__init__(**kwargs)
        # super().__init__(prefix=prefix, params=params)
        with self.name_scope():
            self.item_pooling_dp = MeanMaxPooling(dropout=item_pooling_dropout)
            self.item_encoder = TransformerEncoder(units=item_embed,
                                                   hidden_size=item_hidden_size,
                                                   num_heads=item_num_heads,
                                                   num_layers=item_num_layers,
                                                   max_length=item_max_length,
                                                   dropout=item_transformer_dropout)
            self.embedding = gluon.nn.Embedding(input_dim=num_items, output_dim=item_embed)
            self.dense = gluon.nn.Dense(cross_size)

[docs]    def hybrid_forward(self, F, input_item, item_valid_length=None):
        item_embed_out = self.embedding(input_item)
        item_encoding, item_att = self.item_encoder(
            inputs=item_embed_out, valid_length=item_valid_length)
        item_out = self.item_pooling_dp(item_encoding)
        item_out = self.dense(item_out)

        return item_out


[docs]class ContextTransformer(gluon.nn.HybridBlock):
    def __init__(self, context_dims, context_embed, context_hidden_size,
                 context_num_heads, context_transformer_dropout, context_pooling_dropout,
                 cross_size, prefix=None, params=None, **kwargs):
        super(ContextTransformer, self).__init__(**kwargs)
        # super().__init__(prefix=prefix, params=params)
        self.context_dims = context_dims
        self.context_embed = context_embed
        self.cross_size = cross_size
        with self.name_scope():
            self.context_pooling_dp = MeanMaxPooling(dropout=context_pooling_dropout)
            self.context_encoder = TransformerEncoderCell(units=context_embed,
                                                          hidden_size=context_hidden_size,
                                                          num_heads=context_num_heads,
                                                          dropout=context_transformer_dropout
                                                          )
            self.dense = gluon.nn.Dense(self.cross_size)
            self.embeddings = gluon.nn.HybridSequential()
            for i, context_dim in enumerate(self.context_dims):
                self.embeddings.add(gluon.nn.Embedding(self.context_dims[i], self.context_embed))

[docs]    def hybrid_forward(self, F, input_context_list):
        context_embed = [
            self.embeddings[i](input_context) for i, input_context in enumerate(input_context_list)]
        context_input = []
        for i in context_embed:
            context_input.append(F.expand_dims(i, axis=1))
        context_embedding = F.concat(*context_input, dim=1)
        context_encoding, context_att = self.context_encoder(context_embedding)
        context_out = self.context_pooling_dp(context_encoding)
        context_out = self.dense(context_out)

        return context_out


[docs]class TxT(gluon.nn.HybridBlock):
    def __init__(self, num_items, context_dims, item_embed=100, context_embed=100,
                 item_hidden_size=256, item_max_length=8, item_num_heads=4, item_num_layers=2,
                 item_transformer_dropout=0.0, item_pooling_dropout=0.1, context_hidden_size=256,
                 context_num_heads=2, context_transformer_dropout=0.0, context_pooling_dropout=0.0,
                 act_type="gelu", cross_size=100, prefix=None, params=None, **kwargs):
        super(TxT, self).__init__(**kwargs)
        self.act_type = act_type
        with self.name_scope():
            self.sequence_transformer = SequenceTransformer(
                num_items=num_items,
                item_embed=item_embed,
                item_hidden_size=item_hidden_size,
                item_max_length=item_max_length,
                item_num_heads=item_num_heads,
                item_num_layers=item_num_layers,
                item_transformer_dropout=item_transformer_dropout,
                item_pooling_dropout=item_pooling_dropout,
                cross_size=cross_size,
                prefix=prefix, params=params
            )
            self.context_transformer = ContextTransformer(
                context_dims=context_dims,
                context_embed=context_embed,
                context_hidden_size=context_hidden_size,
                context_num_heads=context_num_heads,
                context_transformer_dropout=context_transformer_dropout,
                context_pooling_dropout=context_pooling_dropout,
                cross_size=cross_size,
                prefix=prefix, params=params
            )
            self.dense1 = gluon.nn.Dense(units=num_items//2)
            if act_type == "relu":
                self.act = gluon.nn.Activation(activation="relu")
            elif act_type == "gelu":
                self.act = gluon.nn.GELU()
            elif act_type == "leakyRelu":
                self.act = gluon.nn.LeakyReLU(alpha=0.2)
            else:
                raise NotImplementedError
            self.dense2 = gluon.nn.Dense(units=num_items, activation=None)

[docs]    def hybrid_forward(self, F, input_item, item_valid_length, input_context_list):
        item_outs = self.sequence_transformer(input_item, item_valid_length)
        context_outs = self.context_transformer(input_context_list)

        outs = F.broadcast_mul(item_outs, context_outs)
        outs = self.dense1(outs)
        outs = self.act(outs)
        outs = self.dense2(outs)

        return outs