fix: config bug

j5g-moon · j5g-moon · commit 1f690055ee40 · 2020-10-06T09:19:48.000+09:00
diff --git a/src/model/decoder.py b/src/model/decoder.py
@@ -24,9 +24,9 @@ def __init__(self, is_base: bool = True):
 
         self.masked_mha = MultiHeadAttention(masked_attention=True)
         self.mha = MultiHeadAttention(masked_attention=False)
-        self.ln = LayerNorm(self.config.train_hparams.eps)
+        self.ln = LayerNorm(self.config.model.train_hparams.eps)
         self.ffn = FeedForwardNetwork()
-        self.residual_dropout = nn.Dropout(p=self.config.model_params.dropout)
+        self.residual_dropout = nn.Dropout(p=self.config.model.model_params.dropout)
 
     def attention_mask(self, batch_size: int, seq_len: int) -> Tensor:
         attention_shape = (batch_size, seq_len, seq_len)
@@ -76,7 +76,7 @@ def __init__(self, langpair: str, is_base: bool = True) -> None:
         self.embedding = Embeddings(langpair)
         self.config = Config()
         self.config.add_model(is_base)
-        self.num_layers = self.config.model_params.num_decoder_layer
+        self.num_layers = self.config.model.model_params.num_decoder_layer
         self.decoder_layers = get_clones(DecoderLayer(), self.num_layers)
 
     def forward(
diff --git a/src/model/encoder.py b/src/model/encoder.py
@@ -36,10 +36,10 @@ def __init__(self, is_base: bool = True):
         self.config.add_model(is_base)
 
         self.mha = MultiHeadAttention(masked_attention=False)
-        self.attention_dropout = nn.Dropout(p=self.config.model_params.dropout)
-        self.ln = LayerNorm(self.config.train_hparams.eps)
+        self.attention_dropout = nn.Dropout(p=self.config.model.model_params.dropout)
+        self.ln = LayerNorm(self.config.model.train_hparams.eps)
         self.ffn = FeedForwardNetwork()
-        self.residual_dropout = nn.Dropout(p=self.config.model_params.dropout)
+        self.residual_dropout = nn.Dropout(p=self.config.model.model_params.dropout)
 
     def forward(self, source_emb: Tensor, source_mask: Tensor) -> Tuple[Tensor, Tensor]:
         source_emb = source_emb + self.mha(
@@ -64,7 +64,7 @@ def __init__(self, langpair: str, is_base: bool = True) -> None:
         self.embedding = Embeddings(langpair)
         self.config = Config()
         self.config.add_model(is_base)
-        self.num_layers = self.config.model_params.num_encoder_layer
+        self.num_layers = self.config.model.model_params.num_encoder_layer
         self.encoder_layers = get_clones(EncoderLayer(), self.num_layers)
 
     def forward(self, source_tokens: Tensor, source_mask: Tensor) -> NamedTuple:
diff --git a/src/model/modules.py b/src/model/modules.py
@@ -52,7 +52,8 @@ def __init__(self, langpair: str, is_base: bool = True) -> None:
         super().__init__()
         # TODO: support transformer-base and transformer-big
         configs = Config()
-        configs.add_model(is_base).add_tokenizer(langpair)
+        configs.add_model(is_base)
+        configs.add_tokenizer(langpair)
         tokenizer = load_tokenizer(langpair)
         padding_idx = tokenizer.token_to_id("<pad>")