fix

AlanSwift · AlanSwift · commit cb2b91f9a108 · 2021-08-15T23:00:27.000+08:00
diff --git a/.flake8 b/.flake8
@@ -6,6 +6,7 @@ select = B,C,E,F,W,T4,B9
 exclude = build,.git,.vector_cache,.github,dev,distribution,docs,__pycache__,imgs,
         *.pyc,*.txt,.pkl,*.pt,*.tar.gz,*.yml,
         examples/pytorch/kg_completion/spodernet,
+        **/spodernet/**,
         setup.py
 per-file-ignores =
   **/__init__.py:F401,F403,E402
diff --git a/graph4nlp/pytorch/models/base.py b/graph4nlp/pytorch/models/base.py
@@ -16,7 +16,7 @@
 from graph4nlp.pytorch.modules.graph_construction.node_embedding_based_graph_construction import (
     NodeEmbeddingBasedGraphConstruction,
 )
-from graph4nlp.pytorch.modules.graph_construction.node_embedding_based_refined_graph_construction import (
+from graph4nlp.pytorch.modules.graph_construction.node_embedding_based_refined_graph_construction import (  # noqa
     NodeEmbeddingBasedRefinedGraphConstruction,
 )
 from graph4nlp.pytorch.modules.graph_embedding.gat import GAT
@@ -26,62 +26,109 @@
 
 
 class Graph2XBase(nn.Module):
-    def __init__(self, vocab_model, embedding_style, graph_type, emb_input_size, emb_hidden_size,
-
-                 gnn, gnn_num_layers, gnn_direction_option, gnn_input_size, gnn_hidden_size, gnn_output_size,
-
-                 # dropout
-                 emb_word_dropout=0.0, emb_rnn_dropout=0.0, emb_fix_word_emb=False, emb_fix_bert_emb=False,
-
-                 gnn_feats_dropout=0.0, gnn_attn_dropout=0.0,
-                 **kwargs):
+    def __init__(
+        self,
+        vocab_model,
+        embedding_style,
+        graph_type,
+        emb_input_size,
+        emb_hidden_size,
+        gnn,
+        gnn_num_layers,
+        gnn_direction_option,
+        gnn_input_size,
+        gnn_hidden_size,
+        gnn_output_size,
+        # dropout
+        emb_word_dropout=0.0,
+        emb_rnn_dropout=0.0,
+        emb_fix_word_emb=False,
+        emb_fix_bert_emb=False,
+        gnn_feats_dropout=0.0,
+        gnn_attn_dropout=0.0,
+        **kwargs
+    ):
         super(Graph2XBase, self).__init__()
         self.vocab_model = vocab_model
-        self._build_embedding_encoder(graph_type=graph_type, embedding_style=embedding_style, vocab_model=vocab_model,
-                                      emb_input_size=emb_input_size, emb_hidden_size=emb_hidden_size, emb_word_dropout=emb_word_dropout,
-                                      emb_rnn_dropout=emb_rnn_dropout, emb_fix_word_emb=emb_fix_word_emb,
-                                      emb_fix_bert_emb=emb_fix_bert_emb, **kwargs)
+        self._build_embedding_encoder(
+            graph_type=graph_type,
+            embedding_style=embedding_style,
+            vocab_model=vocab_model,
+            emb_input_size=emb_input_size,
+            emb_hidden_size=emb_hidden_size,
+            emb_word_dropout=emb_word_dropout,
+            emb_rnn_dropout=emb_rnn_dropout,
+            emb_fix_word_emb=emb_fix_word_emb,
+            emb_fix_bert_emb=emb_fix_bert_emb,
+            **kwargs
+        )
 
-        self._build_gnn_encoder(gnn=gnn, num_layers=gnn_num_layers,
-                                input_size=gnn_input_size, hidden_size=gnn_hidden_size, output_size=gnn_output_size,
-                                direction_option=gnn_direction_option, feats_dropout=gnn_feats_dropout,
-                                gnn_attn_dropout=gnn_attn_dropout, **kwargs)
+        self._build_gnn_encoder(
+            gnn=gnn,
+            num_layers=gnn_num_layers,
+            input_size=gnn_input_size,
+            hidden_size=gnn_hidden_size,
+            output_size=gnn_output_size,
+            direction_option=gnn_direction_option,
+            feats_dropout=gnn_feats_dropout,
+            gnn_attn_dropout=gnn_attn_dropout,
+            **kwargs
+        )
 
-    def _build_embedding_encoder(self, graph_type, embedding_style, vocab_model,
-                                 emb_input_size, emb_hidden_size, emb_rnn_dropout,
-                                 emb_word_dropout,
-                                 # dynamic parameters
-                                 emb_sim_metric_type=None, emb_num_heads=None, emb_top_k_neigh=None,
-                                 emb_epsilon_neigh=None,
-                                 emb_smoothness_ratio=None, emb_connectivity_ratio=None, emb_sparsity_ratio=None,
-                                 emb_alpha_fusion=None,
-                                 emb_fix_word_emb=False, emb_fix_bert_emb=False, **kwargs):
+    def _build_embedding_encoder(
+        self,
+        graph_type,
+        embedding_style,
+        vocab_model,
+        emb_input_size,
+        emb_hidden_size,
+        emb_rnn_dropout,
+        emb_word_dropout,
+        # dynamic parameters
+        emb_sim_metric_type=None,
+        emb_num_heads=None,
+        emb_top_k_neigh=None,
+        emb_epsilon_neigh=None,
+        emb_smoothness_ratio=None,
+        emb_connectivity_ratio=None,
+        emb_sparsity_ratio=None,
+        emb_alpha_fusion=None,
+        emb_fix_word_emb=False,
+        emb_fix_bert_emb=False,
+        **kwargs
+    ):
 
         if not isinstance(graph_type, str):
             raise ValueError("graph_type parameter should be str")
 
         if graph_type == "dependency":
-            self.graph_topology = DependencyBasedGraphConstruction(embedding_style=embedding_style,
-                                                                   vocab=vocab_model.in_word_vocab,
-                                                                   hidden_size=emb_hidden_size,
-                                                                   word_dropout=emb_word_dropout,
-                                                                   rnn_dropout=emb_rnn_dropout,
-                                                                   fix_word_emb=emb_fix_word_emb,
-                                                                   fix_bert_emb=emb_fix_bert_emb)
+            self.graph_topology = DependencyBasedGraphConstruction(
+                embedding_style=embedding_style,
+                vocab=vocab_model.in_word_vocab,
+                hidden_size=emb_hidden_size,
+                word_dropout=emb_word_dropout,
+                rnn_dropout=emb_rnn_dropout,
+                fix_word_emb=emb_fix_word_emb,
+                fix_bert_emb=emb_fix_bert_emb,
+            )
         elif graph_type == "constituency":
-            self.graph_topology = ConstituencyBasedGraphConstruction(embedding_style=embedding_style,
-                                                                     vocab=vocab_model.in_word_vocab,
-                                                                     hidden_size=emb_hidden_size,
-                                                                     word_dropout=emb_word_dropout,
-                                                                     rnn_dropout=emb_rnn_dropout,
-                                                                     fix_word_emb=emb_fix_word_emb)
+            self.graph_topology = ConstituencyBasedGraphConstruction(
+                embedding_style=embedding_style,
+                vocab=vocab_model.in_word_vocab,
+                hidden_size=emb_hidden_size,
+                word_dropout=emb_word_dropout,
+                rnn_dropout=emb_rnn_dropout,
+                fix_word_emb=emb_fix_word_emb,
+            )
         elif graph_type == "ie":
-            self.graph_topology = IEBasedGraphConstruction(embedding_style=embedding_style,
-                                                           vocab=vocab_model.in_word_vocab,
-                                                           hidden_size=emb_hidden_size,
-                                                           word_dropout=emb_word_dropout,
-                                                           rnn_dropout=emb_rnn_dropout,
-                                                           fix_word_emb=emb_fix_word_emb)
+            self.graph_topology = IEBasedGraphConstruction(
+                embedding_style=embedding_style,
+                vocab=vocab_model.in_word_vocab,
+                hidden_size=emb_hidden_size,
+                word_dropout=emb_word_dropout,
+                rnn_dropout=emb_rnn_dropout,
+                fix_word_emb=emb_fix_word_emb,
+            )
         elif graph_type == "node_emb":
             self.graph_topology = NodeEmbeddingBasedGraphConstruction(
                 vocab_model.in_word_vocab,
@@ -98,7 +145,8 @@ def _build_embedding_encoder(self, graph_type, embedding_style, vocab_model,
                 fix_word_emb=emb_fix_word_emb,
                 fix_bert_emb=emb_fix_bert_emb,
                 word_dropout=emb_word_dropout,
-                rnn_dropout=emb_rnn_dropout)
+                rnn_dropout=emb_rnn_dropout,
+            )
         elif graph_type == "node_emb_refined":
             self.graph_topology = NodeEmbeddingBasedRefinedGraphConstruction(
                 vocab_model.in_word_vocab,
@@ -116,36 +164,90 @@ def _build_embedding_encoder(self, graph_type, embedding_style, vocab_model,
                 fix_word_emb=emb_fix_word_emb,
                 fix_bert_emb=emb_fix_bert_emb,
                 word_dropout=emb_word_dropout,
-                rnn_dropout=emb_rnn_dropout)
+                rnn_dropout=emb_rnn_dropout,
+            )
         else:
             raise NotImplementedError()
-        self.enc_word_emb = self.graph_topology.embedding_layer.word_emb_layers['w2v'] if 'w2v' in self.graph_topology.embedding_layer.word_emb_layers else None
+        self.enc_word_emb = (
+            self.graph_topology.embedding_layer.word_emb_layers["w2v"]
+            if "w2v" in self.graph_topology.embedding_layer.word_emb_layers
+            else None
+        )
 
-    def _build_gnn_encoder(self, gnn, num_layers, input_size, hidden_size, output_size, direction_option, feats_dropout,
-                           gnn_heads=None, gnn_residual=True, gnn_attn_dropout=0.0, gnn_activation=F.relu,  # gat
-                           gnn_bias=True, gnn_allow_zero_in_degree=True, gnn_norm='both', gnn_weight=True,
-                           gnn_use_edge_weight=False, gnn_gcn_norm='both',  # gcn
-                           gnn_n_etypes=1,  # ggnn
-                           gnn_aggregator_type="lstm",  # graphsage
-                           **kwargs):
+    def _build_gnn_encoder(
+        self,
+        gnn,
+        num_layers,
+        input_size,
+        hidden_size,
+        output_size,
+        direction_option,
+        feats_dropout,
+        gnn_heads=None,
+        gnn_residual=True,
+        gnn_attn_dropout=0.0,
+        gnn_activation=F.relu,  # gat
+        gnn_bias=True,
+        gnn_allow_zero_in_degree=True,
+        gnn_norm="both",
+        gnn_weight=True,
+        gnn_use_edge_weight=False,
+        gnn_gcn_norm="both",  # gcn
+        gnn_n_etypes=1,  # ggnn
+        gnn_aggregator_type="lstm",  # graphsage
+        **kwargs
+    ):
         if gnn == "gat":
-            self.gnn_encoder = GAT(num_layers, input_size, hidden_size, output_size, gnn_heads,
-                                   direction_option=direction_option,
-                                   feat_drop=feats_dropout, attn_drop=gnn_attn_dropout, activation=gnn_activation,
-                                   residual=gnn_residual, allow_zero_in_degree=gnn_allow_zero_in_degree)
+            self.gnn_encoder = GAT(
+                num_layers,
+                input_size,
+                hidden_size,
+                output_size,
+                gnn_heads,
+                direction_option=direction_option,
+                feat_drop=feats_dropout,
+                attn_drop=gnn_attn_dropout,
+                activation=gnn_activation,
+                residual=gnn_residual,
+                allow_zero_in_degree=gnn_allow_zero_in_degree,
+            )
         elif gnn == "ggnn":
-            self.gnn_encoder = GGNN(num_layers, input_size, hidden_size, output_size, direction_option=direction_option,
-                                    use_edge_weight=gnn_use_edge_weight, feat_drop=feats_dropout, n_etypes=gnn_n_etypes)
+            self.gnn_encoder = GGNN(
+                num_layers,
+                input_size,
+                hidden_size,
+                output_size,
+                direction_option=direction_option,
+                use_edge_weight=gnn_use_edge_weight,
+                feat_drop=feats_dropout,
+                n_etypes=gnn_n_etypes,
+            )
         elif gnn == "graphsage":
-            self.gnn_encoder = GraphSAGE(num_layers, input_size, hidden_size, output_size,
-                                         aggregator_type=gnn_aggregator_type,
-                                         direction_option=direction_option, feat_drop=feats_dropout,
-                                         activation=gnn_activation, bias=gnn_bias, use_edge_weight=gnn_use_edge_weight)
+            self.gnn_encoder = GraphSAGE(
+                num_layers,
+                input_size,
+                hidden_size,
+                output_size,
+                aggregator_type=gnn_aggregator_type,
+                direction_option=direction_option,
+                feat_drop=feats_dropout,
+                activation=gnn_activation,
+                bias=gnn_bias,
+                use_edge_weight=gnn_use_edge_weight,
+            )
         elif gnn == "gcn":
-            self.gnn_encoder = GCN(num_layers, input_size, hidden_size, output_size,
-                                   direction_option=direction_option, weight=gnn_weight, gcn_norm=gnn_gcn_norm,
-                                   allow_zero_in_degree=gnn_allow_zero_in_degree, activation=gnn_activation,
-                                   use_edge_weight=gnn_use_edge_weight)
+            self.gnn_encoder = GCN(
+                num_layers,
+                input_size,
+                hidden_size,
+                output_size,
+                direction_option=direction_option,
+                weight=gnn_weight,
+                gcn_norm=gnn_gcn_norm,
+                allow_zero_in_degree=gnn_allow_zero_in_degree,
+                activation=gnn_activation,
+                use_edge_weight=gnn_use_edge_weight,
+            )
         else:
             raise NotImplementedError()