compute likelihood in sampling

timonpalm · timonpalm · commit 1172ef76eafb · 2025-08-08T16:36:32.000+02:00
diff --git a/flow_matching/solver/ode_solver.py b/flow_matching/solver/ode_solver.py
@@ -37,6 +37,8 @@ def sample(
         time_grid: Tensor = torch.tensor([0.0, 1.0]),
         return_intermediates: bool = False,
         enable_grad: bool = False,
+        log_p0: Optional[Callable[[Tensor], Tensor]] = None,
+        exact_divergence: bool = False,
         **model_extras,
     ) -> Union[Tensor, Sequence[Tensor]]:
         r"""Solve the ODE with the velocity field.
@@ -73,6 +75,8 @@ def forward(self, x: torch.Tensor, t: torch.Tensor, **extras) -> torch.Tensor:
             time_grid (Tensor): The process is solved in the interval [min(time_grid, max(time_grid)] and if step_size is None then time discretization is set by the time grid. May specify a descending time_grid to solve in the reverse direction. Defaults to torch.tensor([0.0, 1.0]).
             return_intermediates (bool, optional): If True then return intermediate time steps according to time_grid. Defaults to False.
             enable_grad (bool, optional): Whether to compute gradients during sampling. Defaults to False.
+            log_p0 (Optional[Callable[[Tensor], Tensor]]): If provided, the function computes the log likelihood of the source distribution at :math:`t=0`. The velocity model must be differentiable with respect to x.
+            exact_divergence (bool): Whether to compute the exact divergence or use the Hutchinson estimator.
             **model_extras: Additional input for the model.
 
         Returns:
@@ -81,27 +85,61 @@ def forward(self, x: torch.Tensor, t: torch.Tensor, **extras) -> torch.Tensor:
 
         time_grid = time_grid.to(x_init.device)
 
+        # Fix the random projection for the Hutchinson divergence estimator
+        if not exact_divergence:
+            z = (torch.randn_like(x_init).to(x_init.device) < 0) * 2.0 - 1.0
+
         def ode_func(t, x):
             return self.velocity_model(x=x, t=t, **model_extras)
 
+        def dynamics_func(t, states):
+            xt = states[0]
+            with torch.set_grad_enabled(True):
+                xt.requires_grad_()
+                ut = ode_func(t, xt)
+
+                # Compute exact divergence
+                if exact_divergence:
+                    div = 0
+                    for i in range(ut.flatten(1).shape[1]):
+                        div += gradient(ut[:, i], xt, create_graph=True)[:, i].detach()
+                else:
+                    # Compute Hutchinson divergence estimator E[z^T D_x(ut) z]
+                    ut_dot_z = torch.einsum(
+                        "ij,ij->i", ut.flatten(start_dim=1), z.flatten(start_dim=1)
+                    )
+                    grad_ut_dot_z = gradient(ut_dot_z, xt)
+                    div = torch.einsum(
+                        "ij,ij->i",
+                        grad_ut_dot_z.flatten(start_dim=1),
+                        z.flatten(start_dim=1),
+                    )
+
+            return ut.detach(), div.detach()
+
         ode_opts = {"step_size": step_size} if step_size is not None else {}
 
         with torch.set_grad_enabled(enable_grad):
             # Approximate ODE solution with numerical ODE solver
             sol = odeint(
-                ode_func,
-                x_init,
+                ode_func if log_p0 is None else dynamics_func,
+                (
+                    x_init
+                    if log_p0 is None
+                    else (x_init, torch.zeros(x_init.shape[0], device=x_init.device))
+                ),
                 time_grid,
                 method=method,
                 options=ode_opts,
                 atol=atol,
                 rtol=rtol,
             )
 
-        if return_intermediates:
-            return sol
-        else:
-            return sol[-1]
+        if log_p0 is not None:
+            sol, log_det = sol
+            tmp = log_p0(x_init) - log_det[-1]
+            return (sol, tmp) if return_intermediates else (sol[-1], tmp)
+        return sol if return_intermediates else sol[-1]
 
     def compute_likelihood(
         self,
diff --git a/tests/solver/test_ode_solver.py b/tests/solver/test_ode_solver.py
@@ -185,6 +185,55 @@ def dummy_log_p(x: Tensor) -> Tensor:
             torch.allclose(x_1.grad, torch.tensor([1.0, 1.0]), atol=1e-2),
         )
 
+    def test_sample_with_likelihoods(self):
+        x_1 = torch.tensor([[0.0, 0.0]], requires_grad=True)
+        step_size = 0.1
+
+        # Define a dummy log probability function
+        def dummy_log_p(x: Tensor) -> Tensor:
+            return -0.5 * torch.sum(x**2, dim=1)
+
+        result, log_likelihood = self.dummy_solver.sample(
+            x_init=x_1,
+            step_size=step_size,
+            log_p0=dummy_log_p,
+            exact_divergence=True,
+        )
+        self.assertIsInstance(log_likelihood, Tensor)
+        self.assertEqual(x_1.shape[0], log_likelihood.shape[0])
+
+    def test_sample_with_likelihoods_to_posthoc_likelihoods(self):
+        x_0 = torch.tensor([[1.0, 0.0]], requires_grad=True)
+        step_size = 0.001
+
+        # Define a dummy log probability function
+        def dummy_log_p(x: Tensor) -> Tensor:
+            return -0.5 * torch.sum(x**2, dim=1)
+
+        x1, log_likelihood = self.dummy_solver.sample(
+            x_init=x_0,
+            step_size=step_size,
+            log_p0=dummy_log_p,
+            exact_divergence=True,
+        )
+        print("x1: ", x1)
+        self.assertIsInstance(log_likelihood, Tensor)
+        self.assertEqual(x_0.shape[0], log_likelihood.shape[0])
+
+        # Check if the post-hoc likelihoods match the original log likelihoods
+        _, posthoc_log_likelihood = self.dummy_solver.compute_likelihood(
+            x_1=x1,
+            log_p0=dummy_log_p,
+            step_size=step_size,
+            exact_divergence=True,
+        )
+
+        print("Log likelihood:", log_likelihood)
+        print("Post-hoc log likelihood:", posthoc_log_likelihood)
+        self.assertTrue(
+            torch.allclose(log_likelihood, posthoc_log_likelihood, atol=1e-2),
+        )
+
 
 if __name__ == "__main__":
     unittest.main()