Optimizers test

gaetanserre · Jul 11, 2024 · ccdf584 · ccdf584
1 parent 77cde1c
commit ccdf584
Show file tree

Hide file tree

Showing 4 changed files with 359 additions and 0 deletions.
diff --git a/.gitattributes b/.gitattributes
@@ -0,0 +1 @@
+*.ipynb linguist-vendored
diff --git a/pygkls/tests/SBS.py b/pygkls/tests/SBS.py
@@ -0,0 +1,128 @@
+#
+# Created in 2023 by Gaëtan Serré
+#
+
+import numpy as np
+from scipy.spatial.distance import pdist, squareform
+from __optimizer__ import Optimizer
+
+
+class Adam:
+    def __init__(
+        self,
+        lr=0.001,
+        betas=(0.9, 0.999),
+        eps=1e-8,
+        amsgrad=False,
+    ):
+        self.lr = lr
+        self.betas = betas
+        self.eps = eps
+        self.amsgrad = amsgrad
+        self.state_m = 0
+        self.state_v = 0
+        self.state_v_max = 0
+        self.t = 0
+
+    def step(self, grad, params):
+        self.t += 1
+
+        grad = -grad
+
+        self.state_m = self.betas[0] * self.state_m + (1 - self.betas[0]) * grad
+        self.state_v = self.betas[1] * self.state_v + (1 - self.betas[1]) * grad**2
+
+        m_hat = self.state_m / (1 - self.betas[0] ** self.t)
+        v_hat = self.state_v / (1 - self.betas[1] ** self.t)
+
+        if self.amsgrad:
+            self.state_v_max = np.maximum(self.state_v_max, v_hat)
+            return self.lr * m_hat / (np.sqrt(self.state_v_max) + self.eps)
+        else:
+            return params - self.lr * m_hat / (np.sqrt(v_hat) + self.eps)
+
+
+def gradient(f, x, eps=1e-12):
+    f_x = f(x)
+
+    grad = np.zeros(x.shape)
+    for i in range(x.shape[0]):
+        x_p = x.copy()
+        x_p[i] += eps
+        grad[i] = (f(x_p) - f_x) / eps
+
+    return grad, f_x
+
+
+def rbf(x, sigma=-1):
+    sq_dist = pdist(x)
+    pairwise_dists = squareform(sq_dist) ** 2
+    if sigma < 0:  # if sigma < 0, using median trick
+        sigma = np.median(pairwise_dists) + 1e-10
+        sigma = np.sqrt(0.5 * sigma / np.log(x.shape[0] + 1))
+
+    # compute the rbf kernel
+    Kxy = np.exp(-pairwise_dists / sigma**2 / 2)
+
+    dxkxy = (x * Kxy.sum(axis=1).reshape(-1, 1) - Kxy @ x).reshape(
+        x.shape[0], x.shape[1]
+    ) / (sigma**2)
+
+    return Kxy, dxkxy
+
+
+def svgd(x, logprob_grad, kernel):
+    Kxy, dxkxy = kernel(x)
+
+    svgd_grad = (Kxy @ logprob_grad + dxkxy) / x.shape[0]
+    return svgd_grad
+
+
+class SBS(Optimizer):
+    def __init__(self, domain, n_particles, k_iter, svgd_iter, sigma=-1, lr=0.5):
+        self.domain = domain
+        self.n_particles = n_particles
+        self.k_iter = k_iter
+        self.svgd_iter = svgd_iter
+        self.sigma = sigma
+        self.lr = lr
+
+    def optimize(self, function, verbose=False):
+        kernel = lambda x: rbf(x, sigma=self.sigma)
+
+        dim = self.domain.shape[0]
+
+        x = np.random.uniform(
+            self.domain[:, 0], self.domain[:, 1], size=(self.n_particles, dim)
+        )
+
+        all_points = [x.copy()]
+        all_evals = []
+        for k in self.k_iter:
+            optimizer = Adam(lr=self.lr)
+            for i in range(self.svgd_iter):
+                grads = [0] * self.n_particles
+                fs = [0] * self.n_particles
+                for i, xi in enumerate(x):
+                    grad, f_xi = gradient(function, xi)
+                    grads[i] = -k * grad
+                    fs[i] = f_xi
+                all_evals.append(fs)
+                svgd_grad = svgd(x, np.array(grads), kernel)
+                x = optimizer.step(svgd_grad, x)
+
+                # clamp to domain
+                x = np.clip(x, self.domain[:, 0], self.domain[:, 1])
+
+                # save all points
+                all_points.append(x.copy())
+
+        all_points = np.array(all_points).reshape(-1, dim)
+        all_evals = np.array(all_evals).flatten()
+        best_idx = np.argmin(all_evals)
+        min_eval = all_evals[best_idx]
+        best_particle = all_points[best_idx]
+        if verbose:
+            print(f"Best particle found: {best_particle}. Eval at f(best): {min_eval}.")
+
+        return (best_particle, min_eval), all_points, all_evals
diff --git a/pygkls/tests/__optimizer__.py b/pygkls/tests/__optimizer__.py
@@ -0,0 +1,23 @@
+#
+# Created in 2023 by Gaëtan Serré
+#
+
+import numpy as np
+from typing import Tuple, Callable
+
+
+class Optimizer:
+    def __init__(self, **kwargs):
+        pass
+
+    def optimize(
+        self, function: Callable, verbose: bool
+    ) -> Tuple[Tuple[float, float], np.ndarray, np.ndarray]:
+        """
+        function: function to be minimized
+        Returns a tuple containing:
+            - a tuple containing the best point found and value at this point
+            - a numpy array containing the points visited
+            - numpy array containing the values at the points visited
+        """
+        raise NotImplementedError
diff --git a/pygkls/tests/test.ipynb b/pygkls/tests/test.ipynb