NOT WORKING - attempt to add create deployment

V2arK · V2arK · commit 8be6c16f4838 · 2024-12-19T16:14:09.000-05:00
diff --git a/centml/cli/cluster.py b/centml/cli/cluster.py
@@ -181,6 +181,120 @@ def get(name):
             )
 
 
+@click.command(help="Create a new deployment")
+@handle_exception
+def create():
+    with get_centml_client() as cclient:
+        # Prompt for general fields
+        name = click.prompt("Enter a name for the deployment")
+        dtype_str = click.prompt(
+            "Select a deployment type",
+            type=click.Choice(list(depl_name_to_type_map.keys())),
+            show_choices=True
+        )
+        depl_type = depl_name_to_type_map[dtype_str]
+
+        # Select cluster
+        clusters = cclient.get_clusters().results
+        if not clusters:
+            click.echo("No clusters available. Please ensure you have a cluster setup.")
+            return
+        cluster_names = [c.name for c in clusters]
+        cluster_name = click.prompt(
+            "Select a cluster",
+            type=click.Choice(cluster_names),
+            show_choices=True
+        )
+        cluster_id = next(c.id for c in clusters if c.name == cluster_name)
+
+        # Hardware selection
+        hw_resp = cclient.get_hardware_instances(cluster_id)
+        if not hw_resp:
+            click.echo("No hardware instances available for this cluster.")
+            return
+        hw_names = [h.name for h in hw_resp]
+        hw_name = click.prompt(
+            "Select a hardware instance",
+            type=click.Choice(hw_names),
+            show_choices=True
+        )
+        hw_id = next(h.id for h in hw_resp if h.name == hw_name)
+
+        # Common fields
+        min_scale = click.prompt("Minimum number of replicas", default=1, type=int)
+        max_scale = click.prompt("Maximum number of replicas", default=1, type=int)
+        concurrency = click.prompt("Max concurrency (or leave blank)", default="", show_default=False)
+        concurrency = int(concurrency) if concurrency else None
+
+        # Depending on type:
+        if depl_type == DeploymentType.INFERENCE_V2:
+            image = click.prompt("Enter the image URL")
+            container_port = click.prompt("Enter the container port", default=8080, type=int)
+            healthcheck = click.prompt("Enter healthcheck endpoint (default '/')", default="/", show_default=True)
+            env_vars_str = click.prompt("Enter environment variables in KEY=VALUE format (comma separated) or leave blank", default="", show_default=False)
+            env_vars = {}
+            if env_vars_str.strip():
+                for kv in env_vars_str.split(","):
+                    k, v = kv.strip().split("=")
+                    env_vars[k] = v
+
+            # Construct the inference request
+            from platform_api_python_client import CreateInferenceDeploymentRequest
+            req = CreateInferenceDeploymentRequest(
+                name=name,
+                cluster_id=cluster_id,
+                hardware_instance_id=hw_id,
+                image_url=image,
+                container_port=container_port,
+                healthcheck=healthcheck,
+                min_scale=min_scale,
+                max_scale=max_scale,
+                concurrency=concurrency,
+                env_vars=env_vars if env_vars else None
+            )
+            created = cclient.create_inference(req)
+            click.echo(f"Inference deployment created with ID: {created.id}")
+
+        elif depl_type == DeploymentType.COMPUTE_V2:
+            # For compute deployments, we might ask for a public SSH key
+            ssh_key = click.prompt("Enter your public SSH key", default="", show_default=False)
+
+            from platform_api_python_client import CreateComputeDeploymentRequest
+            req = CreateComputeDeploymentRequest(
+                name=name,
+                cluster_id=cluster_id,
+                hardware_instance_id=hw_id,
+                ssh_public_key=ssh_key if ssh_key.strip() else None
+            )
+            created = cclient.create_compute(req)
+            click.echo(f"Compute deployment created with ID: {created.id}")
+
+        elif depl_type == DeploymentType.CSERVE:
+            # For cserve deployments, ask for model and parallelism
+            model = click.prompt("Enter the Hugging Face model", default="facebook/opt-1.3b")
+            tensor_parallel_size = click.prompt("Tensor parallel size", default=1, type=int)
+            pipeline_parallel_size = click.prompt("Pipeline parallel size", default=1, type=int)
+            # concurrency asked above
+
+            from platform_api_python_client import CreateCServeDeploymentRequest
+            req = CreateCServeDeploymentRequest(
+                name=name,
+                cluster_id=cluster_id,
+                hardware_instance_id=hw_id,
+                model=model,
+                tensor_parallel_size=tensor_parallel_size,
+                pipeline_parallel_size=pipeline_parallel_size,
+                min_scale=min_scale,
+                max_scale=max_scale,
+                concurrency=concurrency
+            )
+            created = cclient.create_cserve(req)
+            click.echo(f"CServe deployment created with ID: {created.id}")
+
+        else:
+            click.echo("Unknown deployment type.")
+
+
 @click.command(help="Delete a deployment")
 @click.argument("id", type=int)
 @handle_exception
diff --git a/centml/cli/main.py b/centml/cli/main.py
@@ -1,7 +1,7 @@
 import click
 
 from centml.cli.login import login, logout
-from centml.cli.cluster import ls, get, delete, pause, resume
+from centml.cli.cluster import ls, get, delete, pause, resume, create
 
 
 @click.group()
@@ -45,6 +45,7 @@ def ccluster():
 
 ccluster.add_command(ls)
 ccluster.add_command(get)
+ccluster.add_command(create)
 ccluster.add_command(delete)
 ccluster.add_command(pause)
 ccluster.add_command(resume)