lablup
diff --git a/‎docs/manager/graphql-reference/supergraph.graphql‎
Lines changed: 6 additions & 4 deletions b/‎docs/manager/graphql-reference/supergraph.graphql‎
Lines changed: 6 additions & 4 deletions
diff --git a/‎docs/manager/graphql-reference/v2-schema.graphql‎
Lines changed: 6 additions & 4 deletions b/‎docs/manager/graphql-reference/v2-schema.graphql‎
Lines changed: 6 additions & 4 deletions
diff --git a/‎src/ai/backend/manager/api/gql/model_deployment/model_deployment.py‎
Lines changed: 0 additions & 88 deletions b/‎src/ai/backend/manager/api/gql/model_deployment/model_deployment.py‎
Lines changed: 0 additions & 88 deletions
@@ -29,6 +29,8 @@ input AddModelRevisionInput
 {
   name: String = null
   deploymentId: ID!
+  clusterConfig: ClusterConfigInput!
+  resourceConfig: ResourceConfigInput!
   image: ImageInput!
   modelRuntimeConfig: ModelRuntimeConfigInput!
   modelMountConfig: ModelMountConfigInput!
@@ -1130,8 +1132,6 @@ input CreateModelDeploymentInput
 {
   metadata: ModelDeploymentMetadataInput!
   networkAccess: ModelDeploymentNetworkAccessInput!
-  clusterConfig: ClusterConfigInput!
-  resourceConfig: ResourceConfigInput!
   deploymentStrategy: DeploymentStrategyInput!
   initialRevision: CreateModelRevisionInput!
 }
@@ -1148,6 +1148,8 @@ input CreateModelRevisionInput
   @join__type(graph: STRAWBERRY)
 {
   name: String = null
+  clusterConfig: ClusterConfigInput!
+  resourceConfig: ResourceConfigInput!
   image: ImageInput!
   modelRuntimeConfig: ModelRuntimeConfigInput!
   modelMountConfig: ModelMountConfigInput!
@@ -2509,8 +2511,6 @@ type ModelDeployment implements Node
   scalingRule: ScalingRule!
   replicaState: ReplicaState!
   deploymentStrategy: DeploymentStrategy!
-  clusterConfig: ClusterConfig!
-  resourceConfig: ResourceConfig!
   createdUser: UserNode!
 }
 
@@ -2636,6 +2636,8 @@ type ModelRevision implements Node
   """The Globally Unique ID of this object"""
   id: ID!
   name: String!
+  clusterConfig: ClusterConfig!
+  resourceConfig: ResourceConfig!
   modelRuntimeConfig: ModelRuntimeConfig!
   modelMountConfig: ModelMountConfig!
   extraMounts: [VirtualFolderNode!]!
 
@@ -8,6 +8,8 @@ schema @link(url: "https://specs.apollo.dev/federation/v2.7", import: ["@externa
 input AddModelRevisionInput {
   name: String = null
   deploymentId: ID!
+  clusterConfig: ClusterConfigInput!
+  resourceConfig: ResourceConfigInput!
   image: ImageInput!
   modelRuntimeConfig: ModelRuntimeConfigInput!
   modelMountConfig: ModelMountConfigInput!
@@ -159,8 +161,6 @@ enum ClusterMode {
 input CreateModelDeploymentInput {
   metadata: ModelDeploymentMetadataInput!
   networkAccess: ModelDeploymentNetworkAccessInput!
-  clusterConfig: ClusterConfigInput!
-  resourceConfig: ResourceConfigInput!
   deploymentStrategy: DeploymentStrategyInput!
   initialRevision: CreateModelRevisionInput!
 }
@@ -173,6 +173,8 @@ type CreateModelDeploymentPayload {
 """Added in 25.13.0"""
 input CreateModelRevisionInput {
   name: String = null
+  clusterConfig: ClusterConfigInput!
+  resourceConfig: ResourceConfigInput!
   image: ImageInput!
   modelRuntimeConfig: ModelRuntimeConfigInput!
   modelMountConfig: ModelMountConfigInput!
@@ -308,8 +310,6 @@ type ModelDeployment implements Node {
   scalingRule: ScalingRule!
   replicaState: ReplicaState!
   deploymentStrategy: DeploymentStrategy!
-  clusterConfig: ClusterConfig!
-  resourceConfig: ResourceConfig!
   createdUser: UserNode!
 }
 
@@ -409,6 +409,8 @@ type ModelRevision implements Node {
   """The Globally Unique ID of this object"""
   id: ID!
   name: String!
+  clusterConfig: ClusterConfig!
+  resourceConfig: ResourceConfig!
   modelRuntimeConfig: ModelRuntimeConfig!
   modelMountConfig: ModelMountConfig!
   extraMounts: [VirtualFolderNode!]!
 
@@ -13,7 +13,6 @@
 from ai.backend.manager.api.gql.federated_types import (
     AccessToken,
     AutoScalingRule,
-    ResourceGroup,
     User,
 )
 from ai.backend.manager.api.gql.model_deployment.routing import (
@@ -31,12 +30,6 @@
 )
 
 
-@strawberry.enum(description="Added in 25.13.0")
-class ClusterMode(StrEnum):
-    SINGLE_NODE = "SINGLE_NODE"
-    MULTI_NODE = "MULTI_NODE"
-
-
 @strawberry.enum(description="Added in 25.13.0")
 class DeploymentStatus(StrEnum):
     ACTIVE = "ACTIVE"
@@ -107,12 +100,6 @@ def resolve_connection(
         )
 
 
-@strawberry.type(description="Added in 25.13.0")
-class ClusterConfig:
-    mode: ClusterMode
-    size: int
-
-
 @strawberry.type(description="Added in 25.13.0")
 class ReplicaState:
     desired_replica_count: int
@@ -141,18 +128,6 @@ class ModelDeploymentNetworkAccess:
     access_tokens: list[AccessToken]
 
 
-@strawberry.type(description="Added in 25.13.0")
-class ResourceConfig:
-    resource_group: ResourceGroup
-    resource_slots: JSONString = strawberry.field(
-        description='Resource Slots are a JSON string that describes the resources allocated for the deployment. Example: "resourceSlots": "{\\"cpu\\": \\"1\\", \\"mem\\": \\"1073741824\\", \\"cuda.device\\": \\"0\\"}"'
-    )
-    resource_opts: Optional[JSONString] = strawberry.field(
-        description='Resource Options are a JSON string that describes additional options for the resources. This is especially used for shared memory configurations. Example: "resourceOpts": "{\\"shmem\\": \\"64m\\"}"',
-        default=None,
-    )
-
-
 # Main ModelDeployment Type
 @strawberry.type(description="Added in 25.13.0")
 class ModelDeployment(Node):
@@ -168,8 +143,6 @@ class ModelDeployment(Node):
 
     deployment_strategy: DeploymentStrategy
 
-    cluster_config: ClusterConfig
-    resource_config: ResourceConfig
     created_user: User
 
 
@@ -253,29 +226,6 @@ class ReplicaStatusChangedPayload:
 
 
 # Input Types
-@strawberry.input(description="Added in 25.13.0")
-class ClusterConfigInput:
-    mode: ClusterMode
-    size: int
-
-
-@strawberry.input(description="Added in 25.13.0")
-class ResourceGroupInput:
-    name: str
-
-
-@strawberry.input(description="Added in 25.13.0")
-class ResourceConfigInput:
-    resource_group: ResourceGroupInput
-    resource_slots: JSONString = strawberry.field(
-        description='Resources allocated for the deployment. Example: "resourceSlots": "{\\"cpu\\": \\"1\\", \\"mem\\": \\"1073741824\\", \\"cuda.device\\": \\"0\\"}"'
-    )
-    resource_opts: Optional[JSONString] = strawberry.field(
-        description='Additional options for the resources. This is especially used for shared memory configurations. Example: "resourceOpts": "{\\"shmem\\": \\"64m\\"}"',
-        default=None,
-    )
-
-
 @strawberry.input(description="Added in 25.13.0")
 class ModelDeploymentMetadataInput:
     name: str
@@ -297,8 +247,6 @@ class DeploymentStrategyInput:
 class CreateModelDeploymentInput:
     metadata: ModelDeploymentMetadataInput
     network_access: ModelDeploymentNetworkAccessInput
-    cluster_config: ClusterConfigInput
-    resource_config: ResourceConfigInput
     deployment_strategy: DeploymentStrategyInput
     initial_revision: CreateModelRevisionInput
 
@@ -402,18 +350,6 @@ def _generate_mock_global_id() -> str:
         open_to_public=True,
         access_tokens=[],
     ),
-    cluster_config=ClusterConfig(mode=ClusterMode.SINGLE_NODE, size=1),
-    resource_config=ResourceConfig(
-        resource_group=ResourceGroup(id=ID(_generate_mock_global_id())),
-        resource_slots=cast(
-            JSONString,
-            '{"cpu": 8, "mem": "32G", "cuda.shares": 1, "cuda.device": 1}',
-        ),
-        resource_opts=cast(
-            JSONString,
-            '{"shmem": "2G", "reserved_time": "24h", "scaling_group": "us-east-1"}',
-        ),
-    ),
     revision=mock_model_revision_1,
     revision_history=ModelRevisionConnection(
         edges=[
@@ -468,18 +404,6 @@ def _generate_mock_global_id() -> str:
         open_to_public=False,
         access_tokens=[],
     ),
-    cluster_config=ClusterConfig(mode=ClusterMode.SINGLE_NODE, size=1),
-    resource_config=ResourceConfig(
-        resource_group=ResourceGroup(id=ID(_generate_mock_global_id())),
-        resource_slots=cast(
-            JSONString,
-            '{"cpu": 8, "mem": "32G", "cuda.shares": 1, "cuda.device": 1}',
-        ),
-        resource_opts=cast(
-            JSONString,
-            '{"shmem": "2G", "reserved_time": "24h", "scaling_group": "us-east-1"}',
-        ),
-    ),
     revision=mock_model_revision_3,
     revision_history=ModelRevisionConnection(
         edges=[
@@ -527,18 +451,6 @@ def _generate_mock_global_id() -> str:
         open_to_public=False,
         access_tokens=[],
     ),
-    cluster_config=ClusterConfig(mode=ClusterMode.SINGLE_NODE, size=1),
-    resource_config=ResourceConfig(
-        resource_group=ResourceGroup(id=ID(_generate_mock_global_id())),
-        resource_slots=cast(
-            JSONString,
-            '{"cpu": 8, "mem": "32G", "cuda.shares": 1, "cuda.device": 1}',
-        ),
-        resource_opts=cast(
-            JSONString,
-            '{"shmem": "2G", "reserved_time": "24h", "scaling_group": "us-east-1"}',
-        ),
-    ),
     revision=None,
     revision_history=ModelRevisionConnection(
         edges=[],