ProjectTech4DevAI · rkritika1508 · Apr 1, 2026 · Apr 1, 2026 · Apr 2, 2026 · Apr 2, 2026
diff --git a/backend/app/api/API_USAGE.md b/backend/app/api/API_USAGE.md
@@ -100,7 +100,7 @@ Endpoint:
 Optional filters:
 - `ids=<uuid>&ids=<uuid>`
 - `stage=input|output`
-- `type=uli_slur_match|pii_remover|gender_assumption_bias|ban_list|llm_critic|topic_relevance`
+- `type=uli_slur_match|pii_remover|gender_assumption_bias|ban_list|llm_critic|topic_relevance|llamaguard_7b|profanity_free|nsfw_text`
 
 Example:
 
@@ -442,6 +442,9 @@ From `validators.json`:
 - `ban_list`
 - `llm_critic`
 - `topic_relevance`
+- `llamaguard_7b`
+- `profanity_free`
+- `nsfw_text`
 
 Source of truth:
 - `backend/app/core/validators/validators.json`

diff --git a/backend/app/api/routes/guardrails.py b/backend/app/api/routes/guardrails.py
@@ -258,6 +258,9 @@ def add_validator_logs(
     for log in iteration.outputs.validator_logs:
         result = log.validation_result
 
+        if result is None:
+            continue
+
         if suppress_pass_logs and isinstance(result, PassResult):
             continue
 

diff --git a/backend/app/core/enum.py b/backend/app/core/enum.py
@@ -32,3 +32,7 @@ class ValidatorType(Enum):
     GenderAssumptionBias = "gender_assumption_bias"
     BanList = "ban_list"
     TopicRelevance = "topic_relevance"
+    LLMCritic = "llm_critic"
+    LlamaGuard7B = "llamaguard_7b"
+    ProfanityFree = "profanity_free"
+    NSFWText = "nsfw_text"
diff --git a/backend/app/core/validators/README.md b/backend/app/core/validators/README.md
diff --git a/backend/app/core/validators/config/llamaguard_7b_safety_validator_config.py b/backend/app/core/validators/config/llamaguard_7b_safety_validator_config.py
@@ -0,0 +1,16 @@
+from typing import List, Literal, Optional
+
+from guardrails.hub import LlamaGuard7B
+
+from app.core.validators.config.base_validator_config import BaseValidatorConfig
+
+
+class LlamaGuard7BSafetyValidatorConfig(BaseValidatorConfig):
+    type: Literal["llamaguard_7b"]
+    policies: Optional[List[str]] = None
+
+    def build(self):
+        return LlamaGuard7B(
+            policies=self.policies,
+            on_fail=self.resolve_on_fail(),
+        )
diff --git a/backend/app/core/validators/config/nsfw_text_safety_validator_config.py b/backend/app/core/validators/config/nsfw_text_safety_validator_config.py
@@ -0,0 +1,22 @@
+from typing import Literal, Optional
+
+from guardrails.hub import NSFWText
+
+from app.core.validators.config.base_validator_config import BaseValidatorConfig
+
+
+class NSFWTextSafetyValidatorConfig(BaseValidatorConfig):
+    type: Literal["nsfw_text"]
+    threshold: float = 0.8
+    validation_method: str = "sentence"
+    device: Optional[str] = "cpu"
+    model_name: Optional[str] = "textdetox/xlmr-large-toxicity-classifier"
+
+    def build(self):
+        return NSFWText(
+            threshold=self.threshold,
+            validation_method=self.validation_method,
+            device=self.device,
+            model_name=self.model_name,
+            on_fail=self.resolve_on_fail(),
+        )
diff --git a/backend/app/core/validators/config/profanity_free_safety_validator_config.py b/backend/app/core/validators/config/profanity_free_safety_validator_config.py
@@ -0,0 +1,14 @@
+from typing import Literal
+
+from guardrails.hub import ProfanityFree
+
+from app.core.validators.config.base_validator_config import BaseValidatorConfig
+
+
+class ProfanityFreeSafetyValidatorConfig(BaseValidatorConfig):
+    type: Literal["profanity_free"]
+
+    def build(self):
+        return ProfanityFree(
+            on_fail=self.resolve_on_fail(),
+        )
diff --git a/backend/app/core/validators/validators.json b/backend/app/core/validators/validators.json
@@ -29,6 +29,21 @@
             "type": "topic_relevance",
             "version": "0.1.0",
             "source": "local"
+        },
+        {
+            "type": "llamaguard_7b",
+            "version": "0.1.0",
+            "source": "hub://guardrails/llamaguard_7b"
+        },
+        {
+            "type": "profanity_free",
+            "version": "0.1.0",
+            "source": "hub://guardrails/profanity_free"
+        },
+        {
+            "type": "nsfw_text",
+            "version": "0.1.0",
+            "source": "hub://guardrails/nsfw_text"
         }
     ]
 }
diff --git a/backend/app/schemas/guardrail_config.py b/backend/app/schemas/guardrail_config.py
@@ -24,6 +24,15 @@
 from app.core.validators.config.topic_relevance_safety_validator_config import (
     TopicRelevanceSafetyValidatorConfig,
 )
+from app.core.validators.config.llamaguard_7b_safety_validator_config import (
+    LlamaGuard7BSafetyValidatorConfig,
+)
+from app.core.validators.config.nsfw_text_safety_validator_config import (
+    NSFWTextSafetyValidatorConfig,
+)
+from app.core.validators.config.profanity_free_safety_validator_config import (
+    ProfanityFreeSafetyValidatorConfig,
+)
 
 ValidatorConfigItem = Annotated[
     Union[
@@ -32,6 +41,9 @@
         LexicalSlurSafetyValidatorConfig,
         LLMCriticSafetyValidatorConfig,
         PIIRemoverSafetyValidatorConfig,
+        LlamaGuard7BSafetyValidatorConfig,
+        NSFWTextSafetyValidatorConfig,
+        ProfanityFreeSafetyValidatorConfig,
         TopicRelevanceSafetyValidatorConfig,
     ],
     Field(discriminator="type"),