Skip to content

Video quality enhancement#10

Open
masterface77 wants to merge 26 commits intoRafaelGodoyEbert:mainfrom
masterface77:video-quality-enhancement
Open

Video quality enhancement#10
masterface77 wants to merge 26 commits intoRafaelGodoyEbert:mainfrom
masterface77:video-quality-enhancement

Conversation

@masterface77
Copy link
Copy Markdown

Olá! 👋

Este PR introduz melhorias significativas no sistema de tracking facial e na compatibilidade com ambientes de nuvem (Colab e Kaggle). O foco principal é a implementação do YOLO Smooth Tracking, que substitui cortes bruscos por um movimento de câmera suave e cinematográfico, além de otimizações de memória para GPUs T4.

🚀 Principais Alterações

1. Smooth Face Tracking (Cinematográfico)

  • Implementação de YOLOv8 + ByteTrack para detecção e persistência de IDs.

  • Adição de EMA (Exponential Moving Average) para suavização do movimento da câmera.

  • Controle no Gradio: Nova aba "Advanced Face Settings" com slider de suavidade (Tracking Smoothness).

    • 0.02 (Ultra Suave) a 0.10 (Rápido).

2. Otimização para GPUs T4 (Colab/Kaggle)

  • Ajustes no WhisperX para evitar OOM (Out of Memory) em GPUs de 16GB:

    • compute_type="int8_float16" (reduz uso de VRAM em ~50%).

    • batch_size=8.

    • chunk_size=15.

3. Novos Notebooks e Suporte a Kaggle

  • Notebook Colab Smooth Zoom: Configuração facilitada com upload automático para o Drive.

  • Notebook Kaggle: Suporte completo adicionado (aproveitando as 30h semanais de GPU grátis).

    • Inclui instruções para setup de Datasets (Client Secret, Cookies, Gemini API).

    • Upload via OAuth implementado.

📊 Comparativo de Ambientes Adicionados

Característica | Colab | Kaggle -- | -- | -- Zoom IA | Removido (nesta versão) | ✅ Disponível Persistência | Nenhuma | ✅ Via Datasets GPU Grátis | ~12h/dia (instável) | 30h/semana (estável)

🧪 Como testar

  1. Utilizar os notebooks incluídos (ViralCutter-SmoothZoom.ipynb ou versão Kaggle).

  2. No Gradio, selecionar o Face Model como yolo.

  3. Ajustar o slider "Tracking Smoothness" para verificar a diferença na suavidade do vídeo gerado.

masterface77 and others added 26 commits February 8, 2026 07:48
…ng-Head

- Add Auto Illumination (CLAHE) to video_quality.py
- Pipeline: Denoise  Auto Illumination  Color Grading  Unsharp
- Add Blur Background mode (blurred bg + sharp center for 9:16)
- Calibrate YOLO center_y offset (50%  30% for talking-head framing)
- Update unsharp mask to Visual Opus params (5:5:1.0)
- Add Colab notebook (viralcutter-Colab-Quality.ipynb)
- Update Kaggle notebook with new pipeline
- Update batch files with Visual Opus branding
… - InsightFace, TwoFace, Padding/Blur fallbacks now use enhance_frame(high) + Lanczos
…use wider 42% crop with blur background composite - Reduces upscale from 1.78x to 1.34x for 16:9 sources - Added 4K and 1440p download options (CLI, WebUI, download_video) - WebUI defaults to 4K quality
@ratuxx
Copy link
Copy Markdown

ratuxx commented Mar 11, 2026

Issue #10 Fechado

Implementação de retry com recovery de jobs completada.

Commit: 2517d21
O que foi feito:

  • ✅ Endpoint POST /api/jobs/{job_id}/retry
  • ✅ Suporte a recomeçar de step específico (cutting, editing, burning_subtitles)
  • ✅ Recuperação automática de estado anterior
  • ✅ Retry com lógica de estado persistente

Documentação: Ver API_DOCUMENTATION.md seção "Reprocessar Job" e API_EXAMPLES.json exemplo #10

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants