Subtítulos en tiempo real para que nadie se quede fuera de la conversación.
Creado con cariño para una amiga.
Ahora disponible como aplicación multiplataforma 🚀
# 1. Inicia el servidor
pip install -r requirements.txt
python main.py
# 2. Abre Chrome/Edge en: http://localhost:8000
# 3. Click en "Instalar" (ícono ➕ en la barra de direcciones)
# 4. ¡Listo! Ahora tienes Iyari-ear como app# Instalar
pip install -e .
# Comandos disponibles
iyari-ear doctor # Verifica sistema
iyari-ear test-mic # Prueba micrófono
iyari-ear start # Inicia servidor- Windows: Ejecutable .exe
- Linux: Script de instalación
- Android (Termux): Guía de instalación
- macOS: Homebrew setup
📖 Guía completa de instalación | Matriz de compatibilidad
Subtítulos en tiempo real en tu celular. Sin fricción. Solo conexión.
📱 Un celular sobre la mesa
🗣️ Alguien habla
✨ Las palabras aparecen
Sin ruido. Sin fricción. Solo conexión.
# Método 1: CLI (si ya lo instalaste)
iyari-ear start
# Método 2: Python directo
pip install -r requirements.txt
python main.py
# Visita: http://localhost:8000
# Presiona "Iniciar" → Habla → Ve el texto💡 Nuevo: Instala como PWA para acceso rápido desde tu menú de apps
Una aplicación multiplataforma para generar subtítulos en tiempo real. Captura audio desde el micrófono del navegador, lo envía a un servidor backend que lo transcribe a texto, y muestra los subtítulos en la pantalla.
Es una herramienta pensada para ayudar a personas con dificultades auditivas en conversaciones cara a cara, usando un celular, tablet o computadora como pantalla de apoyo.
- 📱 PWA: Instálala como app en cualquier dispositivo
- 🎨 Dashboard Colorido: Diseño profesional con modo oscuro y tema rainbow
- 🔊 Animación Pulse: Indicador visual cuando detecta voz
- ♿ Accesibilidad: Modo alto contraste, texto ultra legible
- 🖥️ CLI Completo: Comandos
doctor,test-mic,start - 🪟 Ejecutable Windows: Doble-click y listo
- 🤖 Soporte Android: Via Termux o PWA
- 🐧 Servicio Linux: systemd para auto-inicio
- 🎬 Optimizador de Subtítulos: Valida y optimiza archivos de subtítulos (SRT, VTT, ASS)
- 🎮 Plugin VLC: Integración con VLC Media Player para optimización automática
- 🌐 API REST: Endpoints para procesamiento de subtítulos vía HTTP
La aplicación tiene dos partes principales:
- Frontend: Una página web (HTML, CSS, JavaScript) que se ejecuta en el navegador. Se encarga de pedir permiso para el micrófono, grabar el audio y enviarlo al backend. También recibe el texto transcrito y lo muestra.
- Backend: Un servidor en Python (FastAPI, WebSockets) que recibe los fragmentos de audio, utiliza la API de reconocimiento de voz de Google para transcribirlos a texto y los devuelve al frontend.
María tiene pérdida auditiva parcial. Está sentada con una amiga en una cafetería ruidosa. Coloca su celular frente a la mesa y abre Iyari-ear.
La app muestra en tiempo real:
— ¿Quieres café o té?
— Café, por favor.
— ¿Azúcar?
— No, gracias.
María no necesita pedir que repitan. Lee y participa.
Un paciente con dificultad auditiva asiste al doctor.
El doctor habla normalmente. El celular del paciente muestra:
Doctor: Vamos a ajustar la dosis.
Doctor: ¿Has tenido mareos últimamente?
Paciente: No, solo un poco de cansancio.
No hay grabaciones. No hay almacenamiento. Solo texto en tiempo real.
Una abuela con problemas auditivos usa una tablet durante la comida familiar.
La conversación aparece como subtítulos grandes y claros:
— El pastel es de chocolate.
— Cumples 8 años mañana.
— ¿Te gustó la escuela?
La tecnología desaparece. Solo queda la conversación.
"Creado con cariño para una amiga."
Iyari-ear no es un producto. Es una herramienta de empatía.
- Ayudar a escuchar sin invadir.
- Apoyar sin vigilar.
- Mostrar palabras, no juzgar voces.
La tecnología al servicio de la conexión humana.
Micrófono del navegador
↓
Fragmentos de audio
↓
Servidor Python (WebSockets)
↓
API de reconocimiento de voz
↓
Texto transcrito
↓
Subtítulos en pantalla
Todo ocurre en segundos.
Iyari-ear ahora incluye un potente sistema de optimización de subtítulos que mejora la legibilidad y compatibilidad de archivos de subtítulos.
- ✅ Validación automática: Detecta problemas de timing, superposiciones y formato
- 🔧 Optimización inteligente: Corrige duraciones, divide líneas largas, ajusta espaciado
- 📁 Múltiples formatos: Soporta SRT, VTT, ASS/SSA
- 🎮 Plugin VLC: Integración directa con VLC Media Player
- 🌐 Interfaz web: Interfaz drag-and-drop en el navegador
- 💻 CLI potente: Procesamiento por lotes desde línea de comandos
- 🔌 API REST: Integración con otros sistemas
# Optimizar subtítulos desde CLI
iyari-ear process-subtitle pelicula.srt pelicula.optimized.srt
# Instalar plugin para VLC
iyari-ear install-vlc-plugin
# Acceder a interfaz web
# Visita: http://localhost:8000/subtitle-optimizer- No es una grabadora de audio
- No es un sistema de vigilancia
- No guarda conversaciones
- No reemplaza intérpretes de lengua de señas
- No es perfecto en ambientes extremadamente ruidosos
Es una herramienta de apoyo, no de control.
- Requiere conexión a internet
- La precisión depende del ruido ambiental
- Acentos muy marcados pueden afectar la transcripción
- No está pensada para transcripción legal o forense
Estas limitaciones son parte del diseño ético del proyecto.
- Python 3.7 o superior.
- Un micrófono conectado al dispositivo donde se abrirá la página web.
- Conexión a internet (ya que se usa la API de Google para la transcripción).
Sigue estos pasos para poner en marcha la aplicación.
Primero, necesitamos instalar las dependencias de Python y ejecutar el servidor.
# 1. (Opcional pero recomendado) Crea un entorno virtual
python -m venv venv
source venv/bin/activate # En Windows usa: venv\\Scripts\\activate
# 2. Instala las librerías necesarias desde requirements.txt
pip install -r requirements.txt
# 3. Inicia el servidor
python main.pySi todo va bien, verás un mensaje como este en tu terminal, lo que significa que el servidor está escuchando:
Servidor de WebSockets iniciado en ws://0.0.0.0:8000
Deja esta terminal abierta mientras usas la aplicación.
Ahora que el servidor está corriendo, puedes abrir la interfaz.
Opción A: En la misma computadora
- Abre el archivo
index.htmldirectamente en tu navegador web (Firefox, Chrome, etc.). - La página se cargará. Presiona el botón "Iniciar".
- El navegador te pedirá permiso para usar el micrófono. Debes aceptarlo.
- ¡Habla y los subtítulos aparecerán en la pantalla!
Opción B: En tu celular (o cualquier otro dispositivo)
Esta es la forma más práctica de usarlo.
-
Asegúrate de que tu celular y la computadora donde corre el servidor estén conectados a la misma red Wi-Fi.
-
Busca la dirección IP local de tu computadora.
- En Windows: Abre
cmdy escribeipconfig. Busca la dirección "IPv4 Address". - En macOS o Linux: Abre una terminal y escribe
hostname -Ioifconfig. - Será un número como
192.168.1.10o10.0.0.5.
- En Windows: Abre
-
En el navegador de tu celular, introduce la siguiente dirección:
http://<LA_IP_DE_TU_COMPUTADORA>:8000(Reemplaza<LA_IP_DE_TU_COMPUTADORA>con el número que encontraste). -
La página cargará. Presiona "Iniciar", acepta el permiso del micrófono y ¡listo! El servidor de Python se encarga de todo.
Si durante la instalación (pip install -r requirements.txt) ves un error relacionado con PyAudio y portaudio.h, significa que te falta una librería del sistema.
Puedes solucionarlo instalando el paquete de desarrollo de PortAudio. En sistemas basados en Debian/Ubuntu, el comando es:
sudo apt-get update && sudo apt-get install -y portaudio19-devDespués de instalarlo, vuelve a ejecutar pip install -r requirements.txt.