Cesar Mendivil 293007db64 Fix & update to complete flow to build traduction

2025-10-24 10:11:20 -07:00

2.0 KiB

Raw Blame History

EXAMPLES - Pipeline Whisper + Kokoro TTS

Ejemplos de uso (desde la raíz del repo, usando el venv .venv):

Dry-run (muestra los comandos que se ejecutarían):

.venv/bin/python whisper_project/run_full_pipeline.py
--video dailyrutines.mp4
--kokoro-endpoint "https://kokoro.bfzqqk.easypanel.host/api/v1/audio/speech"
--kokoro-key "$KOKORO_TOKEN" --voice em_alex
--whisper-model base --dry-run

Ejecución completa (reemplaza el audio):

Usar un SRT ya generado (evita transcribir):

.venv/bin/python whisper_project/run_full_pipeline.py
--video dailyrutines.mp4 --srt subs_en.srt
--kokoro-endpoint "https://kokoro..." --kokoro-key "$KOKORO_TOKEN" --voice em_alex

Traducir con Gemini (si tienes clave) o usar fallback local:

Usar Gemini (requiere --gemini-key o la variable GEMINI_API_KEY)

.venv/bin/python whisper_project/run_full_pipeline.py
--video dailyrutines.mp4 --translate-method gemini --gemini-key "$GEMINI_KEY"
--kokoro-endpoint "https://kokoro..." --kokoro-key "$KOKORO_TOKEN" --voice em_alex

Forzar traducción local (MarianMT):

.venv/bin/python whisper_project/run_full_pipeline.py
--video dailyrutines.mp4 --translate-method local
--kokoro-endpoint "https://kokoro..." --kokoro-key "$KOKORO_TOKEN" --voice em_alex

Mezclar (mix) en lugar de reemplazar:

.venv/bin/python whisper_project/run_full_pipeline.py
--video dailyrutines.mp4 --mix --mix-background-volume 0.3
--kokoro-endpoint "https://kokoro..." --kokoro-key "$KOKORO_TOKEN" --voice em_alex

Notas:

Si algo falla con Gemini, el pipeline soporta fallback a la traducción local.
Usa --keep-temp y/o --keep-chunks para inspeccionar los WAV intermedios.
Ajusta --whisper-model a "base", "small", "medium" según recursos.

2.0 KiB Raw Blame History

Usar Gemini (requiere --gemini-key o la variable GEMINI_API_KEY)

Forzar traducción local (MarianMT):

2.0 KiB

Raw Blame History