Modelos y Audio
Configura los motores de IA y los parámetros de audio del agente SIP.
🔊 Audio SIP (Zadarma Bridge)
Controla cómo suena el bot en las llamadas telefónicas.
100%
🔬 DSP — Downsampling 24kHz → 8kHz
Parámetros del filtro anti-aliasing que procesa el audio TTS antes de enviarlo por RTP. Cambia en caliente — afecta a la próxima frase que genere el bot.
Balance óptimo. Buen rechazo de aliasing con suavidad natural.
Balance óptimo
Nativo Kokoro-82M (recomendado) — Ratio de decimación: 3.00x (entero → FIR activo)
Config activa: 24000Hz → FIR(hanning, 7 taps) → decimate(3x) → 8000Hz μ-law → RTP@20ms
🧠Modelo LLM (Cerebro Conversacional)
Genera la respuesta del agente. El modelo se aplica en la próxima llamada.
ðŸŽ™ï¸ STT — Faster Whisper (local)
El reconocimiento de voz corre localmente en el servidor Docker. Modelo base.
Motor
Faster-Whisper (local, open source)
Modelo
Whisper Base (~150MB)
Latencia
~300-600ms por frase
Idioma activo
Español