Modelos y Audio

Configura los motores de IA y los parámetros de audio del agente SIP.

🔊 Audio SIP (Zadarma Bridge)

Controla cómo suena el bot en las llamadas telefónicas.

100%
100% = original · >150% puede saturar · <50% puede ser inaudible en la línea SIP

🔬 DSP — Downsampling 24kHz → 8kHz

Parámetros del filtro anti-aliasing que procesa el audio TTS antes de enviarlo por RTP. Cambia en caliente — afecta a la próxima frase que genere el bot.

Balance óptimo. Buen rechazo de aliasing con suavidad natural.

Balance óptimo

Nativo Kokoro-82M (recomendado) — Ratio de decimación: 3.00x (entero → FIR activo)

Config activa: 24000Hz → FIR(hanning, 7 taps) → decimate(3x) → 8000Hz μ-law → RTP@20ms

🧠 Modelo LLM (Cerebro Conversacional)

Genera la respuesta del agente. El modelo se aplica en la próxima llamada.

🎙️ STT — Faster Whisper (local)

El reconocimiento de voz corre localmente en el servidor Docker. Modelo base.

Motor
Faster-Whisper (local, open source)
Modelo
Whisper Base (~150MB)
Latencia
~300-600ms por frase
Idioma activo
Español