Diferencia entre revisiones de «Omnisuite STT y TTS»

Revisión del 11:09 14 may 2026

Se han desarrollado conectores propios para

Speech To Text (STT)
Text To Speech (TTS)

Para los proveedores

Evelenlabs
Google

La configuración eficiente es usar STT de ElevenLabs y TTS de Google

ElevenLabs

Se dispone de los programas

/opt/omnisuite/bin/omnisuiteSTT11p para Speech to Text (STT)
/opt/omnisuite/bin/omnisuiteTTS11p para Text To Speech (TTS)

Que deberán ser invocado desde un comando "system" de Cally Square

Invocación a TTS de 11labs

En la invocación para Speech to Text incluiremos

Fichero ".ini"
stt --> comando para speech a text
Modelo a usar
idioma a usar
fichero a convertir a texto

Ejemplo STT

/usr/bin/omnisuiteSTT11p /etc/MDtel/elevenlabs.ini stt scribe_v2 es  /var/lib/asterisk/sounds/{id_llamada}_stt.wav | jq -r '.text'</cde>



En el ejemplo vemos que del resultado obtenido "parseamos" solo el campo '.text'


En la invocación para Text to Speech incluiremos

Fichero ".ini"
tst --> comando para speech a text
idioma a usar
Modelo a usar
Voz a usar
Fichero donde quedará el audio obtenido
Texto a convertir



Ejemplo TTS

 /usr/bin/omnisuiteTTS11p /etc/MDtel/elevenlabs.ini tts es eleven_turbo_v2_5 1eHrpOW5l98cxiSRjbzJ /var/lib/asterisk/sounds/{id_llamada}_tts.alaw "{vflow_respuesta}"



El fichero ".ini" (por defecto /etc/MDtel/elevenlabs.ini)contiene:

Una sección comun en la que habrá que cambiar el api_key
Una sección stt, para "speech to text" en la que se configurarán los keyterms del proyecto
Una sección tts, para "text to speech"

[comun]
proxy=no
api_key=APIKEYDELPROYECTO

[stt]
# enable_logging=false solo enterprise
url=https://api.elevenlabs.io/v1/speech-to-text?enable_logging=true
to_ms=10000
# temperature=0.0 a 2.0
temperature=0.1
# keyterms_XX: pueden estar todos vacios o no existir. 00<=XX<=09
keyterms_00=
keyterms_01=
keyterms_02=
keyterms_03=
keyterms_04=
keyterms_05=
keyterms_06=
keyterms_07=
keyterms_08=
keyterms_09=

[tts]
url=https://api.elevenlabs.io/v1/text-to-speech/%s?output_format=%s_8000
to_ms=10000

@@ Línea 25: / Línea 25: @@
 :* fichero a convertir a texto
 <br>
-'''Ejemplo'''
+'''Ejemplo STT '''
 :: <code>/usr/bin/omnisuiteSTT11p /etc/MDtel/elevenlabs.ini stt scribe_v2 es  /var/lib/asterisk/sounds/{id_llamada}_stt.wav | jq -r '.text'</cde>
 <br>
 En el ejemplo vemos que del resultado obtenido "parseamos" solo el campo <code>'.text'</code>
 <br>
-El programa lleva asociado un fichero <code>/etc/MDtel/elevenlabs.ini</code>, que contiene:
+En la invocación para '''Text to Speech''' incluiremos
+:* Fichero ".ini"
+:* <code>tst</code> --> comando para speech a text
+:* idioma a usar
+:* Modelo a usar
+:* Voz a usar
+:* Fichero donde quedará el audio obtenido
+:* Texto a convertir
+<br>
+'''Ejemplo TTS '''
+:: <code> /usr/bin/omnisuiteTTS11p /etc/MDtel/elevenlabs.ini tts es eleven_turbo_v2_5 1eHrpOW5l98cxiSRjbzJ /var/lib/asterisk/sounds/{id_llamada}_tts.alaw "{vflow_respuesta}" </code>
+El fichero ".ini" (por defecto <code>/etc/MDtel/elevenlabs.ini</code>)contiene:
 :* Una sección <code>comun</code> en la que habrá que cambiar el <code>api_key</code>
 :* Una sección <code>stt</code>, para "speech to text" en la que se configurarán los keyterms del proyecto

Diferencia entre revisiones de «Omnisuite STT y TTS»

Revisión del 11:09 14 may 2026

ElevenLabs

Menú de navegación

Acciones de página

Acciones de página

Herramientas personales

Usuario

Administrador

Servicio técnico

Desarrollo

vFlow

Omnisuite

VIVAit Fax

Cartelia

Roadmap

Imprimir/exportar

Buscar

Herramientas