Microsoft liberó VibeVoice como Open Source.
🚨 Noticia importante para la comunidad.
En simple: es un modelo que genera voz humana desde texto en tiempo real. Latencia de 300 milisegundos. Nueve idiomas (sí, incluido español). Hasta 90 minutos de audio. Hasta 4 voces diferentes. Gratis. Licencia MIT.
Pero lo que a mí me voló la cabeza es esto:
El modelo Realtime permite que un LLM empiece a HABLAR desde el primer token. No espera a que termine de generar. Habla mientras piensa.
Eso significa que podemos construir agentes de voz verdaderamente en tiempo real conectados a n8n.
Piensen en esto:
- Un agente que atiende llamadas y responde con voz natural
- Un workflow que genera un podcast completo con múltiples voces desde un guión
- Transcripción automática de reuniones de 1 hora con identificación de quién habla
Todo esto Open Source. Todo conectable a n8n.
Estoy armando un tutorial paso a paso para integrarlo. Stay tuned.
¿Qué caso de uso les gustaría ver primero? 💬
3
4 comments
Joseph Corona
3
Microsoft liberó VibeVoice como Open Source.
powered by
n8n academy
skool.com/joseph-3995
Acá aprenderás sobre n8n, Claude, agentes IA, Agentes de voz, automatizaciones, ChatGPT, Lovable
Build your own community
Bring people together around your passion and get paid.
Powered by