Microsoft liberó VibeVoice como Open Source.
🚨 Noticia importante para la comunidad. En simple: es un modelo que genera voz humana desde texto en tiempo real. Latencia de 300 milisegundos. Nueve idiomas (sí, incluido español). Hasta 90 minutos de audio. Hasta 4 voces diferentes. Gratis. Licencia MIT. Pero lo que a mí me voló la cabeza es esto: El modelo Realtime permite que un LLM empiece a HABLAR desde el primer token. No espera a que termine de generar. Habla mientras piensa. Eso significa que podemos construir agentes de voz verdaderamente en tiempo real conectados a n8n. Piensen en esto: - Un agente que atiende llamadas y responde con voz natural - Un workflow que genera un podcast completo con múltiples voces desde un guión - Transcripción automática de reuniones de 1 hora con identificación de quién habla Todo esto Open Source. Todo conectable a n8n. 📎 https://github.com/microsoft/VibeVoice Estoy armando un tutorial paso a paso para integrarlo. Stay tuned. ¿Qué caso de uso les gustaría ver primero? 💬