Nvidia $NVDA presenta ‘Fugatto’, su revolucionario modelo de IA capaz de transformar voces, crear música y generar sonidos a partir de texto

Screenshot video YouTube / Nvidia

NVIDIA ha dado un gran paso en el campo de la inteligencia artificial con el lanzamiento de Fugatto (Foundational Generative Audio Transformer Opus 1), un modelo avanzado con 2.500 millones de parámetros, entrenado en las poderosas GPUs H100 de la compañía. Fugatto está diseñado para transformar la forma en que creamos y modificamos música, voz y sonidos, y tiene el potencial de cambiar por completo la industria del entretenimiento, desde los estudios de cine de Hollywood hasta la creación de paisajes sonoros en videojuegos.

Hasta ahora, la IA ha logrado avances importantes en áreas como la generación de imágenes y el procesamiento del lenguaje, pero Fugatto lleva todo eso un paso más allá al centrarse en el audio. Este modelo no solo puede componer música compleja desde cero, sino también alterar patrones de habla y crear sonidos completamente nuevos. Lo impresionante es que puede hacer todo esto con una facilidad que antes solo era posible para músicos y técnicos de sonido altamente especializados. Fugatto tiene la capacidad de generar sonidos a partir de descripciones textuales y modificar grabaciones ya existentes, lo que podría cambiar radicalmente la manera en que los creadores de contenido trabajan.

Una nueva frontera en el diseño de sonido

Lo que realmente distingue a Fugatto es su increíble flexibilidad. Además de generar composiciones musicales originales a partir de texto, el modelo también puede transformar grabaciones preexistentes de maneras que antes no eran posibles. Por ejemplo, puede tomar una melodía de piano y convertirla en una pieza cantada por una voz humana, o incluso modificar una grabación para cambiar el acento de la persona que habla. Además, puede ajustar el tono emocional de la voz para transmitir diferentes estados de ánimo, como felicidad, tristeza o tensión. En resumen, Fugatto abre un abanico de posibilidades nunca antes imaginadas para quienes trabajan con el sonido.

Qué significa esto para los creadores de contenido?

Aunque NVIDIA aún no ha anunciado si Fugatto estará disponible para el público en general, el gran potencial de esta nueva tecnología ya ha despertado entusiasmo en las industrias del entretenimiento y la tecnología. Por ahora, Fugatto parece estar dirigido principalmente a profesionales: productores de cine y música, desarrolladores de juegos y otros creadores que podrían aprovechar sus capacidades avanzadas.