NVIDIA анонсировала новую экспериментальную модель генеративного ИИ под названием Fugatto (Foundational Generative Audio Transformer Opus 1), которая способна генерировать и модифицировать музыкальные, голосовые и звуковые файлы на основе текстовых запросов.
Модель разработана для работы с широким спектром задач, включая:
Fugatto также обладает уникальной способностью комбинировать команды, например, синтезировать речь с определёнными акцентами и интонациями или создавать звуки разного рода, которые при этом будут иметь динамику. Разработка модели велась при участии специалистов со всего мира, что позволило интегрировать в неё многоязычные и многоакцентные возможности.
На данный момент NVIDIA не раскрывает деталей о публичном доступе к Fugatto, оставив этот вопрос без комментариев.