Один пользователь из Китая без команды, бюджета и съёмочного оборудования смог за пару недель создать анимационный короткометражный фильм, стилистически близкий к антологии «Любовь, смерть и роботы». Проект уже обсуждают в профильных сообществах как один из самых впечатляющих примеров полностью генеративного видео за всю недолгую историю публичных нейросетей. Автор не раскрыл своё имя, но подробно описал собственный пайплайн, который позволил получить плавное, визуально насыщенное и сюжетно связное зрелище на основе сотен текстовых запросов.
Ключевых инструментов оказалось четыре — и каждый выполнял строго свою задачу, компенсируя слабые места соседних моделей. Midjourney использовалась для отрисовки основных композиций и ключевых кадров, именно она задала эстетику, близкую к рисованным и CGI-эпизодам сериала. По словам автора, большая часть чернового визуала была получена именно через Midjourney, после чего материал уходил на доработку и сшивку.
Самой интересной связкой оказался тандем Nano Banana Pro и Flux 2 Max. Первая отвечала за генерацию промежуточных состояний между кадрами и создание плавных переходов и именно она превратила набор статичных артов в видеофрагменты с реалистичным движением, сменой ракурсов и морфингом объектов. Однако у Nano Banana Pro есть встроенные фильтры безопасности, которые в некоторых сценах ломали результат. В этих случаях вручную подключался Flux 2 Max — его цензурные ограничения оказались мягче, что позволило сохранить задуманные автором сцены без искажений и отказов модели. Финальную сборку и конвертацию набора полученных фрагментов в полноценный фильм выполняла SeeDance 2, которая не генерировал новый контент, а синхронизировал видеокусочки в цельный таймлайн, сглаживал стыки и помогал