За прошедший год технологии создания дипфеков достигли уровня, когда даже специалисты с трудом отличают подделку от оригинала. По данным исследователей, нейросети научились генерировать не только статичные изображения, но и последовательные видео с реалистичной мимикой, а также клонировать голоса по коротким образцам.
Три основных фактора способствовали резкому улучшению качества синтетического контента. Во-первых, современные модели обеспечивают временную согласованность — персонажи в видео двигаются естественно, без характерных ранее искажений вокруг глаз или челюсти. Во-вторых, для создания голосового клона теперь достаточно нескольких секунд записи, при этом синтезированная речь включает паузы, эмоциональную окраску и даже дыхание. В-третьих, инструменты для генерации стали доступны широкому кругу пользователей благодаря развитию платформ вроде Sora 2 и Veo 3.
Количество дипфейков в интернете растёт экспоненциально и если в 2023 году было зафиксировано около 500 тысяч материалов подобного рода, то к концу 2025 года их число приблизилось к 8 миллионам, что создаёт дополнительные сложности для модерации контента в социальных сетях и мессенджерах. Дипфейки уже активно используются для мошеннических схем, включая звонки от сотрудников банков или рассылку компрометирующих видео. Эксперты отмечают, что в условиях высокой скорости распространения информации традиционные методы верификации часто оказываются бесполезными.
В качестве противодействия специалисты предлагают внедрять системные решения — цифровую маркировку оригинального контента и применение мультимодальных инструментов для автоматического анализа файлов, ведь простого визуального осмотра или прослушивания в большинстве случаев уже недостаточно.
Ожидается, что в

