Ученые из Вашингтонского университета и Университета Колорадо в Боулдере опубликовали научную работу о создании художественных текстов с помощью искусственного интеллекта. В ходе анализа сотен тысяч диалогов специалисты обнаружили крайне активного пользователя, который сгенерировал огромное количество фанфиков о беременности персонажей из визуальной новеллы Doki Doki Literature Club!.
Исследование под названием AI Fiction in the Wild основывается на базе данных WildChat, которая содержит более 573 000 анонимных англоязычных диалогов с чатботом ChatGPT за период с апреля 2023 года по май 2024 года. Этот набор данных был собран через бесплатный сервис на платформе Hugging Face, где пользователи имели доступ к моделям GPT-3.5 Turbo и GPT-4 и заранее соглашались на возможное использование их запросов в научных целях.
Для выделения диалогов, связанных с сочинением историй, авторы работы отфильтровали запросы, содержащие вымышленные сценарии. В результате около 195 000 бесед были классифицированы как создание художественной литературы. Примерно 52 000 из этих диалогов содержали материалы сексуального характера, а еще 67 000 были помечены как токсичные. Таким образом, почти 30% от всей созданной пользователями художественной литературы с помощью искусственного интеллекта были связаны с интимными темами.
Ученые также выяснили, что генерация историй сильно сконцентрирована среди очень узкого круга пользователей. Лишь 2% наиболее активных авторов сгенерировали более 80% от всех художественных текстов. Общее число пользователей, занимавшихся созданием историй, оценивается примерно в 10 000 человек, из которых всего около 200 авторов отправили более 150 000 запросов.
Среди этих сверхактивных пользователей исследователи выделили 2
