В мире искусственного интеллекта назревает очередной скандал. На этот раз в центре внимания оказалась NVIDIA — компания, чьи чипы стоят за многими современными ИИ-системами. Причина конфликта кроется в использовании книг, защищённых авторским правом, для обучения ИИ-моделей.
Всё началось с признания NVIDIA в использовании набора данных 'Books3'. Этот набор, по сути, представляет собой библиотеку текстов с сайта Bibliotik, который многие считают «пиратским». Такое признание вызвало бурю негодования среди писателей. Группа авторов не стала медлить и подала коллективный иск, обвинив NVIDIA в нарушении их авторских прав. Стоит отметить, что NVIDIA здесь не одинока — подобные иски поданы и против других техногигантов: OpenAI, Microsoft и Meta.
Однако NVIDIA не собирается сдаваться без боя. Компания выдвинула неожиданный аргумент: использование книг для обучения ИИ — это, по их мнению, «добросовестное использование». Их объяснение заключается в том, что ИИ-модели не «читают» книги в привычном нам смысле. Вместо этого они анализируют «статистические корреляции» в текстах.
«Обучение измеряет статистические корреляции в совокупности, на основе огромного массива данных, и кодирует их в параметры модели», — заявляет NVIDIA в судебных документах. По их словам, этот процесс полностью меняет изначальное назначение книг, что и позволяет отнести его к добросовестному использованию.
NVIDIA идёт ещё дальше в своей аргументации. Компания утверждает, что авторы вообще не могут претендовать на авторские права на «факты и идеи» в своих книгах. Их логика такова: если принять противоположную точку зрения, то получится, что писатели могут защищать авторским правом даже правила грамматики или базовые факты о мире.
В поддержку своей позиции NVIDIA