Основное отличие o1 от предыдущих версий ИИ заключается в её способности к логическому мышлению и анализу. В отличие от GPT-4o, который в основном полагается на поиск ответов в базе данных, o1 имитирует человеческий процесс мышления: она разбивает задачи на отдельные шаги, рассматривает различные подходы и исправляет свои собственные ошибки. Это делает её гораздо более эффективной в решении сложных задач, требующих последовательного анализа и логического рассуждения.
Модель продемонстрировала выдающиеся результаты на тестах, предназначенных для оценки умственных способностей. В частности, на квалификационном этапе Международной математической олимпиады (IMO), o1 справилась с 83% задач, что значительно превосходит результаты GPT-4o, который правильно решил только 13%. В тестах на программирование модель заняла 49-е место на Международной олимпиаде по информатике (IOI) и показала превосходство над 89% участников платформы Codeforces.
Модель прошла сложный тест GPQA diamond, который оценивает знания в таких областях, как химия, физика и биология. В результате, o1 показала уровень, сопоставимый с докторами наук, хотя разработчики подчёркивают, что это не означает её превосходство над всеми специалистами, а лишь её способность решать некоторые задачи на высочайшем уровне.
Ключом к успеху новой модели стал принципиально новый алгоритм обучения, известный как «цепочка мыслей». Этот подход позволяет o1 продумывать свои решения более глубоко, прибегая к методу обучения с подкреплением, что даёт возможность нейросети не только исправлять собственные ошибки, но и оптимизировать процесс решения задач, пробуя разные стратегии.
Однако, несмотря на все преимущества, у модели o1 есть и свои недостатки. Она менее эффективна при работе с