Представляем OpenAI o1: Новая серия моделей для решения сложных задач
Обновление от 17 сентября 2024 года: теперь ограничения по скорости составляют 50 запросов в неделю для o1-preview и 50 запросов в день для o1-mini.
Мы разработали новую серию моделей искусственного интеллекта OpenAI o1, которые тратят больше времени на размышления перед тем, как давать ответы. Эти модели предназначены для решения более сложных задач в таких областях, как естественные науки, программирование и математика.
Сегодня мы представляем o1-preview, первую модель из этой серии, доступную в ChatGPT и через API. Это предварительная версия, и мы планируем регулярно выпускать обновления и улучшения. Наряду с выпуском o1-preview мы также включаем предварительные оценки следующей модели, которая уже находится в разработке.
Содержание
ToggleКак это работает
Мы обучили модели o1 тратить больше времени на анализ сложных задач перед тем, как дать ответ, что напоминает процесс человеческого мышления. Эти модели учатся совершенствовать свои стратегии рассуждений, тестировать различные подходы и признавать ошибки.
В тестах новая модель o1-preview показывает результаты на уровне студентов PhD по физике, химии и биологии. Кроме того, она превосходит их в решении математических задач и программировании. Например, на квалификационном экзамене для Международной математической олимпиады (IMO) модель GPT-4o решила 13% задач, тогда как модель o1 достигла впечатляющих 83%. В соревнованиях по программированию Codeforces модель o1 попала в 89-й процентиль. Подробности можно найти в нашем техническом исследовании.
Хотя эта модель еще не поддерживает такие функции, как поиск информации в Интернете или загрузка файлов и изображений, она представляет собой значительный шаг вперед в области сложных рассуждений и интеллектуального анализа.
Прорыв в безопасности
Мы также разработали новые подходы к безопасности, используя способность моделей o1 рассуждать о правилах. Благодаря этому они могут более точно следовать установленным нормам и предотвращать возможные обходы правил.
Один из ключевых тестов на взлом показал, что GPT-4o набрала 22 балла из 100, тогда как o1-preview набрала 84 балла, что подтверждает её превосходство в вопросах безопасности. Эти результаты и дополнительные данные можно найти в нашей системной карточке и исследовательских постах.
Чтобы усилить меры безопасности, мы также наладили тесное сотрудничество с институтами безопасности ИИ в США и Великобритании. Мы предоставляем ранний доступ к исследовательским версиям моделей, чтобы способствовать совместной разработке и тестированию.
Для кого это
Модели серии o1 будут полезны для пользователей, решающих сложные задачи в областях, требующих глубокого анализа, таких как естественные науки, программирование и математика. Например, исследователи могут использовать o1 для аннотирования данных о клетках, физики — для генерации сложных формул в квантовой оптике, а разработчики — для создания и выполнения многоступенчатых рабочих процессов.
OpenAI o1-mini
Наряду с o1-preview, мы также выпускаем более компактную версию — o1-mini, которая быстрее и дешевле. Эта модель особенно эффективна для задач программирования, предлагая разработчикам мощное решение с экономией до 80% по сравнению с o1-preview. Хотя o1-mini менее мощная, она идеально подходит для случаев, когда требуется логическое мышление, но не нужен глубокий анализ или обширные знания.
Как начать использование OpenAI o1
С сегодняшнего дня пользователи ChatGPT Plus и Team могут получить доступ к моделям o1-preview и o1-mini в ChatGPT, выбрав соответствующую модель в раскрывающемся списке. Ожидаются ограничения скорости: 30 сообщений в неделю для o1-preview и 50 для o1-mini.
Разработчики, использующие API, также могут начать работу с обеими моделями, используя ограничение в 20 запросов в минуту. В будущем мы планируем увеличить эти лимиты после дополнительного тестирования.
Пользователи ChatGPT Enterprise и Edu смогут получить доступ к моделям на следующей неделе, а в будущем o1-mini станет доступна для всех бесплатных пользователей ChatGPT.
Что дальше
Это только предварительный просмотр возможностей новой серии моделей o1 в ChatGPT и API. В будущем мы планируем добавить функции, такие как загрузка файлов, изображений и расширенные возможности просмотра.
Кроме того, мы продолжим разработку моделей GPT наряду с новой серией OpenAI o1, расширяя их возможности и функционал.
Источник: OpenAI Blog


