Представляем OpenAI o1: Новая серия моделей для решения сложных задач

Open_AI_o1

Обновление от 17 сентября 2024 года: теперь ограничения по скорости составляют 50 запросов в неделю для o1-preview и 50 запросов в день для o1-mini.

Мы разработали новую серию моделей искусственного интеллекта OpenAI o1, которые тратят больше времени на размышления перед тем, как давать ответы. Эти модели предназначены для решения более сложных задач в таких областях, как естественные науки, программирование и математика.

Сегодня мы представляем o1-preview, первую модель из этой серии, доступную в ChatGPT и через API. Это предварительная версия, и мы планируем регулярно выпускать обновления и улучшения. Наряду с выпуском o1-preview мы также включаем предварительные оценки следующей модели, которая уже находится в разработке.

Мы обучили модели o1 тратить больше времени на анализ сложных задач перед тем, как дать ответ, что напоминает процесс человеческого мышления. Эти модели учатся совершенствовать свои стратегии рассуждений, тестировать различные подходы и признавать ошибки.

В тестах новая модель o1-preview показывает результаты на уровне студентов PhD по физике, химии и биологии. Кроме того, она превосходит их в решении математических задач и программировании. Например, на квалификационном экзамене для Международной математической олимпиады (IMO) модель GPT-4o решила 13% задач, тогда как модель o1 достигла впечатляющих 83%. В соревнованиях по программированию Codeforces модель o1 попала в 89-й процентиль. Подробности можно найти в нашем техническом исследовании.

Хотя эта модель еще не поддерживает такие функции, как поиск информации в Интернете или загрузка файлов и изображений, она представляет собой значительный шаг вперед в области сложных рассуждений и интеллектуального анализа.

Прорыв в безопасности

Мы также разработали новые подходы к безопасности, используя способность моделей o1 рассуждать о правилах. Благодаря этому они могут более точно следовать установленным нормам и предотвращать возможные обходы правил.

Один из ключевых тестов на взлом показал, что GPT-4o набрала 22 балла из 100, тогда как o1-preview набрала 84 балла, что подтверждает её превосходство в вопросах безопасности. Эти результаты и дополнительные данные можно найти в нашей системной карточке и исследовательских постах.

Чтобы усилить меры безопасности, мы также наладили тесное сотрудничество с институтами безопасности ИИ в США и Великобритании. Мы предоставляем ранний доступ к исследовательским версиям моделей, чтобы способствовать совместной разработке и тестированию.

Для кого это

Модели серии o1 будут полезны для пользователей, решающих сложные задачи в областях, требующих глубокого анализа, таких как естественные науки, программирование и математика. Например, исследователи могут использовать o1 для аннотирования данных о клетках, физики — для генерации сложных формул в квантовой оптике, а разработчики — для создания и выполнения многоступенчатых рабочих процессов.

OpenAI o1-mini

Наряду с o1-preview, мы также выпускаем более компактную версию — o1-mini, которая быстрее и дешевле. Эта модель особенно эффективна для задач программирования, предлагая разработчикам мощное решение с экономией до 80% по сравнению с o1-preview. Хотя o1-mini менее мощная, она идеально подходит для случаев, когда требуется логическое мышление, но не нужен глубокий анализ или обширные знания.

Как начать использование OpenAI o1

С сегодняшнего дня пользователи ChatGPT Plus и Team могут получить доступ к моделям o1-preview и o1-mini в ChatGPT, выбрав соответствующую модель в раскрывающемся списке. Ожидаются ограничения скорости: 30 сообщений в неделю для o1-preview и 50 для o1-mini.

Разработчики, использующие API, также могут начать работу с обеими моделями, используя ограничение в 20 запросов в минуту. В будущем мы планируем увеличить эти лимиты после дополнительного тестирования.

Пользователи ChatGPT Enterprise и Edu смогут получить доступ к моделям на следующей неделе, а в будущем o1-mini станет доступна для всех бесплатных пользователей ChatGPT.

Что дальше

Это только предварительный просмотр возможностей новой серии моделей o1 в ChatGPT и API. В будущем мы планируем добавить функции, такие как загрузка файлов, изображений и расширенные возможности просмотра.

Кроме того, мы продолжим разработку моделей GPT наряду с новой серией OpenAI o1, расширяя их возможности и функционал.

Источник: OpenAI Blog

Прокрутить вверх