Connect with us

OpenAI’s $200 ChatGPT Pro: AI, которая думает усерднее (Но вам это нужно?)

Искусственный интеллект

OpenAI’s $200 ChatGPT Pro: AI, которая думает усерднее (Но вам это нужно?)

mm

OpenAI только что представила то, что они называют “самой умной моделью в мире”. Она имеет ежемесячную цену в 200 долларов и обещает думать усерднее, работать дольше и решать более сложные проблемы, чем все, что мы видели раньше. Но в мире, где объявления об AI появляются почти каждую неделю, это заслуживает более близкого внимания.

Новый ChatGPT Pro, работающий на модели o1, не является просто очередным обычным обновлением. Хотя обычный ChatGPT стал швейцарским армейским ножом инструментов AI, это новое предложение больше похоже на специализированное хирургическое оборудование – невероятно мощное, но не для всех.

Что o1 действительно приносит на стол

Давайте разберемся в хайпе и посмотрим, что делает o1 другим. Модель показывает впечатляющие цифры, но что имеет значение, так это где эти улучшения действительно делают разницу.

В реальных тестах o1 показывает улучшения в трех ключевых областях:

  1. Глубокое техническое решение проблем: Модель достигает 50% точности на математических конкурсах AIME 2024 – против 37% в предыдущих версиях. Но что более важно, она поддерживает эту производительность последовательно. Когда тестируется на надежность (получение правильного ответа 4 из 4 раз), o1 про режим значительно превосходит своих предшественников.
  2. Научное рассуждение: На вопросах PhD-уровня по науке o1 демонстрирует 74% успеха, с еще более впечатляющими достижениями в последовательности. Что интересно, так это то, как это переводится в реальные исследовательские приложения – мы видим, как исследователи используют его для разработки сложных биологических экспериментов.
  3. Программирование и технический анализ: Возможно, наиболее показательно, o1 достигает 62% проходного балла на продвинутых задачах программирования, демонстрируя особую силу в сложном, многоступенчатом решении проблем. Однако – и это крайне важно – он на самом деле борется с более простыми, итеративными задачами, требующими обратной связи.

Изображение: OpenAI

Настоящий инновационный подход здесь не только в сырой производительности – это надежность. Когда модель должна думать усерднее о проблеме, она действительно делает это, тратя больше времени на обработку и проверку своих ответов.

Но есть одна загвоздка: все это дополнительное “думание” происходит с компромиссами. Модель заметно медленнее, иногда требуя значительно больше времени для генерации ответов. И для многих повседневных задач эта дополнительная мощность не только не нужна – она может быть даже контрпродуктивной.

Что происходит с такой вычислительной мощностью?

Давайте поговорим о том, что на самом деле происходит, когда вы суперзаряжаете AI с большей вычислительной мощностью. Забудьте маркетинговые разговоры – то, что мы видим с o1, fascinates, потому что оно меняет то, как мы думаем об AI-помощи вообще.

Подумайте об этом как о разнице между быстрым разговором с коллегой и глубокой стратегической сессией. Стандартные модели AI отлично подходят для этих быстрых разговоров – они быстрые, полезные и делают работу. Но o1? Это как иметь старшего эксперта, который тратит время, думает все через и иногда возвращается с идеями, которые вы даже не рассматривали.

Что на самом деле революционно в этом подходе?

  1. Более глубокое “думание”: Когда вы даете модели AI больше времени для “думания”, она не просто думает дольше – она думает по-другому. Она исследует несколько углов и учитывает крайние случаи. Это почему исследователи находят его особенно ценным для разработки экспериментов и генерации гипотез.
  2. Надежность: Вот что-то, о чем никто не говорит: последовательность может быть реальным суперсилой o1. Хотя другие модели могут попасть в сложную проблему один раз и неудачно выполнить следующие три раза, o1 показывает замечательную последовательность в высокоуровневом рассуждении. Для профессионалов, работающих над критическими проблемами, этот фактор надежности является большим делом.

Руководство умного покупателя для инструментов AI

Мы должны иметь честный разговор о том $200 ценнике. Стоит ли это того? Ну, это зависит полностью от того, как вы думаете об AI-помощи в вашем рабочем процессе.

Интересно, что те, кто может получить наибольшую пользу от o1, не обязательно являются теми, кто работает над самыми сложными проблемами – это те, кто работает над проблемами, где быть неправильным чрезвычайно дорого. Если вы не находитесь в конкретных ситуациях, как эта, то дополнительная мощность может фактически просто замедлить вас.

Использование o1 эффективно требует фундаментального сдвига в том, как вы подходите к взаимодействию с AI:

  1. Глубина над скоростью
  • Вместо быстрых туда и обратно обменов, подумайте об этом как о создании хорошо продуманных исследовательских запросов
  • Планируйте более длительное время ответа, но ожидайте более полного анализа
  1. Качество над количеством
  • Сосредоточьтесь на сложных, высокоценных проблемах
  • Используйте стандартные модели для рутинных задач
  1. Стратегическое развертывание
  • Объедините o1 с другими инструментами AI для оптимизированного рабочего процесса
  • Сохраните тяжелую вычислительную мощность для того, где она имеет наибольшее значение

o1 не пытается быть всем для всех. Вместо этого оно заставляет нас думать более стратегически о том, как мы используем инструменты AI. Может быть, настоящая инновация здесь не только в технологии, но и в том, как она заставляет нас переосмыслить наш подход к AI-помощи.

Подумайте о вашем наборе инструментов AI как о профессиональной кухне. Да, вы могли бы использовать промышленное оборудование для всего, но мастер-шефы знают точно, когда использовать фантазийную машину sous vide и когда простая сковорода сделает работу лучше.

Прежде чем прыгнуть в эту $200 подписку, попробуйте это: Ведите журнал ваших взаимодействий с AI в течение недели. Отметьте, какие из них действительно нуждались в более глубоком размышлении, а какие нуждались в быстрых ответах. Это скажет вам больше о том, нужен ли вам o1, чем любой бенчмарк.

Что меня больше всего волнует об o1, так это не то, что оно может сделать сегодня, а то, что оно говорит нам о завтра. Мы наблюдаем за эволюцией AI, переходя от инструмента, который пытается сделать все, к инструменту, который знает точно, что он лучше всего.

Независимо от того, прыгнете ли вы на бандвагон o1 или нет, одно можно сказать точно: То, как мы думаем об AI и используем его, эволюционирует, и это стоит внимания.

Алекс Макфарленд - журналист и писатель в области искусственного интеллекта, исследующий последние разработки в этой области. Он сотрудничал с многочисленными стартапами и изданиями в области искусственного интеллекта во всем мире.