Компания Google представила обновление своей платформы искусственного интеллекта — Gemini 3 Deep Think. Этот инструмент предназначен для решения сложных научных и инженерных задач, где данные могут быть неполными или неоднозначными. В этой статье мы рассмотрим ключевые особенности новой версии, её возможности и текущие ограничения. Вы узнаете, как Gemini 3 Deep Think применяется в реальных исследованиях и почему он пока не может полностью заменить человеческий интеллект.

Основные возможности Gemini 3 Deep Think

Решение сложных задач

Gemini 3 Deep Think разработан для работы с задачами, которые не имеют чётких границ или единственного правильного решения. Платформа использует рассуждающий искусственный интеллект, что позволяет ей справляться с неструктурированными данными.

Интеграция с приложением Gemini

Новый режим доступен в приложении Gemini, но только для подписчиков Google AI Ultra. Также компания впервые открыла доступ к сервису через API, что делает его доступным для инженеров и исследователей.

Результаты тестирования

  • Humanity’s Last Exam: 48,4 % без сторонних инструментов.
  • ARC-AGI-2: 84,6 %, что является рекордным результатом.
  • Codeforces: Рейтинг Эло составил 3455.
  • Международная математическая олимпиада: Уровень золотой медали.

Aletheia: ИИ-агент на основе Gemini 3 Deep Think

Проверка гипотез

Aletheia включает инструмент для проверки гипотез, изложенных естественным языком. Он способен выявлять недостатки в предлагаемых решениях и корректировать их в итеративном процессе.

Работа с открытыми задачами

Aletheia проанализировал 700 нерешённых математических задач Эрдёша и предложил решения для 13 из них. Однако только 4 задачи были решены впервые, а большинство решений оказались ошибочными.

Ограничения и перспективы

«ИИ демонстрирует склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить», — отмечают разработчики. Текущий уровень ошибок остаётся высоким, что делает замену человеческого интеллекта пока невозможной. Однако платформа продолжает развиваться, и её потенциал в научных исследованиях огромен.

  • Фундаментальные ошибки: 68,5 % решений имели существенные недостатки.
  • Неправильная интерпретация задач: 31,5 % решений были основаны на неверном понимании условий.

Несмотря на свои ограничения, Gemini 3 Deep Think представляет собой значительный шаг вперёд в области искусственного интеллекта для науки. Его дальнейшее развитие может привести к революционным открытиям в различных областях знаний.

Поделиться статьей