Компания Google представила обновление своей платформы искусственного интеллекта — Gemini 3 Deep Think. Этот инструмент предназначен для решения сложных научных и инженерных задач, где данные могут быть неполными или неоднозначными. В этой статье мы рассмотрим ключевые особенности новой версии, её возможности и текущие ограничения. Вы узнаете, как Gemini 3 Deep Think применяется в реальных исследованиях и почему он пока не может полностью заменить человеческий интеллект.
Основные возможности Gemini 3 Deep Think
Решение сложных задач
Gemini 3 Deep Think разработан для работы с задачами, которые не имеют чётких границ или единственного правильного решения. Платформа использует рассуждающий искусственный интеллект, что позволяет ей справляться с неструктурированными данными.
Интеграция с приложением Gemini
Новый режим доступен в приложении Gemini, но только для подписчиков Google AI Ultra. Также компания впервые открыла доступ к сервису через API, что делает его доступным для инженеров и исследователей.
Результаты тестирования
- Humanity’s Last Exam: 48,4 % без сторонних инструментов.
- ARC-AGI-2: 84,6 %, что является рекордным результатом.
- Codeforces: Рейтинг Эло составил 3455.
- Международная математическая олимпиада: Уровень золотой медали.
Aletheia: ИИ-агент на основе Gemini 3 Deep Think
Проверка гипотез
Aletheia включает инструмент для проверки гипотез, изложенных естественным языком. Он способен выявлять недостатки в предлагаемых решениях и корректировать их в итеративном процессе.
Работа с открытыми задачами
Aletheia проанализировал 700 нерешённых математических задач Эрдёша и предложил решения для 13 из них. Однако только 4 задачи были решены впервые, а большинство решений оказались ошибочными.
Ограничения и перспективы
«ИИ демонстрирует склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить», — отмечают разработчики. Текущий уровень ошибок остаётся высоким, что делает замену человеческого интеллекта пока невозможной. Однако платформа продолжает развиваться, и её потенциал в научных исследованиях огромен.
- Фундаментальные ошибки: 68,5 % решений имели существенные недостатки.
- Неправильная интерпретация задач: 31,5 % решений были основаны на неверном понимании условий.
Несмотря на свои ограничения, Gemini 3 Deep Think представляет собой значительный шаг вперёд в области искусственного интеллекта для науки. Его дальнейшее развитие может привести к революционным открытиям в различных областях знаний.