Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше
Сегодня компания Google представила Gemini 1.5 — новейшую версию своей системы разговорного искусственного интеллекта, продемонстрировавшую значительные достижения в эффективности, производительности и возможностях развернутого мышления.
Новая система, подробно описанная в сообщении в блоге руководителя Google AI Демиса Хассабиса, включает в себя значительные улучшения архитектуры, которые позволяют ее базовой модели Gemini 1.5 Pro работать наравне с крупнейшей моделью компании Gemini 1.0 Ultra, используя при этом меньше вычислительных ресурсов. Модель Gemini 1.0 Ultra была представлена на прошлой неделе.
Однако самый большой скачок произошел в форме экспериментального контекстного окна на миллион токенов, которое, по словам Google, представляет собой «прорыв в понимании длинного контекста». Стандартная модель Gemini анализирует подсказки в контексте из 128 000 токенов. С обновлением на миллион токенов Gemini 1.5 может обрабатывать значительно больший объем непрерывной информации перед генерацией своего ответа.
Контекст из миллиона токенов допускает длинные рассуждения
Генеральный директор Google Сундар Пичаи в своем предисловии к объявлению привел примеры расширенных возможностей Gemini 1.5 в плане рассуждений, заявив, что теперь система может обобщить всю стенограмму миссии «Аполлон-11» или полностью проанализировать немой 44-минутный фильм Бастера Китона.
Расширенный контекст позволяет Gemini 1.5 «бесшовно анализировать, классифицировать и суммировать большие объемы контента в заданной подсказке», — написал Хассабис. Он сказал, что первые результаты показывают, что Gemini 1.5 сохраняет производительность, даже когда контекстное окно увеличивается до миллионов.
Доступность для общественности пока неизвестна
Пока неясно, когда и будет ли вообще доступна версия на миллион токенов. На данный момент Google предлагает ограниченную предварительную версию разработчикам и корпоративным пользователям через свою платформу Vertex AI.
Релиз состоялся всего через неделю после того, как Google переименовала свою систему разговорного ИИ с Bard в Gemini и запустила платный уровень Gemini Advanced на базе модели Ultra 1.0. Gemini позиционируется как конкурент популярной системе ChatGPT Plus от OpenAI.
Хассабис заявил, что повышение эффективности в Gemini 1.5 поможет командам Google «итерировать, обучать и выпускать более продвинутые версии Gemini быстрее, чем когда-либо прежде».
Пичаи отметил, что Google сосредоточена на ответственной разработке Gemini в соответствии со своими принципами ИИ. Компания заявила, что Gemini 1.5 прошел обширное тестирование этики и безопасности, сосредоточенное на таких областях, как безопасность контента и репрезентативный вред.
Темпы развития разговорного ИИ резко ускорились с момента запуска ChatGPT в конце прошлого года. Эксперты говорят, что снижение затрат на обучение и инновации, такие как архитектура Google Sparsely-Gated Mixture-of-Experts, позволяют разрабатывать новые итерации гораздо быстрее, чем предыдущие системы ИИ.
С Gemini 1.5 Google дает понять, что намерен сохранить лидерские позиции в гонке ИИ. Главный вопрос теперь в том, сколько времени потребуется, чтобы эти мощные способности долгосрочного контекстного рассуждения нашли свое место в потребительских продуктах Google.