Google DeepMind возвращается в гонку ИИ с открытым исходным кодом с новой моделью Gemma

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше


Сегодня Google DeepMind представила Gemma — свои новые модели 2B и 7B с открытым исходным кодом, созданные на основе тех же исследований и технологий, которые использовались при создании недавно анонсированных компанией моделей Gemini.

Модели Gemma будут выпущены с предварительно обученными и настроенными на инструкции вариантами, говорится в сообщении Google DeepMind в блоге. Веса моделей будут выпущены с разрешительной коммерческой лицензией, а также с новым инструментом Responsible Generative AI.

Google также предоставляет наборы инструментов для вывода и контролируемой тонкой настройки (SFT) во всех основных фреймворках: JAX, PyTorch и TensorFlow через собственный Keras 3.0. Существуют готовые к использованию блокноты Colab и Kaggle, а Gemma интегрирована с Hugging Face, MaxText и NVIDIA NeMo. Предварительно обученные и настроенные по инструкциям модели Gemma могут работать на ноутбуке, рабочей станции или в облаке Google с развертыванием на Vertex AI и Google Kubernetes Engine.

Компания Nvidia также объявила сегодня, что в сотрудничестве с Google она запустила оптимизацию на всех платформах NVIDIA AI, включая локальные ПК RTX AI, для повышения производительности Gemma.

Google теперь предлагает как API, так и открытые модели для рабочего процесса

Вице-президент и генеральный менеджер разработчика X и глава отдела по связям с разработчиками в Google Жанин Бэнкс рассказала VentureBeat на пресс-конференции, что модели Gemma «ощущаются как продолжение» истории Google по предоставлению открытого исходного кода для разработки ИИ, от таких инструментов, как TensorFlow и Jax, до других моделей и систем ИИ, таких как PaLM2 и AlphaFold, вплоть до Gemini.

Она также сказала, что благодаря отзывам, полученным в ходе разработки моделей Gemini, Google DeepMind «получила ключевое понимание того, что в некоторых случаях разработчики будут использовать как открытые модели, так и API взаимодополняющим образом в своем рабочем процессе в зависимости от этапа рабочего процесса, на котором они находятся».

Она объяснила, что по мере того, как разработчики экспериментируют и создают ранние прототипы, может быть легко начать с API для тестирования подсказок, а затем перейти к настройке и тонкой настройке с открытыми моделями. «Мы посчитали, что было бы идеально, если бы Google мог быть единственным поставщиком как API, так и открытых моделей, чтобы предложить сообществу самый широкий набор возможностей для работы».

Google DeepMind выпустит полный набор бенчмарков

Трис Варкентин, директор по управлению продуктами Google DeepMind, сообщил VentureBeat на пресс-конференции, что компания выпустит полный набор тестов для оценки Gemma по сравнению с другими моделями, которые любой желающий сможет сразу же увидеть в таблицах лидеров OpenLLM.

«Мы сотрудничаем и с Nvidia, и с Hugging Face, поэтому практически любой бенчмарк, который находится в публичной сфере, сравнивался с этими моделями», — сказал он. «Это полностью прозрачный и открытый для сообщества подход, так что это то, чем мы на самом деле очень гордимся, потому что, если посмотреть на цифры, я думаю, что мы проделали чертовски хорошую работу».

Джемму назвали «ответственной по своей сути»

Варкентин также подчеркнул безопасность Джеммы: «Все они прошли тщательную оценку, чтобы стать самыми безопасными моделями, которые мы могли бы выпустить на рынок в этих размерах, вместе с предварительной подготовкой и оценкой», — сказал он.

В сообщении блога Google DeepMind говорится, что «Gemma разработана с учетом наших принципов искусственного интеллекта. Чтобы сделать предварительно обученные модели Gemma безопасными и надежными, мы использовали автоматизированные методы для фильтрации определенной личной информации и других конфиденциальных данных из обучающих наборов. Кроме того, мы использовали обширную тонкую настройку и обучение с подкреплением на основе обратной связи с человеком (RLHF), чтобы согласовать наши модели, настроенные на инструкции, с ответственным поведением. Чтобы понять и снизить профиль риска для моделей Gemma, мы провели надежные оценки, включая ручное объединение в команду, автоматизированное состязательное тестирование и оценку возможностей модели для опасных действий. Эти оценки изложены в нашей Карточке модели.*»

Помимо безопасности, Варкентин подчеркнул роль открытой экосистемы в развитии ответственного ИИ.

«Мы считаем, что это действительно важно — нам нужны разнообразные точки зрения от разработчиков и исследователей по всему миру, чтобы получить правильную обратную связь и построить еще более совершенные системы безопасности», — сказал он. «Поэтому часть пути открытой модели — убедиться, что мы интегрируем (эти точки зрения) и что обратная связь, эта коммуникация с сообществом являются важнейшей частью того, как мы видим ценность этого проекта».