Google приостанавливает возможность Gemini генерировать людей после многочисленных «пробужденных» неточностей

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше


После разгоревшегося ранее на этой неделе скандала, когда пользователи обнаружили, что новый чат-бот Google Gemini на основе искусственного интеллекта генерирует не соответствующие истории и неточные изображения (например, изображая отцов-основателей США чернокожими, а основателей Google — азиатами), компания сегодня объявила о том, что временно приостанавливает возможность ИИ полностью генерировать изображения людей.

Ранее Google заявляла, что работает над устранением проблем, поднятых пользователями, и планирует восстановить функцию позднее.

Что пошло не так с Близнецами?

Согласно скриншотам взаимодействий, которыми поделились технические руководители, авторы и обычные пользователи Gemini, чат-бот генерирует изображения цветных людей и людей разных национальностей даже в тех случаях, когда исторический контекст не применим к ним, например, создавая чернокожих католических пап (никогда такого не было), делая викингов темными (у большинства она не была) и заставляя солдат нацистской Германии выглядеть азиатами (большинство из них таковыми не были).

Модели искусственного интеллекта, генерирующие изображения, часто настраиваются таким образом, чтобы избегать предвзятости и фокусироваться на разнообразии, но стандартное создание Gemini неточно широкого разнообразия заставило многих обсуждать подход Google к предвзятости, а многих других — высмеивать, критиковать и троллить компанию.

В ответ на поток сообщений о проблеме старший директор по продуктам Google Джек Кравчик подтвердил наличие проблемы и сообщил, что компания работает над ее устранением.

Он сказал, что компания настроит соответствующую модель с учетом исторических нюансов, но продолжит уделять внимание разнообразию открытых подсказок, например, о человеке, выгуливающем собаку, чтобы отразить глобальную пользовательскую базу.

«В рамках наших принципов ИИ… мы разрабатываем наши возможности генерации изображений с учетом нашей глобальной пользовательской базы, и мы серьезно относимся к репрезентативности и предвзятости», — написал Кравчик в своем посте.

Тем не менее, эта проблема вызвала шквал критики со стороны пользователей и видных лидеров в сфере технологий, включая венчурных капиталистов. Марк Андрессен и Пол Грэми поднял более широкий спор о том, можно ли доверять чат-ботам ИИ, таким как Gemini, быть правдивыми или они были чрезмерно строги во имя современных стандартов разнообразия и равенства. Проблема даже вышла за рамки технологической отрасли, попав на первую страницу местной газеты Нью-Йорка, Нью-Йорк Постсегодня:

Не та «эра Близнецов», которую ожидал Google

Хотя Google продолжает работать над устранением проблемы, важно отметить, что это не первый случай, когда Gemini попадает в заголовки новостей по совершенно неправильным причинам.

Компания представила семейство моделей Gemini после большой шумихи в декабре 2023 года и с тех пор находится на пути к тому, чтобы вывести «эпоху Gemini» на передний план и в центр внимания. Google продвигала Gemini как ведущую модель ИИ, сопоставимую с GPT-4 от OpenAI (на которой работает ChatGPT), а в некоторых случаях и превосходящую ее.

Однако вскоре после запуска его раскритиковали за выпуск постановочного видеоролика, в котором были ложно преувеличены возможности Gemini как интеллектуального цифрового помощника, способного вести сложные беседы и помогать в решении повседневных задач. Обзор независимых исследователей показал, что Gemini на самом деле хуже, чем более старая версия LLM от OpenAI, GPT-3.5.

Ранее в этом месяце компания провела ребрендинг чат-бота Bard на Gemini, запустив расширенную версию для платных подписчиков, и даже провела ребрендинг и перезапуск Duet AI на Gemini for Workspace.

Новые версии Gemini, 1.5 и Advanced, обещали быть гораздо более мощными. Анекдотические примеры пользователей указывают, что последняя версия чат-бота действительно обладает впечатляющими возможностями, особенно в области анализа видео и сводки, а также анализ многочисленных документов используя его чрезвычайно длинный контекст. Однако эти возможности могут быть затенены в текущем и продолжающемся споре.

Кравчик написал, что выявление проблем, таких как неточная генерация изображений, помогает в процессе выравнивания — итерации обратной связи. Однако, если проблемы будут возникать регулярно, гиганту под руководством Сундар Пичаи будет сложно доказать, что Gemini превосходит другие предложения ИИ-поколения.