Google тихо открывает доступ к Imagen 3 всем пользователям США |

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше

Компания Google без лишнего шума сделала свою новейшую модель искусственного интеллекта для преобразования текста в изображение Imagen 3 доступной для всех пользователей в США через свою платформу ImageFX и опубликовала исследовательскую работу, подробно описывающую эту технологию.

Этот двойной релиз знаменует собой существенное расширение доступа к инструменту искусственного интеллекта, который был первоначально анонсирован в мае на конференции Google I/O и стал доступен только избранным пользователям Vertex AI в июне.

Google анонсирует Imagen 3

обсудить: https://t.co/w2pIqzlKW1

Мы представляем Imagen 3, модель скрытой диффузии, которая генерирует высококачественные изображения из текстовых подсказок. Мы описываем наши оценки качества и ответственности. Imagen 3 предпочтительнее других современных (SOTA)… pic.twitter.com/sjn5QRKtPW
— АК (@_akhaliq) 14 августа 2024 г.

Исследовательская группа компании заявила в своей статье, опубликованной на arxiv.org: «Мы представляем Imagen 3, модель скрытой диффузии, которая генерирует высококачественные изображения из текстовых подсказок. Imagen 3 является предпочтительным по сравнению с другими современными моделями на момент оценки».

Это событие произошло на той же неделе, когда xAI запустила Grok-2 — конкурирующую систему искусственного интеллекта с заметно меньшими ограничениями на генерацию изображений, что подчеркивает различные подходы к этике ИИ и модерации контента в технологической отрасли.

Imagen 3: последний залп Google в гонке вооружений ИИ

Выпуск Google Imagen 3 для широкой общественности США представляет собой стратегический шаг в усиливающейся гонке вооружений ИИ. Однако реакция была неоднозначной. В то время как некоторые пользователи хвалят его улучшенные возможности распознавания текстур и слов, другие выражают разочарование его строгими фильтрами контента.

Один из пользователей Reddit отметил: «Качество намного выше, с потрясающей текстурой и распознаванием слов, но я думаю, что на данный момент оно хуже, чем Imagen 2 для меня». Он добавил: «Оно довольно хорошее, но я работаю усерднее с более высокими результатами ошибок».

Цензура, реализованная в Imagen 3, стала предметом критики. Многие пользователи сообщают, что, казалось бы, безобидные подсказки блокируются. «Слишком зацензурено, я даже киборга не могу сделать, черт возьми», — прокомментировал другой пользователь Reddit. Другой сказал: «(Оно) отклонило половину моих вводов, а я даже не пытаюсь сделать что-то безумное».

Эти комментарии подчеркивают противоречие между усилиями Google по обеспечению ответственного использования ИИ и желаниями пользователей творческой свободы. Google подчеркнула свою нацеленность на ответственную разработку ИИ, заявив: «Мы использовали обширную фильтрацию и маркировку данных, чтобы минимизировать вредоносный контент в наборах данных и снизить вероятность вредоносных выходных данных».

Grok-2: спорный неограниченный подход xAI

В резком контрасте с этим Grok-2 от xAI, интегрированный в социальную сеть Илона Маска X и доступный через премиум-подписки, предлагает возможности генерации изображений практически без ограничений. Это привело к потоку спорного контента на платформе, включая обработанные изображения публичных лиц и графические изображения, которые другие компании ИИ обычно запрещают.

Расхождения в подходах Google и xAI подчеркивают продолжающиеся дебаты в технологической отрасли о балансе между инновациями и ответственностью в разработке ИИ. Хотя осторожный подход Google направлен на предотвращение злоупотреблений, он привел к разочарованию среди некоторых пользователей, которые чувствуют себя творчески ограниченными. Напротив, неограниченная модель xAI возродила опасения относительно возможности распространения ИИ дезинформации и оскорбительного контента.

Эксперты отрасли внимательно следят за тем, как будут разыгрываться эти контрастные стратегии, особенно по мере приближения президентских выборов в США. Отсутствие ограничений в возможностях генерации изображений Grok-2 уже вызвало удивление, и многие предполагают, что xAI столкнется с растущим давлением в плане внедрения ограничений.

Будущее создания изображений с помощью ИИ: баланс между креативностью и ответственностью

Несмотря на противоречия, некоторые пользователи нашли ценность в более ограниченном инструменте Google. Специалист по маркетингу на Reddit поделился: «Гораздо проще генерировать изображения с помощью чего-то вроде Adobe Firefly, чем копаться в сотнях страниц стоковых сайтов».

По мере того как технология генерации изображений на основе искусственного интеллекта становится все более доступной для общественности, перед отраслью встают важные вопросы о роли модерации контента, балансе между креативностью и ответственностью, а также о потенциальном влиянии этих инструментов на публичный дискурс и целостность информации.

Ближайшие месяцы будут иметь решающее значение как для Google, так и для xAI, поскольку они будут ориентироваться на отзывы пользователей, потенциальный контроль со стороны регулирующих органов и более широкие последствия своего технологического выбора. Успех или неудача их соответствующих подходов может иметь далеко идущие последствия для будущего развития и внедрения инструментов ИИ в технологической отрасли.