OpenAI представляет модель искусственного интеллекта для видео Sora, способную создавать 60-секундные клипы

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше


Компания OpenAI не довольствуется тем, что ее просто называют ChatGPT или даже компанией LLM: сегодня она представила демоверсию Sora, своей новой модели искусственного интеллекта для преобразования текста в видео, а соучредитель и генеральный директор Сэм Альтман написал в X (ранее Twitter), что это был «замечательный момент».

Хотя продукт пока официально не доступен для массового использования из-за того, что Альтман в своем посте назвал «началом red-teaming» или оппозиционным тестированием его защитных функций, недостатков и неправомерного использования, основатель отметил, что он будет доступен «ограниченному числу создателей», а публичное распространение произойдет позднее.

Видео Sora. Кредит: OpenAI

Чрезвычайно конкурентное пространство для видеомоделей ИИ

Sora выходит на рынок с жесткой конкуренцией, поскольку существующие стартапы-конкуренты Runway, Pika и Stability AI предлагают специализированные модели генерации видео на основе ИИ, а такие авторитетные компании, как Google, демонстрируют возможности своей модели Lumiere.

Однако представленные сегодня примеры видеороликов Соры от OpenAI выделяются четкостью разрешения, плавностью движений, точностью отображения анатомии человека и физического мира и, прежде всего, временем выполнения.

Видео Sora. Кредит: OpenAI

В отличие от Runway и Pika, которые предлагают всего 4 секунды генерации за раз с возможностью расширения, Sora от OpenAI сразу предлагает 60-секундную генерацию видео.

Альтман и другие члены руководства OpenAI и Команда Сора включая исследователя Уилла Депью, собирают подсказки от пользователей Twitter/X, которые они сейчас запускают через Sora в качестве своего рода живой краудсорсинговой демонстрации новых возможностей модели, так что зайдите и отправьте им некоторые из них, если вам интересно (я так и сделал).

Видеоролики, демонстрирующие способности Соры в воспроизведении обыденных, но узнаваемых моментов человеческой жизни, например, наблюдение за городом из окна надземного поезда или домашнее видео женщины в постели с кошкой, поражают своей реалистичностью больше, чем фантастические видеоролики.

Видео Sora. Кредит: OpenAI
Видео Sora. Кредит: OpenAI

Также впечатляет и потенциально вызывает тревогу то, что исследователь OpenAI Билл Пиблз, который работает над проектом компании по разработке «искусственного обобщенного интеллекта» (определяемого как ИИ, который лучше большинства людей справляется с большинством экономически значимых задач), отметил, что Sora поможет в поисках AGI, «моделируя все».

Среди арФедеральные агентства США возобновили усилия по регулированию ИИ в частности Учитывая потенциал мошенничества и подделки реальных людей, появление Sora представляется важной вехой не только для OpenAI, но и для всей индустрии технологий и медиа, а также для человечества в целом — хотя пока еще неизвестно, к лучшему или к худшему это приведет.