OpenAI представила искусственный интеллект для создания видео по текстовому описанию
Компания OpenAI, которая разработала знаменитый чат-бот ChatGPT, выпустила новый инструмент под управлением искусственного интеллекта. Он получил название Sora и предназначен для генерации видео на основании текстового запроса.
Как рассказали разработчики, Sora создает видео длиной до минуты. Она также способна генерировать видео из статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их. И, судя по примерам работ, которые представила компания, выходит у нее достаточно правдоподобно.
«Sora способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель понимает не только то, что пользователь запросил в командной строке, но и то, как эти вещи существуют в физическом мире», - говорится в пресс-релизе компании.
Разработчики признают, что у модели есть и слабости. Так, у нее могут возникнуть проблемы с точным моделированием физики и пониманием сложной сцены. Она также может не до конца понимать причинно-следственные связи. Например, человек может откусить от печенья, но на том не останется следов укуса. Модель также может путать, например, лево и право.
Пока инструмент не доступен широкому кругу пользователей. OpenAI открыла его для специалистов, которые должны выявить его слабые места. Кроме того, Sora доступна некоторым художникам, дизайнерам и режиссерам. Это сделано для того, чтобы собрать отзывы об ее работе.
Ранее компания Meta, являющаяся владельцем социальных сетей Facebook, Instagram и Threads, заявила, что на указанных платформах планирует обозначать все изображения созданные с помощью искусственного интеллекта.