Компанія Google почала розгортати приватний доступ до своє нової моделі штучного інтелекту генерування відео Veo, повідомило видання Engadget.
Відсьогодні, 5 грудня, клієнти пакету Vertex AI Google Cloud можуть почати використовувати Veo для створення відео на основі текстових підказок та зображень. З наступного тижня для користувачів пакета доступним стане і генератор зображень Imagen 3.
Veo від Google стає першою гіпермасштабною хмарною моделлю, що дозволяє генерувати відео на основі текстових і візуальних підказок, у той час як доступ до Sora від компанії OpenAI ще очікується.
Модель Veo створює кадри з роздільною здатністю 1080p, здатні тривати більше хвилини. Вона також може використовувати зображення, створені людьми або ШІ, як відправну точку для відео.
Щоправда, Veo, як і інші ШІ-моделі ШІ, зіштовхується з труднощами, коли йдеться про причинно-наслідкові зв’язки. Наприклад, у ролику про смаження зефіру на багатті ласощі не жовтіють і не обвуглюються.
Відео, згенероване ШІ-моделлю Veo
Оновлена версія генератора Imagen 3 для створення зображення за текстовим описом перевершує попередні за рівнем деталізації, освітлення, та створює значно менше так званих «артефактів». Зображення виглядатимуть більш реалістичними. Проте й тут є місце для вдосконалення: в одному з прикладів, створених за допомогою Imagen 3, світлини групи друзів на багажнику автомобіля не відповідають заданому опису «фотографії зі спалахом».
Фото, згенеровані Imagen 3
Фото: Google
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.