Google запустила Gemini Omni: ИИ для “создания чего угодно из чего угодно“
Google запустила Gemini Omni: ИИ для “создания чего угодно из чего угодно“
Компания Google представила новую мультимодальную модель искусственного интеллекта Gemini Omni, способную создавать видео из любой комбинации входных данных. Первой моделью в новой группе стала Gemini Omni Flash, которую уже начали интегрировать в приложение Gemini, сервис Google Flow и YouTube Shorts.
Как заявили в Google, Gemini Omni может "создавать что угодно из чего угодно", в частности сочетает возможности рассуждения ИИ Gemini со способностью генерировать и редактировать контент на основе текста, изображений, аудио и видео. В компании отметили, что модель способна менять отдельные объекты, среду, стиль или движение без потери контекста исходного ролика.
Gemini Omni также получила улучшенное понимание физических процессов. В компании заявили, что система лучше работает с моделированием гравитации, кинетической энергии и гидродинамики, что позволяет создавать более реалистичные сцены.
Отдельно Google акцентирует на способности Omni сочетать творчество со знаниями Gemini в сфере науки, истории и культуры. Модель может генерировать сложные объяснительные видео, в частности научные визуализации или образовательные ролики, на основе коротких текстовых запросов.
Система поддерживает комбинирование различных типов контента в одном проекте. Пользователи могут загружать изображения, видео, текстовые описания или аудиофайлы, а Omni будет создавать единый видеоклип с синхронизированными эффектами и стилистикой.
В Google также представили функцию Avatars, которая позволяет создавать цифрового аватара с собственным голосом и внешностью. Компания отмечает, что сейчас продолжает тестирование функций изменения голоса и языка для безопасного использования технологии.
Все видео, созданные через Gemini Omni, автоматически будут получать цифровой водяной знак SynthID. В Google заявили, что контент можно будет проверить через Gemini, Chrome и поиск Google.
Gemini Omni Flash уже начали разворачивать для подписчиков Google AI Plus, Pro и Ultra по всему миру. Также модель станет доступной бесплатно в YouTube Shorts и приложении YouTube Create. В ближайшие недели Google планирует открыть доступ к Omni через API для разработчиков и корпоративных клиентов.
В то же время Google представила масштабное обновление Поиска (Search) с новыми функциями искусственного интеллекта и агентскими возможностями. Отныне режим AI Mode будет работать на базе модели Gemini 3.5 Flash, которая станет моделью по умолчанию для пользователей во всем мире.