/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2Fbaa679418f975686531c020c611201d3.jpg)
Google випускає нову модель Gemini, яка може працювати на роботах локально
Google DeepMind випустила нову мовну модель під назвою Gemini Robotics On-Device, яка може виконувати завдання локально на роботах без необхідності підключення до Інтернету.
Спираючись на попередню модель компанії Gemini Robotics, випущену в березні , Gemini Robotics On-Device може керувати рухами робота. Розробники можуть контролювати та налаштовувати модель відповідно до різних потреб за допомогою підказок природною мовою.
У бенчмарках Google стверджує, що модель працює на рівні, близькому до хмарної моделі Gemini Robotics. Компанія каже, що вона перевершує інші моделі на пристрої в загальних бенчмарках, хоча й не назвала ці моделі.
У демонстрації компанія продемонструвала, як роботи, що працюють за цією локальною моделлю, виконують такі дії, як розстібання сумок та складання одягу. Google стверджує, що хоча модель була навчена для роботи з роботами ALOHA , пізніше її адаптували для роботи з дворуким роботом Franka FR3 та гуманоїдним роботом Apollo від Apptronik .
Google стверджує, що дворукавний Franka FR3 успішно справлявся зі сценаріями та об'єктами, яких раніше «не бачив», наприклад, зі складанням на промисловому конвеєрі .
Google DeepMind також випускає Gemini Robotics SDK . Компанія заявила, що розробники можуть показати роботам від 50 до 100 демонстрацій завдань, щоб навчити їх виконувати нові завдання, використовуючи ці моделі на фізичному симуляторі MuJoCo.
Інші розробники моделей штучного інтелекту також занурюються в робототехніку. Nvidia створює платформу для створення базових моделей для гуманоїдів; Hugging Face не лише розробляє відкриті моделі та набори даних для робототехніки, але й працює над роботами ; а корейський стартап RLWRLD, що підтримується Mirae Asset, працює над створенням базових моделей для роботів.