/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2Ffec206d4ac1bab8a6d9659c574c5b0c6.jpg)
ИИ научился распознавать данные как человек, — исследование
Китайские исследователи утверждают, что современные модели ИИ уже способны распознавать и сортировать различные категории информации подобно человеку.
По словам ученых из Китайской академии наук и Южно-Китайского технологического университета в Гуанчжоу, некоторые модели ИИ копируют ключевые функции человеческого мозга при выполнении задач по сортировке информации. Ученые стремились выяснить, могут ли большие языковые модели, такие как ChatGPT или Gemini, понимать и обрабатывать информацию о различных объектах подобно людям.
Для этого ученые дали моделям ИИ ChatGPT-3.5 и Gemini Pro Vision задание, убрать из ряда текстовых и визуальных объектов лишние. Для этого было собрано 4,7 млн ответов относительно 1 тыс. 854 различных объектов, среди которых, собаки, стулья, яблоки, автомобили, и так далее.
По результатам исследования ученые установили, что из созданных ИИ моделей, 66 были созданы на основе того, как это делают люди. Эти модели включали в себя довольно сложные атрибуты, такие как: текстура, эмоциональная значимость и доступность для детей.
Исследователи выяснили, что мультимодальные модели, способные сочетать текст и изображения, еще больше копируют человеческое мышление. Кроме того, команда обнаружила, что данные сканирования мозга выявили совпадение между тем, как ИИ и человеческий мозг реагируют на объекты.
По словам китайских ученых, результаты их исследования свидетельствуют, что ИИ действительно способны к приближенному к человеческому пониманию, а не просто имитации ответов. Будущие модели ИИ могут получить более интуитивные, совместимые с человеческими рассуждения, что необходимо для робототехники, образования и сотрудничества человека и систем на базе искусственного интеллекта.
Однако большие языковые модели, все же, не понимают объекты так же как люди на эмоциональном или эмпирическом уровне. Модели ИИ работают, распознавая шаблоны в тексте или визуальном контенте, однако, в отличие от людей, это базируется не на жизненном опыте и сенсорно-моторном взаимодействии. Большие языковые модели больше похожи на зеркало, отражающее миллионы источников текстовой и визуальной информации для пользователя на основе освоенных шаблонов.
Результаты исследования опубликованы в журнале Nature
Источник: Interesting Engineering