Можливості значно розширилися: Meta випустила новий ШІ

Технологічна компанія Meta, яка володіє Facebook та Instagram, представила публіці нову модель власного штучного інтелекту під назвою Llama 3.1 405B. Її творці назвали "наступним поколінням найсучаснішої великої мовної моделі з відкритим кодом".

У повідомленні, опублікованому на сайті ШІ, Meta стверджує, що розробка їхніх спеціалістів є найбільшою та найпотужнішою базовою моделлю у світі серед доступних для всіх користувачів. Творці заявляють, що Llama 3.1 405B може конкурувати з OpenAI та Anthropic у загальних знаннях, математичних навичках і перекладі з однієї мови на іншу. Індекс в її назві вказує на те, що модель має 405 мільярдів параметрів.

За словами керівників Meta, в результаті навчання на найшвидших чипах з доступних на ринку, Llama 3.1 405B змогла обійти конкурентів за результатами 150 тестів. Розробники інших популярних штучних інтелектів зараз не розголошують ключові параметри своїх моделей, але відомо, що GPT-4 від OpenAI має має близько 1,5 трильйона параметрів. Разом з випуском Llama 3.1 405B, Meta також представила оновлені версії інших моделей Llama, які містять 70 мільярдів і 8 мільярдів параметрів, відповідно.

У компанії Meta заявили, що хочуть за допомогою Llama 3.1 надати кожному можливість максимально ефективно використовувати можливості моделі 405B. Серед наданих користувачам функцій:

вивід у режимі реального часу та пакетний вивід;
контрольоване тонке налаштування;
оцінка вашої моделі для конкретного застосування;
постійне попереднє навчання;
пошуково-доповнена генерація (RAG);
виклик функції;
генерація синтетичних даних.

Всі ці розширені можливості стали доступними користувачам відразу. Розробники також можуть вивчити розширені робочі процеси, такі як просте використання синтетичних даних, дотримуватися готових інструкцій з дистиляції моделей і забезпечити безперебійну RAG за допомогою рішень від партнерів, включаючи AWS, NVIDIA і Databricks. Крім того, Groq оптимізував висновок з малою затримкою для хмарних розгортань, а Dell досягла аналогічної оптимізації для локальних систем.

Серед вдосконалень Llama 3.1 405B – розширені можливості логічного висновку, ширша багатомовна підтримка та значне збільшення довжини контексту до 128K маркерів. У компанії Meta заявили, що представлена модель буде використовуватися в Meta AI – чатботі компанії, який працює на різних платформах, включно з Facebook, Messenger, Instagram і WhatsApp, а також на смартокулярах.

У своєму блозі про представлений ШІ розповів і голова компанії Meta Марк Цукерберг. Він наголосив на тому, що штучний інтелект має залишатись доступним для всіх охочих як інструмент з відкритим кодом. Однак у компанії не розповіли детальніше про доступність та розгортання моделі. Наразі Llama 3.1 постачається через сервіс Meta AI. Для її використання потрібно авторизуватися за допомогою Facebook або Instagram. В Україні сервіс поки що недоступний.

Раніше OBOZ.UA розповідав, як отримати найбільш компетентні поради від ChatGPT.

Підписуйтесь на канали OBOZ.UA в Telegram і Viber, щоб бути в курсі останніх подій.

Поділитися

Поділитися сюжетом

Джерело матеріала

Обозреватель

Оригінальна версія

Згадувані персони

Марк Цукерберг

Бізнесмен

1 згадка

Атака на Куп’янськ: начальник Генштабу прокоментував ситуацію в місті