Технологічна компанія Meta, яка володіє Facebook та Instagram, представила публіці нову модель власного штучного інтелекту під назвою Llama 3.1 405B. Її творці назвали "наступним поколінням найсучаснішої великої мовної моделі з відкритим кодом".
У повідомленні, опублікованому на сайті ШІ, Meta стверджує, що розробка їхніх спеціалістів є найбільшою та найпотужнішою базовою моделлю у світі серед доступних для всіх користувачів. Творці заявляють, що Llama 3.1 405B може конкурувати з OpenAI та Anthropic у загальних знаннях, математичних навичках і перекладі з однієї мови на іншу. Індекс в її назві вказує на те, що модель має 405 мільярдів параметрів.
За словами керівників Meta, в результаті навчання на найшвидших чипах з доступних на ринку, Llama 3.1 405B змогла обійти конкурентів за результатами 150 тестів. Розробники інших популярних штучних інтелектів зараз не розголошують ключові параметри своїх моделей, але відомо, що GPT-4 від OpenAI має має близько 1,5 трильйона параметрів. Разом з випуском Llama 3.1 405B, Meta також представила оновлені версії інших моделей Llama, які містять 70 мільярдів і 8 мільярдів параметрів, відповідно.
У компанії Meta заявили, що хочуть за допомогою Llama 3.1 надати кожному можливість максимально ефективно використовувати можливості моделі 405B. Серед наданих користувачам функцій:
- вивід у режимі реального часу та пакетний вивід;
- контрольоване тонке налаштування;
- оцінка вашої моделі для конкретного застосування;
- постійне попереднє навчання;
- пошуково-доповнена генерація (RAG);
- виклик функції;
- генерація синтетичних даних.
Всі ці розширені можливості стали доступними користувачам відразу. Розробники також можуть вивчити розширені робочі процеси, такі як просте використання синтетичних даних, дотримуватися готових інструкцій з дистиляції моделей і забезпечити безперебійну RAG за допомогою рішень від партнерів, включаючи AWS, NVIDIA і Databricks. Крім того, Groq оптимізував висновок з малою затримкою для хмарних розгортань, а Dell досягла аналогічної оптимізації для локальних систем.
Серед вдосконалень Llama 3.1 405B – розширені можливості логічного висновку, ширша багатомовна підтримка та значне збільшення довжини контексту до 128K маркерів. У компанії Meta заявили, що представлена модель буде використовуватися в Meta AI – чатботі компанії, який працює на різних платформах, включно з Facebook, Messenger, Instagram і WhatsApp, а також на смартокулярах.
У своєму блозі про представлений ШІ розповів і голова компанії Meta Марк Цукерберг. Він наголосив на тому, що штучний інтелект має залишатись доступним для всіх охочих як інструмент з відкритим кодом. Однак у компанії не розповіли детальніше про доступність та розгортання моделі. Наразі Llama 3.1 постачається через сервіс Meta AI. Для її використання потрібно авторизуватися за допомогою Facebook або Instagram. В Україні сервіс поки що недоступний.
Раніше OBOZ.UA розповідав, як отримати найбільш компетентні поради від ChatGPT.
Підписуйтесь на канали OBOZ.UA в Telegram і Viber, щоб бути в курсі останніх подій.