MamayLM-Gemma-2-9B-IT-v0.1: перша справжня LLM для української мови

З появою MamayLM-Gemma-2-9B-IT-v0.1 українська мова отримала потужний інструмент у світі штучного інтелекту — модель, створену з повагою до її лексики, граматики й семантичних тонкощів. Це перший масштабний приклад, коли інструкційно-навчена LLM адаптована саме під україномовного користувача. Вона не просто здатна відповідати українською — вона розуміє контекст, логіку запитів і формує глибокі, доречні відповіді. І що особливо важливо — усе це доступне локально, без потреби у хмарних підключеннях чи зовнішніх API.

Локальна модель, глобальне значення

Розроблена командою з INSAIT (Інститут комп’ютерних наук, штучного інтелекту та технологій у Софії), MamayLM стала результатом кропіткої роботи над адаптацією інфраструктури великих мовних моделей до українського контексту.

Її навчали на корпусі з 75 мільярдів токенів, який охоплює тексти українською та англійською мовами — від відкритих енциклопедичних ресурсів до спеціалізованих локальних джерел. Окрему увагу розробники приділили instruction-tuning — додатковому етапу навчання, що робить модель здатною відповідати на складні запити у формі діалогу, з урахуванням намірів, контексту та логіки користувача.

Що відрізняє MamayLM

У порівнянні з більшістю LLM, які адаптовані під універсальне використання, MamayLM сконцентрована на якості саме україномовного спілкування. Модель демонструє виняткову здатність вести діалог, адаптуватися до запитів і формулювати змістовні відповіді на інструкційні питання.

Серед інших її особливостей:

  • Повна підтримка української мови без компромісів

  • Працює локально через GGUF-формат, що гарантує приватність

  • Показує вищі результати на українських бенчмарках, ніж LLaMA 3 (70B) та Qwen 72B

Для чого вона потрібна

MamayLM можна використовувати у всьому спектрі задач — від побудови україномовного асистента, до обробки запитів у держсекторі, освіті, юриспруденції або журналістиці.

У прикладному плані модель вже доступна:

  • Через Hugging Face Transformers API

  • У форматі GGUF для локального запуску через llama.cpp, LM Studio або KoboldCpp

Показники і реальні результати

У внутрішньому тестуванні MamayLM показала високу точність у відповідях на задачі типу MMLU, ARC, та адаптованих до української версії ЗНО.

Особливо показовим є те, що вона стабільно формулює природні україномовні відповіді там, де інші моделі з труднощами дають перекладені англомовні шаблони.

Погляд у майбутнє

MamayLM — це не лише технічне досягнення. Це важливий культурно-лінгвістичний крок, що відкриває перед українською мовою нові горизонти в епоху штучного інтелекту. Модель уже доступна публічно для дослідників, розробників і всіх, хто хоче будувати з її допомогою нове покоління україномовних сервісів.

Спробувати MamayLM: https://huggingface.co/INSAIT-Institute/MamayLM-Gemma-2-9B-IT-v0.1

Якщо вам цікава тема штучного інтелекту, автоматизації та актуальних AI-новинок — приєднуйтесь до Telegram-каналу AI.Inside, де регулярно свіжі інсайти зі світу AI.

Список джерел
  1. INSAIT-Institute
Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!
AI.Inside
AI.Inside@AI.Inside

AI.Inside🤖Hack|Create|Run🧠

19Прочитань
0Автори
0Читачі
На Друкарні з 14 квітня

Більше від автора

  • AvatarFX: Як Character.AI дає голос і міміку вашим фотографіям

    MENLO PARK, КАЛІФОРНІЯ — У технологічному осередку Кремнієвої долини, де стартапи змагаються за місце під сонцем майбутнього, Character.AI веде свою гру, перетворюючи світлі ідеї на революційні інструменти. двоє колишніх інженерів Google знову кидають виклик уявленням.

    Теми цього довгочиту:

    Ai

Вам також сподобається

Коментарі (0)

Підтримайте автора першим.
Напишіть коментар!

Вам також сподобається