З появою MamayLM-Gemma-2-9B-IT-v0.1 українська мова отримала потужний інструмент у світі штучного інтелекту — модель, створену з повагою до її лексики, граматики й семантичних тонкощів. Це перший масштабний приклад, коли інструкційно-навчена LLM адаптована саме під україномовного користувача. Вона не просто здатна відповідати українською — вона розуміє контекст, логіку запитів і формує глибокі, доречні відповіді. І що особливо важливо — усе це доступне локально, без потреби у хмарних підключеннях чи зовнішніх API.
Локальна модель, глобальне значення
Розроблена командою з INSAIT (Інститут комп’ютерних наук, штучного інтелекту та технологій у Софії), MamayLM стала результатом кропіткої роботи над адаптацією інфраструктури великих мовних моделей до українського контексту.
Її навчали на корпусі з 75 мільярдів токенів, який охоплює тексти українською та англійською мовами — від відкритих енциклопедичних ресурсів до спеціалізованих локальних джерел. Окрему увагу розробники приділили instruction-tuning — додатковому етапу навчання, що робить модель здатною відповідати на складні запити у формі діалогу, з урахуванням намірів, контексту та логіки користувача.
Що відрізняє MamayLM
У порівнянні з більшістю LLM, які адаптовані під універсальне використання, MamayLM сконцентрована на якості саме україномовного спілкування. Модель демонструє виняткову здатність вести діалог, адаптуватися до запитів і формулювати змістовні відповіді на інструкційні питання.
Серед інших її особливостей:
Повна підтримка української мови без компромісів
Працює локально через GGUF-формат, що гарантує приватність
Показує вищі результати на українських бенчмарках, ніж LLaMA 3 (70B) та Qwen 72B
Для чого вона потрібна
MamayLM можна використовувати у всьому спектрі задач — від побудови україномовного асистента, до обробки запитів у держсекторі, освіті, юриспруденції або журналістиці.
У прикладному плані модель вже доступна:
Через Hugging Face Transformers API
У форматі GGUF для локального запуску через llama.cpp, LM Studio або KoboldCpp
Показники і реальні результати
У внутрішньому тестуванні MamayLM показала високу точність у відповідях на задачі типу MMLU, ARC, та адаптованих до української версії ЗНО.
Особливо показовим є те, що вона стабільно формулює природні україномовні відповіді там, де інші моделі з труднощами дають перекладені англомовні шаблони.
Погляд у майбутнє
MamayLM — це не лише технічне досягнення. Це важливий культурно-лінгвістичний крок, що відкриває перед українською мовою нові горизонти в епоху штучного інтелекту. Модель уже доступна публічно для дослідників, розробників і всіх, хто хоче будувати з її допомогою нове покоління україномовних сервісів.
Спробувати MamayLM: https://huggingface.co/INSAIT-Institute/MamayLM-Gemma-2-9B-IT-v0.1
Якщо вам цікава тема штучного інтелекту, автоматизації та актуальних AI-новинок — приєднуйтесь до Telegram-каналу AI.Inside, де регулярно свіжі інсайти зі світу AI.