Друкарня від WE.UA

Найпопулярнішій MidJourney про таку функцію мріяти і мріяти.

Ми вже багато розповідали про нейромережі, зокрема для генерації зображень. Одна з великих їхніх проблем - неможливість генерувати нормальний текст на картинці: виходить або абракадабра, або взагалі нечитабельні символи. Але колишні співробітники Google змогли виправити цей недолік - вони запустили сервіс Ideogram, в якому будь-які написи за вашим бажанням генеруються з неймовірною точністю.

Чому у нейромереж погано виходять написи

За останні півтора року (приблизно тоді у світ вийшла перша версія MidJourney) нейромережі для генерації зображень пройшли величезний шлях поліпшень і стали створювати якісні роботи. Проте, все ще трапляються "вади" - неправильна кількість пальців на руках (або ногах), косі обличчя, нерозбірливі написи.

Усі ці дефекти роботи нейромережі, насправді, зумовлені однією і тією ж проблемою: процесом навчання моделі. Річ у тім, що, навчаючи нейромережу, фахівці дають їй певні зображення і створений людиною текст, що описує те, що на цьому зображенні знаходиться. Навчаючись, нейромережа зазвичай аналізує зображення загалом - дуже рідко фахівці описують окремі частини картини, оскільки це дуже трудомістко і складно.

У підсумку, навіть якщо в навчальній вибірці є достатньо зображень із правильним числом пальців на руках або красивими і зрозумілими написами, нейромережа просто не розуміє, яка конкретна деталь на зображенні - напис, а яка - палець. Тому, коли в запиті алгоритм бачить фразу, наприклад, "табличка з текстом I love you", він може видати щось на кшталт "IIu lvooo Youuu".

Надпись нейросети

У навчальній вибірці алгоритму могли бути зображення з такими написами, але ніхто не говорив йому, що єдиний правильний варіант написання цієї фрази - саме "I love you", тому нейромережа просто змішує всі літери, як змішує моделей у Баленсіага і фото Папи Римського.

Папа римский баленсиага

Нейромережа, що створює написи

Але ось у програмістів Ideogram вийшло навчити нейромережу так, щоб написи на згенерованих нею зображеннях були коректними. Представники стартапу, генеральний директор якого Мохаммад Норузі був старшим науковим співробітником Google, не розкривають секретів того, як їм вдалося навчити свою модель.

Наразі кожен може випробувати нову нейромережу і насолодитися результатами її роботи. Досить зайти на сайт ideogram.ai/ і пройти реєстрацію за допомогою акаунта Google. Після цього ви потрапляєте на головну сторінку, де будуть висвічуватися ваші роботи і стрічка із зображеннями, створеними іншими користувачами:

Вводите свій запит у вікні й отримуєте на виході чотири варіанти зображення. Найкраще поки що справляється з англійською мовою - з українською зовсім погано, хоча інтент запиту алгоритм розуміє. Ось кілька прикладів того, на що здатна Ideogram:

Як вводити запит в Ideogram

Загалом, правила формулювання промта (запиту) для Ideogram точно такі самі, як і для Stable Diffusion і MidJourney - про них ми розповідали в окремій статті. Але оскільки тут ми маємо справу з написами, варто відзначити ще одну важливу річ: при введенні запиту текст напису, який ви хочете побачити на зображенні, найкраще вводити всередині лапок - так нейромережа краще зрозуміє, який текст має бути на малюнку.

Статті про вітчизняний бізнес та цікавих людей:

  • Вітаємо з Різдвом Христовим!

    Друкарня та платформа WE.UA вітають всіх наших читачів та авторів зі світлим святом Різдва! Зичимо всім українцям довгожданого миру, міцного здоровʼя, злагоди, родинного затишку та втілення всього доброго і прекрасного, чого вам побажали колядники!

    Теми цього довгочиту:

    Різдво
  • Каблучки – прикраси, які варто купувати

    Ювелірні вироби – це не тільки спосіб витратити гроші, але і зробити вигідні інвестиції. Бо вартість ювелірних виробів з кожним роком тільки зростає. Тому купуючи стильні прикраси, ви вигідно вкладаєте кошти.

    Теми цього довгочиту:

    Як Вибрати Каблучку
  • П'ять помилок у виборі домашнього текстилю, які псують комфорт сну

    Навіть ідеальний матрац не компенсує дискомфорт, якщо текстиль підібрано неправильно. Постільна білизна безпосередньо впливає на терморегуляцію, стан шкіри та глибину сну. Більшість проблем виникає не через низьку якість виробів, а через вибір матеріалів та подальшу експлуатацію

    Теми цього довгочиту:

    Домашній Текстиль
  • Як знайти житло в Києві

    Переїжджаєте до Києва і шукаєте житло? Дізнайтеся, як орендувати чи купити квартиру, перевірити власника та знайти варіанти, про які зазвичай не говорять.

    Теми цього довгочиту:

    Агентство Нерухомості
  • Як заохотити дитину до читання?

    Як залучити до читання сучасну молодь - поради та факти. Користь читання для дітей - основні переваги. Розвиток дітей - це наше майбутнє.

    Теми цього довгочиту:

    Читання
Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!
Бізнес. Ідеї. Стартапи
Бізнес. Ідеї. Стартапи@businessidea

Підписуйтесь на Телеграм

1.3MПрочитань
13Автори
1KЧитачі
Підтримати
На Друкарні з 15 квітня

Більше від автора

Це також може зацікавити:

  • Ші і Книги 2

    Наразі, Ші дуже корисний. Так значно легше зробити обкладинку чи необхідні ілюстрації. Зручно, що можна обирати розмір і вказувати стиль котрий вам необхідний. Прогрес не стоїть на місці)

    Теми цього довгочиту:

    Ші Помічник
  • Stable Diffusion 3 API

    І так Stable Diffusion 3 та Stable Diffusion 3 Turbo тепер доступні на API платформі розробників Stability AI! Вони співпрацють з Fireworks AI, найшвидшою та найнадійнішою API-платформою на ринку.

    Теми цього довгочиту:

    Stable Diffusion
  • AvatarFX: Як Character.AI дає голос і міміку вашим фотографіям

    MENLO PARK, КАЛІФОРНІЯ — У технологічному осередку Кремнієвої долини, де стартапи змагаються за місце під сонцем майбутнього, Character.AI веде свою гру, перетворюючи світлі ідеї на революційні інструменти. двоє колишніх інженерів Google знову кидають виклик уявленням.

    Теми цього довгочиту:

    Ai

Коментарі (0)

Підтримайте автора першим.
Напишіть коментар!

Це також може зацікавити:

  • Ші і Книги 2

    Наразі, Ші дуже корисний. Так значно легше зробити обкладинку чи необхідні ілюстрації. Зручно, що можна обирати розмір і вказувати стиль котрий вам необхідний. Прогрес не стоїть на місці)

    Теми цього довгочиту:

    Ші Помічник
  • Stable Diffusion 3 API

    І так Stable Diffusion 3 та Stable Diffusion 3 Turbo тепер доступні на API платформі розробників Stability AI! Вони співпрацють з Fireworks AI, найшвидшою та найнадійнішою API-платформою на ринку.

    Теми цього довгочиту:

    Stable Diffusion
  • AvatarFX: Як Character.AI дає голос і міміку вашим фотографіям

    MENLO PARK, КАЛІФОРНІЯ — У технологічному осередку Кремнієвої долини, де стартапи змагаються за місце під сонцем майбутнього, Character.AI веде свою гру, перетворюючи світлі ідеї на революційні інструменти. двоє колишніх інженерів Google знову кидають виклик уявленням.

    Теми цього довгочиту:

    Ai