Microsoft's показали VASA-1

Нещодавно Microsoft презентувало свою модель VASA-1 (Visual Avatar Synthesis and Animation) яка займається синтезом та анімацією віртуальних аватарів. за допомогою обширних експериментів, включаючи оцінку за набором нових метрик, метод значно перевершує попередні методи за різними параметрами. Новий метод не тільки забезпечує високу якість відео з реалістичною динамікою обличчя та голови, але й підтримує онлайн-генерацію відео 512x512 зі швидкістю до 40 кадрів в секунду з незначною стартовою затримкою. Це відкриває шлях до взаємодії в реальному часі з реалістичними аватарами, які імітують людську розмовну поведінку.

Основні особливості VASA-1:

  1. Реалістичність: Модель здатна створювати аватари з високим ступенем реалістичності, включаючи деталі обличчя, волосся, одягу та інші елементи.

  2. Персоналізація: VASA-1 може створювати аватари, які відображають індивідуальні риси людини, такі як колір очей, форма обличчя, стиль волосся тощо.

  3. Анімація: Модель також може генерувати анімації аватарів, включаючи рухи голови, рух очей, міміку та інші елементи.

  4. Висока швидкість: VASA-1 працює досить швидко, що дозволяє генерувати аватари в режимі реального часу.


Microsoft's VASA-1 може конкурувати з іншими відомими моделями для генерації аватарів, такими як:

  1. StyleGAN: Ця модель від компанії NVIDIA відома своєю здатністю генерувати високоякісні, реалістичні зображення людей зі складними текстурами та деталями. StyleGAN також має можливість створювати аватари з різними стилями та варіаціями.

  2. BigGAN: Ця модель від Google Research зосереджена на генерації великих, високороздільних зображень. Вона може створювати аватари з великою кількістю деталей та реалістичними текстурами.

  3. AvatarGAN: Ця модель від Китайського університету науки і техніки (Tsinghua University) спеціально розроблена для генерації аватарів. Вона може створювати персоналізовані аватари з різними стилями, виразами обличчя та одягом.



Нова дослідницька робота Microsoft обіцяє майбутнє, в якому ви зможете завантажити фотографію, зразок свого голосу і створити живу, анімовану голову, що розмовляє, зі свого власного обличчя.VASA-1 бере одну портретну фотографію та аудіофайл і перетворює їх на гіперреалістичне відео з обличчям, що розмовляє, з синхронізацією губ, реалістичними рисами обличчя та рухами голови.

Приклад генерації


Microsoft оголосила, що не планує розповсюджувати нову версію своєї нейромережі у відкритий доступ через побоювання створення дипфейків. Замість цього, компанія зосереджується на поліпшенні технології захисту VASA-1 від зловживань з боку недобросовісних користувачів.
Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!
Технологічний ритм
Технологічний ритм@TechRhythm

ШІ, Web3, Інновації

189Прочитань
0Автори
2Читачі
На Друкарні з 6 квітня

Більше від автора

  • GTP-4o - нові можливості від OpenAI

    OpenAI анонсували нову флагманську модель GPT-4o, яка може міркувати між аудіо, відео та текстом у реальному часі.

    Теми цього довгочиту:

    Штучний Інтелект
  • LTX Studio - платформа для створення фільмів

    Компанія Lightricks анонсувала новий інструмент для створення відеороликів на основі штучного інтелекту під назвою LTX Studio. Ця інноваційна платформа є першою у своєму роді, яка використовує генеративний ШІ

    Теми цього довгочиту:

    Штучний Інтелект
  • Stable Diffusion 3 API

    І так Stable Diffusion 3 та Stable Diffusion 3 Turbo тепер доступні на API платформі розробників Stability AI! Вони співпрацють з Fireworks AI, найшвидшою та найнадійнішою API-платформою на ринку.

    Теми цього довгочиту:

    Stable Diffusion

Вам також сподобається

Коментарі (0)

Підтримайте автора першим.
Напишіть коментар!

Вам також сподобається