Друкарня від WE.UA

Microsoft's показали VASA-1

Нещодавно Microsoft презентувало свою модель VASA-1 (Visual Avatar Synthesis and Animation) яка займається синтезом та анімацією віртуальних аватарів. за допомогою обширних експериментів, включаючи оцінку за набором нових метрик, метод значно перевершує попередні методи за різними параметрами. Новий метод не тільки забезпечує високу якість відео з реалістичною динамікою обличчя та голови, але й підтримує онлайн-генерацію відео 512x512 зі швидкістю до 40 кадрів в секунду з незначною стартовою затримкою. Це відкриває шлях до взаємодії в реальному часі з реалістичними аватарами, які імітують людську розмовну поведінку.

Основні особливості VASA-1:

  1. Реалістичність: Модель здатна створювати аватари з високим ступенем реалістичності, включаючи деталі обличчя, волосся, одягу та інші елементи.

  2. Персоналізація: VASA-1 може створювати аватари, які відображають індивідуальні риси людини, такі як колір очей, форма обличчя, стиль волосся тощо.

  3. Анімація: Модель також може генерувати анімації аватарів, включаючи рухи голови, рух очей, міміку та інші елементи.

  4. Висока швидкість: VASA-1 працює досить швидко, що дозволяє генерувати аватари в режимі реального часу.


Microsoft's VASA-1 може конкурувати з іншими відомими моделями для генерації аватарів, такими як:

  1. StyleGAN: Ця модель від компанії NVIDIA відома своєю здатністю генерувати високоякісні, реалістичні зображення людей зі складними текстурами та деталями. StyleGAN також має можливість створювати аватари з різними стилями та варіаціями.

  2. BigGAN: Ця модель від Google Research зосереджена на генерації великих, високороздільних зображень. Вона може створювати аватари з великою кількістю деталей та реалістичними текстурами.

  3. AvatarGAN: Ця модель від Китайського університету науки і техніки (Tsinghua University) спеціально розроблена для генерації аватарів. Вона може створювати персоналізовані аватари з різними стилями, виразами обличчя та одягом.



Нова дослідницька робота Microsoft обіцяє майбутнє, в якому ви зможете завантажити фотографію, зразок свого голосу і створити живу, анімовану голову, що розмовляє, зі свого власного обличчя.VASA-1 бере одну портретну фотографію та аудіофайл і перетворює їх на гіперреалістичне відео з обличчям, що розмовляє, з синхронізацією губ, реалістичними рисами обличчя та рухами голови.

Приклад генерації


Microsoft оголосила, що не планує розповсюджувати нову версію своєї нейромережі у відкритий доступ через побоювання створення дипфейків. Замість цього, компанія зосереджується на поліпшенні технології захисту VASA-1 від зловживань з боку недобросовісних користувачів.

Статті про вітчизняний бізнес та цікавих людей:

  • Як модні бренди формують культуру та впливають на глобальні fashion-тренди

    Модні бренди часто стають символами ідентичності. Вони впливають на вибір способу життя не тільки в одязі — розкішні годинники, парфуми, товари для дому та враження підкріплюють культурні наративи успіху, смаку та вишуканості.

    Теми цього довгочиту:

    Мода
  • Створити блог на Друкарні - швидко, легко та безкоштовно

    Друкарня - це зручне та безкоштовне середовище для ведення власного блогу. В даній статті ми розповідаємо про основні переваги та функціональні можливості для того, щоб зацікавити нових авторів створити власний блог на Друкарні. Будь ласка, поширте цю інформацію.

    Теми цього довгочиту:

    Друкарня
  • Чому Google Merchant Center може заблокувати обліковий запис?

    Одним з найбільш ефективних каналів продажів є система Google Merchant Center. Правда, акаунт в ній може бути несподівано заблокований, якщо при його налаштуванні були порушені правила системи. У статті розглянемо підводні камені і дамо відповідь як уникнути блокування

    Теми цього довгочиту:

    Google Merchant Center
  • Бухгалтерський супровід ФОП: сучасний підхід до обліку

    Завдяки розвитку інформаційних технологій, впровадженню сучасних рішень і сервісів процес ведення бухобліку бізнесу став значно простішим і зручним. З іншого боку, ті ж технології додали бухгалтерам роботи – з обліком онлайн-продажів і надходжень у валюті, CRM-системами та ін.

    Теми цього довгочиту:

    Бухгалтерський Облік Фоп
  • Пилосос як базова техніка для щоденного прибирання

    Підтримання чистоти в оселі потребує зручних і продуманих рішень, особливо коли йдеться про догляд за різними поверхнями. У домашньому побуті пилосос залишається базовою побутовою технікою, що поєднує сухе та вологе очищення без зайвих зусиль.

    Теми цього довгочиту:

    Пилососи
Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!
Технологічний ритм
Технологічний ритм@TechRhythm we.ua/TechRhythm

ШІ, Web3, Інновації

13Довгочити
24.1KПрочитання
17Підписники
Підтримати
На Друкарні з 6 квітня

Більше від автора

  • Ideogram & Midjorney [Оновлення]

    Нещодавно вийшли оновлення для таких інструментів генеративного штучного інтелекту, як Midjourney та Ideogram — двох дуже популярних ШІ для генерації зображень, які використовуються в різних галузях.

    Теми цього довгочиту:

    Ші
  • Платформа Gen AI від Exists для створення 3d -ігор за допомогою підказок

    AI-стартап Exists створив платформу на основі генеративного ШІ, яка дозволяє створювати 3D-ігри за допомогою текстових підказок. Це надає можливість будь-кому розробляти високоякісні 3D-проєкти для ігрової індустрії за лічені хвилини

    Теми цього довгочиту:

    Ші

Це також може зацікавити:

Коментарі (0)

Підтримайте автора першим.
Напишіть коментар!

Це також може зацікавити: