Як кажуть самі Google, Veo - це їх найпотужніша на сьогоднішній день модель для створення відео. Вона може генерувати високоякісні відео з роздільною здатністю 1080p, тривалістю хвилина, у широкому діапазоні кінематографічних та візуальних стилів.
Коротко про основне
Незалежно від того , чи ви досвідчений кінорежисер , чи просто любитель , ця модель надає вам можливість створити свою ідею. Однією з ключових особливостей VEO є його здатність розуміти текстові промпти та переводити їх в візуальні ефекти. Завдяки високому рівню розуміння природної мови та візуальної семантики, модель генерує відео, що відображають задані промпти з високою точністю. Також дозволяє не лише створювати відео за текстовими промптами, але й редагувати вже існуючі відео. Ви можете надавати команди на редагування, такі як додавання об'єктів до кадру або зміна кольору, і Veo виконає ці команди і згенерує нове відео. З важливих характеристик Veo, можливість зберігати стабільність у кожному кадрі відео. Це досягається завдяки передовим технологіям латентної дифузії, що зменшують відмінності між кадрами та забезпечують реалістичний вигляд відео.
Також написали , що у майбутньому також додадуть деякі можливості Veo до YouTube Shorts та інших продуктів.
Наразі можна доєднатися до waitlist.
Про те як працює
Veo базується на багаторічній роботі над моделями генеративного відео, включаючи Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet і Lumiere, а також на нашій архітектурі Transformer і Gemini.
Щоб допомогти моделі точніше розуміти і виконувати підказки, додали більше деталей до підписів до кожного відео в його навчальних даних. Для ще більшої продуктивності, модель використовує високоякісні, стислі зображення відео (також відомі як латентні), що також робить її більш ефективною. Ці кроки покращують загальну якість і скорочують час, необхідний для генерації відео.
Дякую за увагу , якщо є якісь цікаві питання та пропозиції пишіть в коментарі , Гарного дня.