Послуги
Услуги

Digital агентство

Останні новини
НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ? НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ?

07.06.24 12:52
НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ? Щоб зрозуміти, де саме знаходиться ваше місце на ринку,... Читать полностью
Віртуальна реальність та маркетингові стратегії Віртуальна реальність та маркетингові стратегії

26.06.23 10:14
Віртуальна реальність більше не є науковою фантастикою – вона вже тут і швидко набирає обертів. Читать полностью
Рада схвалила у другому читанні закон «Про рекламу» Рада схвалила у другому читанні закон «Про рекламу»

19.06.23 15:11
У вівторок, 30 травня, Верховна Рада схвалила у другому читанні закон «Про рекламу».... Читать полностью
Селфі цифрової реальності Селфі цифрової реальності

12.06.23 09:10
Створення нового бренда схоже на будівництво нового світу зі всіма правилами й особливостями, Читать полностью
Боти генерують майже половину інтернет-трафіку світу Боти генерують майже половину інтернет-трафіку світу

05.06.23 05:09
 За даними компанії Imperva, яка спеціалізується на кібербезпеці Читать полностью
Брендинг допомагає рятувати життя Брендинг допомагає рятувати життя

29.05.23 00:00
Одна з найважливіших специфік на війні — медична допомога. Читать полностью
РусскийУкраїнська

Компанія Google представила нейромережу Imagen Video. Цей AI-генератор здатен створювати якісне відео за словесними запитами.

Всього кілька днів тому Meta представила свою нейромережу Make-To-Video, яка генерує відео за словесними описами, а тепер до цього сегменту приєднується компанія Google.

Нейромережа Imagen Video: особливостіImagen Video здатна за словесними запитами генерувати відео з роздільною здатністю 1280 768 пікселів і частотою 24 кадри в секунду. Інструмент базується на алгоритмі Imagen, що є аналогом DALL-E 2 та Stable Diffusion. Генератор картинок використовує велику передбачену мовну нейромережу та каскадну дифузну модель.

Як пояснюють в Google, Imagen Video бере текстовий опис і створює 16-кадровий ролик з роздільною здатністю 24х48 пікселів і частотою 3 FPS. Потім система масштабує та «передбачає» додаткові зображення. В результаті алгоритм генерує 128-кадрову анімацію з роздільною здатністю 1280×768 пікселів та частотою 24 FPS.

Для навчання Imagen Video розробники використовували 14 млн пар «відео-опис» та 60 млн «зображення-текст», а також загальнодоступний набір даних LAION-400M, що дозволило моделі застосовувати низку естетичних аспектів.

У порівнянні з доступними сьогодні системами створення зображень Imagen Video також може належним чином відтворювати текст. У той час як і Stable Diffusion, і DALL-E 2 важко перекладають підказки на зразок «логотип для „Diffusion“» у читабельний шрифт, Imagen Video відтворює це без проблем.

Це не означає, що Imagen Video не має обмежень. Як і у випадку з Make-A-Video, навіть кліпи, вибрані з Imagen Video, тремтять і місцями спотворені.

Щоб покращити ситуацію, команда Imagen Video планує об'єднати зусилля з дослідниками Phenaki, ще однієї системи перетворення тексту у відео від Google, яка дебютувала сьогодні та може перетворювати довгі, детальні підказки на двохвилинні відеоролики — хоча і з нижчою якістю.

За матеріалами https://speka.media/

 
Интересная статья? Поделись ей с другими:

Залишити заявку

Ви можете заповнити форму заявки або написати на нашу електронну пошту: office@maxmedia.com.ua

Click on the image to change it

Реклама Печать Дизайн Разработка Промоушн Продакшн