Услуги
Услуги

Digital агентство

Последние новости:
НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ? НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ?

П'ятниця, 07 червня 2024, 12:52
НАВІЩО ПОТРІБЕН АНАЛІЗ РЕКЛАМИ КОНКУРЕНТІВ? Щоб зрозуміти, де саме знаходиться ваше місце на ринку,... Читать полностью
Віртуальна реальність та маркетингові стратегії Віртуальна реальність та маркетингові стратегії

Понеділок, 26 червня 2023, 10:14
Віртуальна реальність більше не є науковою фантастикою – вона вже тут і швидко набирає обертів. Читать полностью
Рада схвалила у другому читанні закон «Про рекламу» Рада схвалила у другому читанні закон «Про рекламу»

Понеділок, 19 червня 2023, 15:11
У вівторок, 30 травня, Верховна Рада схвалила у другому читанні закон «Про рекламу».... Читать полностью
Селфі цифрової реальності Селфі цифрової реальності

Понеділок, 12 червня 2023, 09:10
Створення нового бренда схоже на будівництво нового світу зі всіма правилами й особливостями, Читать полностью
Боти генерують майже половину інтернет-трафіку світу Боти генерують майже половину інтернет-трафіку світу

Понеділок, 05 червня 2023, 05:09
За даними компанії Imperva, яка спеціалізується на кібербезпеці Читать полностью
Брендинг допомагає рятувати життя Брендинг допомагає рятувати життя

Понеділок, 29 травня 2023, 00:00
Одна з найважливіших специфік на війні — медична допомога. Читать полностью
РусскийУкраїнська

Компанія Google представила нейромережу Imagen Video. Цей AI-генератор здатен створювати якісне відео за словесними запитами.

Всього кілька днів тому Meta представила свою нейромережу Make-To-Video, яка генерує відео за словесними описами, а тепер до цього сегменту приєднується компанія Google.

Нейромережа Imagen Video: особливостіImagen Video здатна за словесними запитами генерувати відео з роздільною здатністю 1280 768 пікселів і частотою 24 кадри в секунду. Інструмент базується на алгоритмі Imagen, що є аналогом DALL-E 2 та Stable Diffusion. Генератор картинок використовує велику передбачену мовну нейромережу та каскадну дифузну модель.

Як пояснюють в Google, Imagen Video бере текстовий опис і створює 16-кадровий ролик з роздільною здатністю 24х48 пікселів і частотою 3 FPS. Потім система масштабує та «передбачає» додаткові зображення. В результаті алгоритм генерує 128-кадрову анімацію з роздільною здатністю 1280×768 пікселів та частотою 24 FPS.

Для навчання Imagen Video розробники використовували 14 млн пар «відео-опис» та 60 млн «зображення-текст», а також загальнодоступний набір даних LAION-400M, що дозволило моделі застосовувати низку естетичних аспектів.

У порівнянні з доступними сьогодні системами створення зображень Imagen Video також може належним чином відтворювати текст. У той час як і Stable Diffusion, і DALL-E 2 важко перекладають підказки на зразок «логотип для „Diffusion“» у читабельний шрифт, Imagen Video відтворює це без проблем.

Це не означає, що Imagen Video не має обмежень. Як і у випадку з Make-A-Video, навіть кліпи, вибрані з Imagen Video, тремтять і місцями спотворені.

Щоб покращити ситуацію, команда Imagen Video планує об'єднати зусилля з дослідниками Phenaki, ще однієї системи перетворення тексту у відео від Google, яка дебютувала сьогодні та може перетворювати довгі, детальні підказки на двохвилинні відеоролики — хоча і з нижчою якістю.

За матеріалами https://speka.media/

 
Интересная статья? Поделись ей с другими:

Оставить заказ

Вы можете заполнить форму заявки либо написать нам на нашу электронную почту: office@maxmedia.com.ua

Реклама Печать Дизайн Разработка Промоушн Продакшн