Группа ученых из Китая разработала новую модель искусственного интеллекта под названием Pyramid Flow. Ее можно использовать для создания видеоизображений высокого разрешения (768p), сообщает TechXplore.
Создатели Pyramid Flow разработали новый подход к генерации видео с использованием искусственного интеллекта. Их модель создает ролики в несколько этапов с низким разрешением, постепенно повышая качество до конечного результата. Программа может создавать пятисекундные клипы с разрешением 384p всего за 56 секунд.
Этот метод генерации видео требует гораздо меньше вычислительных ресурсов по сравнению с аналогами, что снижает затраты. Кроме того, подход позволяет сократить количество токенов, необходимых для создания видео. Поэтому процесс становится эффективнее.
Разработчики выложили исходный код Pyramid Flow на платформу GitHub под лицензией MIT. Вместе с кодом были опубликованы видеоролики, демонстрирующие качество результатов, которые выдает модель. Также команда предоставила список открытых наборов данных, которые использовались для обучения ИИ. В общей сложности, было задействовано 10 млн коротких видеороликов.
ИИ-модели для генерации видео становятся все популярнее. Они снижают затраты на производство контента, обещая революцию в кино и телевидении. Решение китайской команды поделиться исходным кодом своей модели — значимый шаг. Любой разработчик может бесплатно использовать его для создания своих приложений, включая коммерческие. Такой подход способствует широкому распространению технологий искусственного интеллекта и ускоряет инновации в этой области.
Ранее Apple представила умное приложение для создания 3D-объектов. Инструмент на основе ИИ считывает глубину обычного 2D-изображения без дополнительных данных. Технология позволит создавать реалистичные объемные модели объектов всего за доли секунды.