ByteDance научила ИИ оживлять фотографии: что умеет OmniHuman-1
ByteDance, создатель TikTok, представила новую технологию искусственного интеллекта OmniHuman-1. Система превращает статичные изображения в видео, добавляя естественные движения и речь как реальным людям, так и мультипликационным персонажам.
Как работает технология
OmniHuman-1 использует комплексный подход к генерации видео, одновременно обрабатывая:
- Текстовые данные
- Изображения
- Аудио
- Позы тела
Для обучения система проанализировала 19 000 часов видеоматериалов. Это позволило решить главную проблему ИИ-генерации видео — создание естественных человеческих движений в масштабе. Предыдущие разработки часто давали сбои из-за сложности фильтрации нерелевантных данных при масштабном обучении.
Что умеет OmniHuman-1
Система демонстрирует впечатляющие результаты:
- Создает реалистичную артикуляцию губ, соответствующую речи
- Генерирует естественные жесты
- Корректно обрабатывает пропорции тела
- Учитывает особенности окружающей среды
- Работает как с фотографиями людей, так и с рисованными персонажами
Единственное техническое ограничение — объем доступной памяти, который определяет максимальную длину создаваемых видео.
Перспективы и риски
Появление OmniHuman-1 открывает новые возможности в сфере ИИ-генерации видеоконтента. Однако технология вызывает закономерные вопросы об этике применения и потенциальных рисках распространения дезинформации.
Для специалистов эта разработка — сигнал растущего спроса на экспертов в области машинного обучения и генерации мультимедиа. Тем, кто заинтересован в развитии в этом направлении, доступны профильные курсы по разработке и применению ИИ в мультимедийных проектах.
Если вас заинтересовала работа с технологиями искусственного интеллекта, на нашем сайте собрана подборка лучших курсов по ИИ. Здесь вы найдете программы разного уровня — от базового знакомства с технологией до углубленного изучения нейросетей и машинного обучения.

VK организует бесплатный митап по информационной безопасности
VK проведет митап по кибербезопасности 24 сентября 2024 года. Участники обсудят уязвимости в коде и безопасность контейнеров в Kubernetes. Встреча пройдет оффлайн в офисе VK, участие бесплатное.

Дистанционка вместо облегчения работы ускоряет выгорание учителей
Узнайте, как дистанционное обучение влияет на профессиональное выгорание учителей, и какие шаги необходимы для поддержки педагогов в эпоху цифровизации образования.

OpenAI и DeepLearning.AI запустили курс по работе с моделью o1
DeepLearning.AI и OpenAI представили курс «Reasoning with o1» для освоения передовых навыков работы с ИИ. Узнайте, как использовать модель o1 эффективно!

Почти каждый второй россиянин планирует сменить работу в 2025 году
47% россиян готовы сменить работу в 2025 году. Узнайте ключевые факторы выбора и советы экспертов для успешной смены профессии