ByteDance научила ИИ оживлять фотографии: что умеет OmniHuman-1
ByteDance, создатель TikTok, представила новую технологию искусственного интеллекта OmniHuman-1. Система превращает статичные изображения в видео, добавляя естественные движения и речь как реальным людям, так и мультипликационным персонажам.

Как работает технология
OmniHuman-1 использует комплексный подход к генерации видео, одновременно обрабатывая:
- Текстовые данные
- Изображения
- Аудио
- Позы тела
Для обучения система проанализировала 19 000 часов видеоматериалов. Это позволило решить главную проблему ИИ-генерации видео — создание естественных человеческих движений в масштабе. Предыдущие разработки часто давали сбои из-за сложности фильтрации нерелевантных данных при масштабном обучении.
Что умеет OmniHuman-1
Система демонстрирует впечатляющие результаты:
- Создает реалистичную артикуляцию губ, соответствующую речи
- Генерирует естественные жесты
- Корректно обрабатывает пропорции тела
- Учитывает особенности окружающей среды
- Работает как с фотографиями людей, так и с рисованными персонажами
Единственное техническое ограничение — объем доступной памяти, который определяет максимальную длину создаваемых видео.
Перспективы и риски
Появление OmniHuman-1 открывает новые возможности в сфере ИИ-генерации видеоконтента. Однако технология вызывает закономерные вопросы об этике применения и потенциальных рисках распространения дезинформации.
Для специалистов эта разработка — сигнал растущего спроса на экспертов в области машинного обучения и генерации мультимедиа. Тем, кто заинтересован в развитии в этом направлении, доступны профильные курсы по разработке и применению ИИ в мультимедийных проектах.
Если вас заинтересовала работа с технологиями искусственного интеллекта, на нашем сайте собрана подборка лучших курсов по ИИ. Здесь вы найдете программы разного уровня — от базового знакомства с технологией до углубленного изучения нейросетей и машинного обучения.
Форум Project Management Forum 2025 пройдет для проектных менеджеров
Project Management Forum 2025 — три дня кейсов, практики и диалога для специалистов в сфере проектного управления.
Как выиграть 1,1 млн рублей в ML-соревновании от Ozon
Ozon запускает масштабное ML-соревнование E-CUP 2025 с призовым фондом 7,2 млн рублей, где участники будут решать реальные задачи e-commerce в трех треках. Соревнование стартует 18 августа, а победители получат до 1,1 млн рублей и приглашение на финал в Москве с конференцией E-CODE.
II Всероссийский форум «Управление продуктом 2025»: три дня практики, кейсов и профессионального общения
Три дня форумов, мастер-классов и кейсов для тех, кто управляет продуктами и ищет решения в условиях перемен.