ByteDance научила ИИ оживлять фотографии: что умеет OmniHuman-1
ByteDance, создатель TikTok, представила новую технологию искусственного интеллекта OmniHuman-1. Система превращает статичные изображения в видео, добавляя естественные движения и речь как реальным людям, так и мультипликационным персонажам.

Как работает технология
OmniHuman-1 использует комплексный подход к генерации видео, одновременно обрабатывая:
- Текстовые данные
- Изображения
- Аудио
- Позы тела
Для обучения система проанализировала 19 000 часов видеоматериалов. Это позволило решить главную проблему ИИ-генерации видео — создание естественных человеческих движений в масштабе. Предыдущие разработки часто давали сбои из-за сложности фильтрации нерелевантных данных при масштабном обучении.
Что умеет OmniHuman-1
Система демонстрирует впечатляющие результаты:
- Создает реалистичную артикуляцию губ, соответствующую речи
- Генерирует естественные жесты
- Корректно обрабатывает пропорции тела
- Учитывает особенности окружающей среды
- Работает как с фотографиями людей, так и с рисованными персонажами
Единственное техническое ограничение — объем доступной памяти, который определяет максимальную длину создаваемых видео.
Перспективы и риски
Появление OmniHuman-1 открывает новые возможности в сфере ИИ-генерации видеоконтента. Однако технология вызывает закономерные вопросы об этике применения и потенциальных рисках распространения дезинформации.
Для специалистов эта разработка — сигнал растущего спроса на экспертов в области машинного обучения и генерации мультимедиа. Тем, кто заинтересован в развитии в этом направлении, доступны профильные курсы по разработке и применению ИИ в мультимедийных проектах.
Если вас заинтересовала работа с технологиями искусственного интеллекта, на нашем сайте собрана подборка лучших курсов по ИИ. Здесь вы найдете программы разного уровня — от базового знакомства с технологией до углубленного изучения нейросетей и машинного обучения.
Яндекс научил нейросеть собирать сайты за 10 минут — и это может изменить, кому теперь нужны разработчики
Яндекс открыл публичный доступ к Vibecraft — сервису, который собирает рабочие сайты, CRM и мини-приложения по текстовому описанию без единой строчки кода. За время тестирования пользователи создали более 1000 проектов, а аналитики прогнозируют рост рынка no-code в России до 30 млрд рублей к 2028 году. Разбираемся, почему этот запуск важен не только для бизнеса, но и для тех, кто планирует карьеру в IT.
Исследование: ИИ меняет требования к навыкам на рынке труда
ManpowerGroup пишет, что ИИ меняет требования к навыкам: важнее становятся обучаемость, повышение квалификации, ИИ-грамотность и практический результат обучения.
Исследование о навыках, карьере и изменениях на рынке труда
Микроквалификации в отчете рассматриваются как способ быстрее закрывать новые запросы рынка труда, если они понятны работодателям и связаны с конкретными навыками.
Дворник, чиновник, полицейский: от каких профессий россияне хотят уберечь своих детей
SuperJob выяснил, каких профессий для своих детей россияне боятся больше всего. Дворник — на первом месте, следом чиновники и полицейские. Исследование раскрывает, как на самом деле родители оценивают карьерные перспективы — и почему востребованные профессии оказались в антирейтинге.