Акции и промокодыОтзывы о школах

ByteDance научила ИИ оживлять фотографии: что умеет OmniHuman-1

ByteDance, создатель TikTok, представила новую технологию искусственного интеллекта OmniHuman-1. Система превращает статичные изображения в видео, добавляя естественные движения и речь как реальным людям, так и мультипликационным персонажам.

анимация

Как работает технология

OmniHuman-1 использует комплексный подход к генерации видео, одновременно обрабатывая:

  • Текстовые данные
  • Изображения
  • Аудио
  • Позы тела

Для обучения система проанализировала 19 000 часов видеоматериалов. Это позволило решить главную проблему ИИ-генерации видео — создание естественных человеческих движений в масштабе. Предыдущие разработки часто давали сбои из-за сложности фильтрации нерелевантных данных при масштабном обучении.

Что умеет OmniHuman-1

Система демонстрирует впечатляющие результаты:

  • Создает реалистичную артикуляцию губ, соответствующую речи
  • Генерирует естественные жесты
  • Корректно обрабатывает пропорции тела
  • Учитывает особенности окружающей среды
  • Работает как с фотографиями людей, так и с рисованными персонажами

Единственное техническое ограничение — объем доступной памяти, который определяет максимальную длину создаваемых видео.

Перспективы и риски

Появление OmniHuman-1 открывает новые возможности в сфере ИИ-генерации видеоконтента. Однако технология вызывает закономерные вопросы об этике применения и потенциальных рисках распространения дезинформации.

Для специалистов эта разработка — сигнал растущего спроса на экспертов в области машинного обучения и генерации мультимедиа. Тем, кто заинтересован в развитии в этом направлении, доступны профильные курсы по разработке и применению ИИ в мультимедийных проектах.

Если вас заинтересовала работа с технологиями искусственного интеллекта, на нашем сайте собрана подборка лучших курсов по ИИ. Здесь вы найдете программы разного уровня — от базового знакомства с технологией до углубленного изучения нейросетей и машинного обучения.

Дата: 5 февраля 2025
Читайте также
Люди разных профессий
Новости
Российский рынок труда: кадровый дефицит и новые реалии

Российский рынок труда столкнулся с кадровым дефицитом, особенно среди разнорабочих, менеджеров по продажам и слесарей. По результатам исследования, проведенного сервисами Работа.ру и СберПодбор, эта проблема особенно актуальна для среднего и крупного бизнеса.

Студенты изучают digital
Новости
VK Education предлагает бесплатное обучение по IT и digital для студентов

Платформа VK Education презентовала широкий спектр бесплатных образовательных программ, направленных на развитие навыков в области информационных технологий.  Подойдет студентам и школьникам, делающим первые шаги в IT, а также опытным специалистам, желающим углубить свои знания.

Всероссийская физико-техническая контрольная
Новости
“Выходи решать!”: открыта регистрация на Всероссийскую контрольную

Открыта регистрация на Всероссийскую контрольную «Выходи решать!», которая пройдет с 28 сентября по 5 октября 2024 года. Школьники и студенты смогут проверить свои знания и выиграть ценные призы.

АйТи специалист за работой
Новости
Три лидера карьерного роста: IT, нефтегазовая сфера и строительство

IT-сфера продолжает быть самой перспективной для карьерного роста в России, по мнению 38% респондентов. На втором месте по привлекательности для карьеры оказались нефтегазовая и строительная отрасли, набравшие по 12% голосов. Женщины чаще мужчин считают IT более перспективной, несмотря на преобладание мужчин в отрасли. Также растет интерес к новым технологиям, таким как робототехника и e-commerce.

Искусственный интеллект в медицине
Новости
ИИ сокращает разработку лекарств с 12 лет до нескольких недель

Искусственный интеллект ускоряет разработку лекарств с помощью виртуальных симуляций, снижая затраты и повышая точность клинических испытаний. AI-платформы, как QuantHealth, меняют парадигму медицины.

Собака в одежде
Новости
Google открыл доступ к ИИ-генератору изображений Imagen 3 для всех пользователей

Google открыл доступ к ИИ-генератору изображений Imagen 3 для всех пользователей, включая бесплатные аккаунты. Теперь каждый может создавать изображения по текстовым запросам с помощью продвинутой технологии ИИ.

Категории курсов
Отзывы о школах