DeepMind представила Gemini Robotics: роботы, понимающие человеческую речь
Google DeepMind представила новую модель Gemini Robotics, объединяющую передовые достижения в области искусственного интеллекта и робототехники. Эта инновация позволяет роботам не только понимать команды на естественном языке, но и выполнять сложные бытовые задачи, адаптируясь к новым условиям без дополнительного обучения.
От запрограммированных действий к интеллектуальному взаимодействию
Традиционно роботы сталкивались с трудностями при выполнении задач в незнакомых ситуациях, требуя предварительного программирования для каждого сценария. Однако Gemini Robotics преодолевает этот барьер благодаря интеграции языковой модели Gemini 2.0, что позволяет роботам анализировать контекст, планировать действия и общаться на естественном языке. Это делает их более гибкими и эффективными в выполнении разнообразных задач.
От теории к практике: впечатляющие демонстрации возможностей
В одном из демонстрационных примеров робот получил команду «положить бананы в прозрачный контейнер». Он успешно идентифицировал бананы и соответствующий контейнер на столе, выполнив задачу безошибочно, даже когда контейнер перемещался. Другие демонстрации включали игру в крестики-нолики, аккуратное складывание оригами и забрасывание игрушечного баскетбольного мяча в кольцо, что подчеркивает его способность к точным и разнообразным действиям.
Мнения изнутри: как эксперты оценивают прорыв
Канишка Рао, директор по робототехнике в DeepMind, отметил:
«Одной из главных проблем в робототехнике и причиной, по которой полезных роботов не видно повсеместно, является то, что они совершенно не способны обобщать результаты в незнакомых ситуациях». Интеграция Gemini 2.0 позволяет роботам преодолеть этот барьер, делая их более адаптивными и способными к самостоятельному обучению.
Каролина Парада, руководитель отдела робототехники DeepMind, подчеркнула важность сотрудничества с пользователями для улучшения системы:
«Мы работаем с проверенными тестировщиками, чтобы познакомить их с приложениями, которые им интересны, а затем учимся у них, чтобы мы могли построить более интеллектуальную систему».
Заинтересовались перспективами в сфере ИИ и робототехники? На нашей подборке лучших курсов по искусственному интеллекту вы найдете образовательные программы от ведущих платформ, помогающие освоить актуальные навыки — от базового программирования до глубокого обучения и нейронных сетей. Это отличная отправная точка для тех, кто хочет стать частью технологической революции, которую представляют такие инновации, как Gemini Robotics.

Откройте для себя новый уровень онлайн-шопинга с обновленным Google Shopping
Google обновил Google Shopping, добавив искусственный интеллект для персонализации покупок. Включены новые функции: персональные рекомендации, виртуальные примерочные и AR-технологии.

Как создать эффективный сайт в 2025 году: Nethouse приглашает на бесплатный вебинар
Какой сайт считается эффективным в 2025 году? Разбираем на бесплатном вебинаре с экспертом платформы Nethouse — от трендов до готовых решений.

Anthropic и Mistral запустили бесплатные курсы по машинному обучению
В начале 2024 года ведущие IT-компании, включая Anthropic и Mistral создали платформу Parlance Lab для бесплатного обучения машинному обучению и нейросетям. Более 25 интерактивных уроков охватывают важные темы, включая файн-тюнинг и промпт-инжиниринг.