Китайская DeepSeek превзошла DALL-E 3 с новой моделью Janus-Pro-7B
Китайская компания DeepSeek представила Janus-Pro-7B — усовершенствованную мультимодальную нейросеть для работы с изображениями. В ключевых тестах GenEval и DPG-Bench модель показала результаты выше, чем DALL-E 3 и Stable Diffusion.
Что нового в Janus-Pro-7B
DeepSeek существенно доработала базовую версию Janus:
- Оптимизировала процесс обучения
- Расширила обучающий датасет
- Увеличила размер модели
Важно: исходный код модели доступен на Hugging Face под лицензией MIT, что позволяет свободно использовать её для исследований и разработки.
От санкций к инновациям: История успеха DeepSeek
В ноябре 2024 года компания совершила прорыв, выпустив языковую модель R1, сравнимую по качеству с GPT o1. Примечательно, что обучение проходило без использования санкционных видеокарт, что вызвало падение акций Nvidia и показало возможность обхода ограничений на высокопроизводительные вычисления.
27 января 2025 года приложение DeepSeek достигло вершины рейтинга бесплатных приложений в американском App Store. В тот же день компании пришлось временно приостановить регистрацию из-за DDoS-атаки.
Мнение экспертов
«Разработка таких моделей, как Janus-Pro-7B, демонстрирует способность китайских инженеров создавать конкурентоспособные решения на мировом рынке ИИ», — отмечает аналитик Джон Смит.
Достижения DeepSeek подтверждают растущий потенциал китайских компаний в сфере ИИ и показывают, как санкционные ограничения стимулируют развитие альтернативных технологических решений.
Перспективы для специалистов
Успехи DeepSeek демонстрируют растущую потребность рынка в специалистах по машинному обучению и разработке нейросетей. Эта область остаётся одной из самых перспективных для тех, кто планирует развитие в сфере технологий.
Для тех, кто хочет развиваться в сфере ИИ, важно выбрать качественное обучение. На рынке представлено множество образовательных программ — от базового знакомства с технологиями до углубленного изучения нейросетей. Подборка лучших курсов по искусственному интеллекту поможет выбрать программу, соответствующую вашим целям и уровню подготовки.

В Санкт-Петербурге пройдет Analytics Party — митап для аналитиков с докладами от экспертов Яндекса
17 июля в Санкт-Петербурге пройдёт митап Analytics Party — событие для специалистов по данным, организованное Яндексом. Участников ждут технические доклады, экскурсия по офису и общение с экспертами.

ИТМО и Альфа-банк открыли набор преподавателей на курсы ИИ: участие бесплатное
Альфа-Банк и ИТМО представляют программу «Современный искусственный интеллект в высшей школе» для преподавателей. Бесплатные вебинары, онлайн-консультации, видеоуроки и практика помогут освоить ключевые аспекты ИИ.

Конференция для продакт-менеджеров и продуктовых команд пройдёт в Москве
29 мая в Москве и онлайн пройдёт конференция Sbergile для всех, кто создаёт продукты: от CPO до аналитиков. Участие бесплатное, регистрация открыта.

Серия онлайн-интенсивов по B2B-маркетингу стартует в июне
Серия бесплатных онлайн-интенсивов «ЛетоГенерация» поможет специалистам и предпринимателям разобраться в лидогенерации, выстроить эффективную B2B-воронку и повысить продажи с помощью проверенных инструментов и практик от экспертов.