Редакция Ainformer | 6 апреля 2026
Google представила открытые модели Gemma 4 — новое семейство моделей с открытыми весами, предназначенных для работы на edge-устройствах, локальных ПК и в агентных сценариях. Линейка включает четыре модели и отражает усиление стратегии компании в сторону запуска ИИ ближе к пользователю — на смартфонах, рабочих станциях и в офлайн-среде.
По данным Google, модели построены на базе исследований Gemini 3 и распространяются по лицензии Apache 2.0, что позволяет использовать их в коммерческих проектах и кастомных решениях. Этот запуск показывает смещение фокуса от облачного ИИ к практическим сценариям локального развертывания.

Что именно анонсировала Google
Google представила Gemma 4 2 апреля 2026 года, назвав это семейство самым мощным среди своих открытых моделей на текущий момент. Линейка ориентирована на баланс производительности, эффективности и возможности запуска на разном железе.
В состав входят четыре модели:
| Модель | Тип | Основное применение | Целевое оборудование |
|---|---|---|---|
| E2B | Оптимизированная | Мобильный ИИ, лёгкие приложения | Смартфоны, edge-устройства |
| E4B | Оптимизированная | Локальные ассистенты, мультимодальные задачи | Edge-системы, Raspberry Pi |
| 26B MoE | Mixture of Experts | Рассуждение, кодинг | Потребительские GPU |
| 31B Dense | Dense | Качество вывода, дообучение | Рабочие станции, H100 |
Агентные сценарии и мультимодальность
Одним из ключевых направлений Gemma 4 стали агентные сценарии — модели способны выполнять многошаговые задачи с использованием function calling, структурированных JSON-ответов и системных инструкций.
Поддержка мультимодальности также является базовой функцией. Все модели работают с изображениями и видео, а младшие версии дополнительно поддерживают аудио-вход.
Контекстное окно увеличено до 128K токенов для edge-моделей и до 256K для старших, что позволяет обрабатывать длинные документы и сложные цепочки задач.
Техническое позиционирование
Google делает акцент на доступности запуска. По данным компании, старшие модели могут работать на одном GPU NVIDIA H100 в формате bfloat16, а квантованные версии — на потребительских видеокартах.
Модель 26B использует архитектуру Mixture of Experts для повышения эффективности, тогда как 31B Dense ориентирована на стабильность и качество генерации.
Младшие модели оптимизированы для офлайн-работы и низкой задержки на edge-устройствах, что снижает зависимость от облачных сервисов.
Почему это важно
Gemma 4 отражает сдвиг в использовании ИИ — от облачных сервисов к локальному запуску. Это позволяет снижать задержку, повышать уровень конфиденциальности и уменьшать затраты на инфраструктуру.
- локальные ассистенты
- офлайн-приложения
- edge AI решения
- инструменты для разработчиков
Запуск также показывает, что Google интегрирует открытые модели в свою экосистему, включая Android и инструменты для edge-разработки.
Мнение Ainformer
Практически это не просто релиз новой модели, а изменение подхода к развертыванию ИИ. Основной акцент смещается с “насколько модель мощная” на “где она может работать”.
Если edge-модели покажут стабильную работу в реальных приложениях, это может снизить зависимость от API и ускорить развитие локального ИИ.
Доступность
Gemma 4 уже доступна через Google AI Studio, AI Edge Gallery, Hugging Face, Kaggle и Ollama.
Ключевой показатель — реальное внедрение в продукты, а не только экспериментальное использование.



