Новости ИИ

Google запускает модели Gemma 4 с открытыми весами для edge- и локального ИИ

Share on:

Редакция Ainformer | 6 апреля 2026

Google представила открытые модели Gemma 4 — новое семейство моделей с открытыми весами, предназначенных для работы на edge-устройствах, локальных ПК и в агентных сценариях. Линейка включает четыре модели и отражает усиление стратегии компании в сторону запуска ИИ ближе к пользователю — на смартфонах, рабочих станциях и в офлайн-среде.

По данным Google, модели построены на базе исследований Gemini 3 и распространяются по лицензии Apache 2.0, что позволяет использовать их в коммерческих проектах и кастомных решениях. Этот запуск показывает смещение фокуса от облачного ИИ к практическим сценариям локального развертывания.

Модели Gemma 4 на edge-устройствах и локальном оборудовании
Gemma 4 ориентирована на локальный ИИ и выполнение моделей непосредственно на устройствах.

Что именно анонсировала Google

Google представила Gemma 4 2 апреля 2026 года, назвав это семейство самым мощным среди своих открытых моделей на текущий момент. Линейка ориентирована на баланс производительности, эффективности и возможности запуска на разном железе.

В состав входят четыре модели:

МодельТипОсновное применениеЦелевое оборудование
E2BОптимизированнаяМобильный ИИ, лёгкие приложенияСмартфоны, edge-устройства
E4BОптимизированнаяЛокальные ассистенты, мультимодальные задачиEdge-системы, Raspberry Pi
26B MoEMixture of ExpertsРассуждение, кодингПотребительские GPU
31B DenseDenseКачество вывода, дообучениеРабочие станции, H100

Агентные сценарии и мультимодальность

Одним из ключевых направлений Gemma 4 стали агентные сценарии — модели способны выполнять многошаговые задачи с использованием function calling, структурированных JSON-ответов и системных инструкций.

Поддержка мультимодальности также является базовой функцией. Все модели работают с изображениями и видео, а младшие версии дополнительно поддерживают аудио-вход.

Контекстное окно увеличено до 128K токенов для edge-моделей и до 256K для старших, что позволяет обрабатывать длинные документы и сложные цепочки задач.

Техническое позиционирование

Google делает акцент на доступности запуска. По данным компании, старшие модели могут работать на одном GPU NVIDIA H100 в формате bfloat16, а квантованные версии — на потребительских видеокартах.

Модель 26B использует архитектуру Mixture of Experts для повышения эффективности, тогда как 31B Dense ориентирована на стабильность и качество генерации.

Младшие модели оптимизированы для офлайн-работы и низкой задержки на edge-устройствах, что снижает зависимость от облачных сервисов.

Почему это важно

Gemma 4 отражает сдвиг в использовании ИИ — от облачных сервисов к локальному запуску. Это позволяет снижать задержку, повышать уровень конфиденциальности и уменьшать затраты на инфраструктуру.

  • локальные ассистенты
  • офлайн-приложения
  • edge AI решения
  • инструменты для разработчиков

Запуск также показывает, что Google интегрирует открытые модели в свою экосистему, включая Android и инструменты для edge-разработки.

Мнение Ainformer

Практически это не просто релиз новой модели, а изменение подхода к развертыванию ИИ. Основной акцент смещается с “насколько модель мощная” на “где она может работать”.

Если edge-модели покажут стабильную работу в реальных приложениях, это может снизить зависимость от API и ускорить развитие локального ИИ.

Доступность

Gemma 4 уже доступна через Google AI Studio, AI Edge Gallery, Hugging Face, Kaggle и Ollama.

Ключевой показатель — реальное внедрение в продукты, а не только экспериментальное использование.

Источники