Главная » Новости ИИ » Google запускает модели Gemma 4 с открытыми весами для edge- и локального ИИ

Google запускает модели Gemma 4 с открытыми весами для edge- и локального ИИ

by Redactor
06.04.2026
1 min read
57 Views

Share on:

Редакция Ainformer | 6 апреля 2026

Google представила открытые модели Gemma 4 — новое семейство моделей с открытыми весами, предназначенных для работы на edge-устройствах, локальных ПК и в агентных сценариях. Линейка включает четыре модели и отражает усиление стратегии компании в сторону запуска ИИ ближе к пользователю — на смартфонах, рабочих станциях и в офлайн-среде.

По данным Google, модели построены на базе исследований Gemini 3 и распространяются по лицензии Apache 2.0, что позволяет использовать их в коммерческих проектах и кастомных решениях. Этот запуск показывает смещение фокуса от облачного ИИ к практическим сценариям локального развертывания.

Модели Gemma 4 на edge-устройствах и локальном оборудовании — Gemma 4 ориентирована на локальный ИИ и выполнение моделей непосредственно на устройствах.

Что именно анонсировала Google

Google представила Gemma 4 2 апреля 2026 года, назвав это семейство самым мощным среди своих открытых моделей на текущий момент. Линейка ориентирована на баланс производительности, эффективности и возможности запуска на разном железе.

В состав входят четыре модели:

Модель	Тип	Основное применение	Целевое оборудование
E2B	Оптимизированная	Мобильный ИИ, лёгкие приложения	Смартфоны, edge-устройства
E4B	Оптимизированная	Локальные ассистенты, мультимодальные задачи	Edge-системы, Raspberry Pi
26B MoE	Mixture of Experts	Рассуждение, кодинг	Потребительские GPU
31B Dense	Dense	Качество вывода, дообучение	Рабочие станции, H100

Агентные сценарии и мультимодальность

Одним из ключевых направлений Gemma 4 стали агентные сценарии — модели способны выполнять многошаговые задачи с использованием function calling, структурированных JSON-ответов и системных инструкций.

Поддержка мультимодальности также является базовой функцией. Все модели работают с изображениями и видео, а младшие версии дополнительно поддерживают аудио-вход.

Контекстное окно увеличено до 128K токенов для edge-моделей и до 256K для старших, что позволяет обрабатывать длинные документы и сложные цепочки задач.

Техническое позиционирование

Google делает акцент на доступности запуска. По данным компании, старшие модели могут работать на одном GPU NVIDIA H100 в формате bfloat16, а квантованные версии — на потребительских видеокартах.

Модель 26B использует архитектуру Mixture of Experts для повышения эффективности, тогда как 31B Dense ориентирована на стабильность и качество генерации.

Младшие модели оптимизированы для офлайн-работы и низкой задержки на edge-устройствах, что снижает зависимость от облачных сервисов.

Почему это важно

Gemma 4 отражает сдвиг в использовании ИИ — от облачных сервисов к локальному запуску. Это позволяет снижать задержку, повышать уровень конфиденциальности и уменьшать затраты на инфраструктуру.

локальные ассистенты
офлайн-приложения
edge AI решения
инструменты для разработчиков

Запуск также показывает, что Google интегрирует открытые модели в свою экосистему, включая Android и инструменты для edge-разработки.

Мнение Ainformer

Практически это не просто релиз новой модели, а изменение подхода к развертыванию ИИ. Основной акцент смещается с “насколько модель мощная” на “где она может работать”.

Если edge-модели покажут стабильную работу в реальных приложениях, это может снизить зависимость от API и ускорить развитие локального ИИ.