Google сделала новый крупный шаг в гонке искусственного интеллекта, представив модель Gemini 3. В компании её называют самым продвинутым инструментом для рассуждений и мультимодального анализа. Фактически, это центральный элемент новой эпохи «агентного» ИИ — систем, которые действуют более автономно, глубоко взаимодействуют с пользователем и умеют решать задачи в несколько шагов.

Gemini 3 уже интегрирована в широкий набор продуктов Google — от потребительских сервисов до инструментов для разработчиков. По словам генерального директора Сундара Пичая, за два года существования семейства Gemini им пользуются свыше 650 миллионов человек ежемесячно, а AI Overviews в поиске привлекают более 2 миллиардов пользователей.
Прорыв в рассуждениях и понимании контекста
Что такое Gemini 3? Это новая версия модели, в которой Google усилила способности к логическим операциям и интерпретации различных типов данных. Версия Gemini 3 Pro превосходит предшественника 2.5 Pro по всем ключевым ИИ-бенчмаркам. Модель возглавила LM Arena Leaderboard с результатом Elo 1501 и показала уровень рассуждений, сравнимый с PhD-студентами, в тестах Humanity’s Last Exam и GPQA Diamond.
Но главное — серьёзное развитие мультимодального анализа. Gemini 3 уверенно обрабатывает текст, изображения, видео и графики, достигая 81% на MMMU-Pro и 87,6% на Video-MMMU. В тесте SimpleQA Verified модель получила 72,1% — важный показатель фактической точности.
Google подчеркивает: новые ответы стали «умнее, яснее и содержательнее». Модель умеет мгновенно визуализировать сложные научные идеи при помощи кода и даже создавать интерактивные обучающие материалы.
Режим Deep Think
Одновременно компания представила Gemini 3 Deep Think — расширенный режим, в котором модель использует ещё более сложные алгоритмы рассуждений. В тестах он установил рекорды: 45,1% на ARC-AGI-2 с выполнением кода, 93,8% на GPQA Diamond и 41% на Humanity’s Last Exam.
Этот режим предназначен для действительно новых и нестандартных задач — тех, где требуется не просто анализ, а полноценный синтез идей.
Как устроена технология
Одним из ключевых улучшений стала способность работать с огромными объёмами контекста. Gemini 3 анализирует длинные видео, расшифровывает рукописные записи, пишет код для интерактивных карточек или даже объясняет стратегию по кадрам любительского матча по питчеболу (pickleball).
Ещё одна важная черта — мультилингвальность. Модель уверенно работает с текстами на разных языках, что делает её универсальным инструментом для создания контента и обучения.
Зачем это нужно?
Google делает ставку на «агентный ИИ» — системы, которые не просто отвечают на вопросы, а выполняют задачи. В связке с Gemini 3 компания запускает платформу Google Antigravity — среду разработки, где ИИ-агенты получают прямой доступ к редактору кода, терминалу и браузеру. Это позволяет им выполнять сложные операции автономно, последовательно переходя от шага к шагу.
Gemini 3 уже стала лидером WebDev Arena, достигла 54,2% на Terminal-Bench 2.0 и установила рекорд в SWE-bench Verified — 76,2%.
По словам Пичая, Gemini 3 объединяет все сильные стороны семейства моделей и позволяет «воплощать любую идею». Она лучше распознаёт намерения пользователя, точнее интерпретирует запросы и помогает быстрее добиваться результата.
С сегодняшнего дня Gemini 3 разворачивается в приложении Gemini, в поисковом AI Mode, в AI Studio, через Gemini CLI, в Vertex AI и в платформе Antigravity. Google обещает, что вскоре представит дополнительные версии в рамках серии.
Gemini 3 — это не просто обновление, а серьёзный технологический скачок. Google стремится создать ИИ, который будет работать не как инструмент, а как полноценный цифровой помощник, способный к глубокой аналитике, самостоя-тельным действиям и работе с любыми типами данных. И, похоже, эта цель уже стала ближе.
