Google 正式推出「Gemini 3」!登顶全球最聪明 AI 模型,有什么亮点?
谷歌(Google)宣布正式推出其最新一代大语言模型「Gemini 3」,官方定位为有史以来最聪明的 Gemini。
(前情提要:Grok4智力比分赢了OpenAI o3和Gemini 2.5 Pro!多元竞争转战政治面?)
(背景补充:Gemini 3 要来了?X 上爆料频传,性能传超越 GPT-5 和 Grok 4)
本文目录
科技巨头谷歌(Google)在台湾时间 11 月 19 日凌晨发布公告,宣布正式推出其最新一代大语言模型「Gemini 3」,这是继去年底 Gemini 1、今年初 Gemini 2 之后,谷歌在短短两年内推出的第三代旗舰 AI 模型,也让市场期待已久。
谷歌高层:已从「读懂文字」进化到「读懂情境」
谷歌执行长 Sundar Pichai 在公告中表示,Gemini 系列已累积超过 6.5 亿月活跃用户、20 亿人次使用 AI Overviews,并有 1,300 万开发者采用。他强调,Gemini 3 不仅是参数与速度的升级,更代表 AI 从被动回答迈向「主动理解意图与情境」的关键转折。
同时,Google DeepMind 执行长 Demis Hassabis 也直言:「Gemini 3 是目前全球多模态理解能力最强的模型,也是我们最强大的代理模型。」
Gemini 3 主要进步一览
根据官方公布的技术报告与即时上线产品,Gemini 3 目前亮点包括:
1. 推理能力大幅跃进
- LMArena 排行榜突破 1501 Elo,位居第一
- GPQA Diamond 达 91.9%、Humanity’s Last Exam 37.5%(无工具)
- 数学难题 MathArena Apex 创下 23.4% 新纪录
- 推出「Deep Think」模式后,GPQA Diamond 进一步提升至 93.8%
2. 多模态理解全面领先
- MMMU-Pro 81%、Video-MMMU 87.6%
- 可一次处理文字、图片、影片、音讯与程式码,上下文长度达 100 万 token
3. 代理与开发者体验全面升级
- SWE-bench Verified 76.2%、WebDev Arena 1487 Elo
- 全新代理优先开发平台「Google Antigravity」同步上线,让 AI 代理可直接操作编辑器、终端机与浏览器
- 支援 Cursor、GitHub、Replit 等第三方工具即时接入
4. 日常应用场景大幅扩展
- 可把家族手写食谱翻译并整理成电子食谱书
- 分析运动比赛影片后自动生成训练计画
- 搜寻中的「AI Mode」即日起搭载 Gemini 3,提供即时互动式视觉化与模拟工具
即日起分阶段上线
- 一般使用者:Gemini App 与搜寻中的 AI Mode 立即可用(Pro/Ultra 订阅者优先)
- 开发者:Google AI Studio、Vertex AI、Google Antigravity 已开放 Gemini 3 Pro 预览版
- 企业用户:Vertex AI 与 Gemini Enterprise 同步上线
- 「Gemini 3 Deep Think」模式完成安全评估后,数周内开放给 Google AI Ultra 订阅者
谷歌强调,Gemini 3 已完成史上最严格的安全测试,并与英国 AISI 等机构合作进行第三方评估。这次发布被视为谷歌在 2025 年底前的最后一波重磅 AI 更新,也让与 OpenAI、Anthropic、xAI 等厂商的顶尖模型竞争进入新一轮白热化阶段。