全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

幼琴 • 2025年11月19日 10:59 • 新闻资讯 • 阅读 51

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力 。

谷歌DeepMind研究团队称，这是全球最先进的多模态理解模型、谷歌最强大的Agent编程和氛围编程模型，能呈现更丰富的可视化效果和更深度的交互体验，且完全构建于最先进的推理技术基础之上。

该模型基于谷歌TPU进行训练，支持100万个token的上下文窗口，适用于需要以下功能的应用：Agent 、高级编程、长上下文、多模态理解、算法开发。

刚一发布，Gemini 3就几乎屠榜所有评测集，以1501 Elo得分位列LMArena大模型竞技场第一 。

OpenAI联合创始人、CEO萨姆·阿尔特曼（Sam Altman）和xAI创始人、CEO埃隆·马斯克（Elon Musk）纷纷向谷歌发来“贺信 ”。阿尔特曼发推评价“Gemini 3看起来很不错”，谷歌CEO桑达尔·皮查伊（Sundar Pichai）用了个表情包回复。

马斯克转发了谷歌DeepMind CEO戴密斯·哈萨比斯（Demis Hassabis）的推文称“干得不错” 。

今天起，谷歌将在以下平台部署Gemini 3：

适用于Gemini应用的所有用户，以及在搜索的AI模式中使用Google AI Pro和Ultra订阅服务的用户；适用于Gemini API中的开发者、谷歌全新Agent开发平台Antigravity的开发者，以及Gemini CLI的开发者；适用于Vertex AI平台与Gemini企业版的企业用户。

此外，谷歌将在未来几周向Google AI Ultra订阅者开放Gemini 3的深度思考模式，目前其还在进行安全评估。

对于Gemini 3的发布，皮查伊认为，这一模型可以让用户的任何想法变为现实。

01. 分分钟造出交互游戏、App

还能帮你学新知识

先来看下Gemini 3 Pro能做什么。

Gemini 3能编写托卡马克装置中等离子体流的可视化代码，并创作捕捉核聚变物理原理的诗歌。

如果用户想学习家族传统烹饪，Gemini 3可以解读并翻译不同语言的手写食谱，制作成可共享的家庭食谱。

如果用户想学习一个新话题，可以给Gemini 3输入学术论文、长视频讲座或教程，它还能生成交互式抽认卡、可视化或其他格式的代码，帮助用户掌握这些内容。

Gemini 3可以分析用户的匹克球比赛视频，找出可以改进的地方，并生成整体动作提升的训练计划。

AI搜索模式下，Gemini 3能学习复杂主题内容，如借助搜索功能中AI模式的生成式用户界面，学习像RNA聚合酶作用机制这类复杂知识点。值得一提的是，这也是谷歌首次在模型发布首日，就将新模型直接集成至AI搜索功能中。

Gemini 3可以编写拥有丰富可视化界面和互动性的复古3D飞船游戏。

该模型通过代码构建、解构和重新创作精细的3D体素艺术，能让用户的想象变为现实。

Gemini 3能使用着色器创建可玩的科幻世界。

其还可以生成更具实用性、元素丰富的互动性网页和App。

02. 屠榜评测集

刷新大模型能力天花板

再来看下Gemini 3 Pro的基准测试结果。

谷歌博客提到，Gemini 3 Pro在一系列基准测试中进行了评估，包括推理、多模态能力、Agent工具使用、多语言性能和长上下文，其在主要的AI基准测试中都远远优于Gemini 2.5 Pro，并以1501 Elo得分位列LMArena大模型竞技场第一 。

该模型展现出博士级推理能力，在“人类终极测试 ”（不使用任何工具情况下得分37.5%）和GPQA钻石级测试中均斩获最高分，在MathArena Apex测试中取得23.4%的最新顶尖成绩。

除了文本，Gemini 3 Pro在MMMU-Pro上获得了81%，在Video-MMMU上获得了87.6%的多模推理，在SimpleQA Verify上也获得了最高的72.1%。

这意味着Gemini 3 Pro能够以高度可靠性解决涵盖科学和数学等广泛主题的复杂问题。

Gemini 3的深度思考和多模态理解能力更新，可以帮助用户解决更复杂的问题。测试中，Gemini 3 Deep Think在“人类终极测试”（未使用工具时为41.0%）和GPQA Diamond（93.8%）中表现优于Gemini 3 Pro。它在ARC-AGI-2（代码执行，ARC奖项认证）上取得了45.1%的成绩，均超过谷歌自家前代模型，以及OpenAI、Anthropic的模型。

编程能力中，Gemini 3是谷歌迄今为止构建过的最佳氛围编程和Agent编程模型。

该模型以1487 Elo得分登顶WebDev竞技场排行榜。它在Terminal-Bench 2.0测试模型工具使用能力上，得分为54.2%，在衡量编程Agent能力的基准测试SWE-bench Verified上表现远超2.5 Pro。

开发者可以在Google AI Studio 、Vertex AI、Gemini CLI以及谷歌全新的代理开发平台Google Antigravity中使用Gemini 3进行构建。它还支持第三方平台，如Cursor、GitHub 、JetBrains、Manus、Replit等。

自Gemini 2以来，谷歌Gemini模型已经在Agent方面取得诸多进展，此次Gemini 3还登顶了Vending-Bench 2排行榜。该基准测试通过模拟自动售货机业务运营来考核模型的长期规划能力，其结果显示，Gemini 3 Pro在一整年的模拟运营中，始终保持稳定的工具使用和决策连贯性，既未偏离任务目标，又实现了更高收益 。

这意味着Gemini 3能帮助用户完成日常生活中的事务，如预约本地服务或整理收件箱等。

03. 全新Agent开发平台亮相

实现端到端软件开发自动化

今天谷歌还发布了全新的Agent开发平台Google Antigravity。

借助Gemini 3的高级推理、工具使用及Agent编程能力，谷歌Antigravity将AI辅助功能从开发者工具包里的一个工具，转变为积极主动的合作伙伴。

尽管谷歌Antigravity的核心仍是AI集成开发环境（AI IDE）体验，但其Agent已升级至专属界面，并能直接访问编辑器、终端和浏览器。如今，这些Agent可以自主规划并同步为开发者执行复杂的端到端软件任务，同时还能对自身代码进行验证。

除了Gemini 3 Pro ，Google Antigravity还将结合谷歌最新的Gemini 2.5 Computer Use模型，以及图像编辑模型Nano Banana。

谷歌Antigravity借助Gemini 3，为航班追踪应用打造了端到端的Agent工作流。该Agent能够自主规划、编写应用代码，并通过基于浏览器的计算机操作来验证其执行效果。

最后谷歌还提到，Gemini 3是其迄今为止最安全的模型，并且经历了谷歌AI模型中最全面的安全评估。模型评测结果显示，其谄媚行为减少，对即时注射的抵抗力增强，并提升了对网络攻击滥用的防护。

从2023年12月Gemini模型发布至今已近两年：Gemini 1在原生多模态和长上下文窗口上的突破，扩展了可处理信息的种类以及处理量；Gemini 2可帮助用户处理更复杂的任务和想法，使Gemini 2.5 Pro的排名在LMArena中领先超过六个月。

如今，谷歌基于Gemini模型的搜索功能AI Overviews月活用户达到20亿，Gemini应用月活用户超过6.5亿，超过70%的云端客户使用谷歌AI功能，1300万开发者用其生成模型构建了作品。

04. 结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

谷歌Gemini 3相比前几代模型性能大幅提升，可以感知用户提示词中的细微线索及复杂问题，还能理解用户请求的背景和背后意图，让用户用更少的提示获得所需信息。谷歌博客提到，在Gemini 3发布的下一个新篇章中，他们将继续突破智能、Agent和个性化的前沿，让AI真正惠及所有人。

随着Gemini 3正式亮相，加之谷歌此次免费开放其使用权限，一场围绕大模型的新一轮行业竞争已全面打响。

本文来自微信公众号“智东西”（ID：zhidxcom），作者：程茜，编辑：心缘，36氪经授权发布。

本文来自作者[幼琴]投稿，不代表视听号立场，如若转载，请注明出处：https://www.stddy.com/xinwen/202511-58816.html

51 4

本文作者

幼琴签约作者

444 文章

5236322 评论

1 粉丝

我是视听号的签约作者[幼琴],本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》主要讲述了:智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

生活经验

微乐山西麻将怎么提高胜率(揭秘手机上插件购买)/微乐山西麻将怎样免费开挂

微乐山西扣点麻将为什么限制玩的时间山西未成年时间限制。因为防止未成年沉迷游戏，就会被限制登录游戏。微乐是由福建一定火网络科技有限公司开发的基于智能手机运营的移动互联网营销平台，是一款集社交，商业，娱乐为一体的手机APP。防指未成年沉迷。微乐手机麻将是没有办法取消未成年时间限制的，除非是使用成年人的

忆海
2025年08月09日
177
知识分享

我来教大家“微乐江苏麻将专用神器（助赢神器通用版）

这软件超厉害啦!广西星悦麻将有没有内幕(怎么打会赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”广西星悦麻将有没有内幕是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有需要的用

五金帅
2025年08月30日
95
常识科普

馆藏光阴｜《藏海传》里的观天神器北京也有！古人如何观测天象丈量时光？

日前，电视剧《藏海传》热播，剧中的观天“神器”简仪，其实北京就有，它就在古观象台，这里可以近距离感受古人智慧的结晶。在北京市东城区建国门立交桥的西南侧，一座灰白色的砖砌高台静默伫立，与周边现代都市的喧嚣形成鲜明对比。这里，是北京古观象台博物馆——一座承载着中国六百年天文观测史的“活化石”，也是世界上

咎子睿
2025年09月24日
63
作者专栏

终于发现“微信小程序广东雀神辅助器免费（专用辅牌神器免安装）

软件神器无双!微乐山东麻将怎么才能常赢(怎么能让牌好一点)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐山东麻将怎么才能常赢是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有

凡筠
2025年09月27日
68
知识分享

玩家必看攻略“财神十三张辅助器”（详细透视教程）-今日头条

软件神器妙绝!花花生活圈辅助提高好牌几率(怎么控制输赢)“我们专注于各类软件定制开发，已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”花花生活圈辅助提高好牌几率是一款可以让一直输的玩家，快速成为一个“必胜”的ai辅助神器，有

凌晴
2025年10月09日
74
游戏攻略

属蛇人别错过！这个月两人将至，带来的绝非你所预期！

属蛇的六月运气有点怪，两个人突然找上门，网友说这事不寻常属蛇的这几天，反正日子不算平静。家门口早上七点半，楼下刚有快递小哥吆喝，电话就响了，说是老周，那个三年前帮过他一把的兄弟。老周开口就是，“我这边有个外包项目，做得好一个月能多拿五千，你要不要试试？”属蛇的一开始还以为又是哪种送保险的，没想

郭利强
2025年10月27日
60
知识分享

张家口一吊车失控追尾多车，警方深夜通报：系肇事车制动系统失灵引发，多车受损13人受伤

原标题：张家口一吊车失控追尾多车，警方深夜通报：系肇事车制动系统失灵引发，多车受损13人受伤，驾驶人贾某某被控制11月20日深夜，“张家口公安”公众号发布警情通报：2025年11月20日17时16分许，我市省道S231连接线路段，发生一起重型吊车碰撞前方等候信号灯车辆的交通事故，造成多车受损，13人

靖景川
2025年11月22日
43
作者专栏

亚洲首富小儿媳和大伯哥曝炸裂丑闻？多次含情脉脉牵手摸腰

最近，身价1103亿美元的亚洲首富，印度籍商人穆克什·安巴尼一家又出新八卦。之前我们讲过，去年刚过门的小儿媳拉蒂卡因为在红毯上和大伯哥过于亲密，被大嫂当面翻白眼。此事也成为印度国内热度最高的八卦之一。此后大批印度网友讨论吃瓜，扒出其实这两人从婚前就有很多超越亲情的“擦边”行为，并一一列了出来。在此事

赖东硕
2025年12月11日
30
游戏攻略

日本对中国的反击很猛，美国嗅到不寻常信号，做出了一个明智选择

果然不出我们所料：高市早苗完全没有对中国服软的打算，非但如此，她现在对中国的反击还贼猛，在这种情况下，美国嗅到了不寻常信号，做出了一个极为明智的选择。高市早苗的冒险在日本政坛，现任首相高市早苗正处于一个极度自信的阶段，她的国内支持率超过70%，让她仿佛拥有了免于所有警告的资本。这份高涨的民意支持给了

幼琴
2025年12月18日
36
作者专栏

女子产后被丈夫殴打后续：特殊原因流出，丈夫拒离婚，妇联已介入

男怕入错行，女怕嫁错郎。1月5日，河北张家口一名女子刚生完孩子55天，被丈夫殴打家暴的事情，在社交平台传的沸沸扬扬，想必不少网友也是有所耳闻。如果不是亲眼所见，很难想象竟然会有人对着自己同床共忱的妻子，下如此重手，不知道的还以为有多大仇。事到如今，女子已经提出了离婚，但被丈夫拒绝了，并且一直在求原谅

友菱
2026年01月07日
9

发表回复

本站作者后才能评论

评论列表（4条）

幼琴 2025年11月19日

我是视听号的签约作者“幼琴”！

回复
幼琴 2025年11月19日

希望本篇文章《全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好》能对你有所帮助！

回复
幼琴 2025年11月19日

本站[视听号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
幼琴 2025年11月19日

本文概览：智东西11月19日报道，今天凌晨，谷歌最强推理模型Gemini 3终于亮相，一个模型囊括了原生多模态、推理、Agent多种能力。谷歌DeepMind研究团队称，这是全球最先进的...

回复

全世界在等的Gemini 3终于来了，强到断崖领先，连马斯克OpenAI都夸好

01.

分分钟造出交互游戏 、App

还能帮你学新知识

02.

屠榜评测集

刷新大模型能力天花板

03.

全新Agent开发平台亮相

实现端到端软件开发自动化

04.

结语：免费开放+性能飙升！

Gemini 3搅动大模型竞争格局

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们

分分钟造出交互游戏、App