小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本、开源权重,凭MoE与MuonClip等优化,在...

2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本 、开源权重 ,凭MoE与MuonClip等优化 ,在SWE-Bench与BrowseComp等基准追平或超越GPT-5,并以更低API价格与本地部署撬动市场预期,促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

2025年以前 ,AI界盛行着一种信念:只有闭源 、巨额投入和疯狂堆算力才能打造最强大的模型 。

OpenAI作为这一思路的旗手,不仅将模型训练秘而不宣,更与合作伙伴绘制了高达1.4万亿美元的基础设施蓝图 。

八年内烧掉1.4万亿美元来构建数据中心 ,被视作确保领先的唯一途径。

在这种思维下,OpenAI旗舰模型的研发成本节节攀升:据报道,训练GPT-4就花费了约1亿美元。

闭源+重资本模式一度令人信服 ,OpenAI因此获得了天价估值和汹涌资本支持 。

然而,这一「用钱砸出智能」的神话,正随着一系列意料之外的挑战而动摇。

信念的第一次动摇 ,DeepSeek-R1横空出世

今年年初,一家彼时名不见经传的中国初创公司深度求索掀起了巨浪。

它发布的DeepSeek-R1模型不仅开源,而且号称性能可与OpenAI顶级模型比肩 。

更令人瞠目的是 ,DeepSeek宣称训练这款模型只花了约560万美元 ,连旧金山一套像样的房子都买不起。

这个成本数字相比业内普遍认为的「烧钱」级别相差悬殊,仅为Meta开发Llama模型成本的约十分之一。

事实证明,这并非夸夸其谈 。

DeepSeek-R1发布后一周内 ,DeepSeek App下载量迅猛攀升,一举超越ChatGPT,登顶美国苹果App Store免费榜。

一款开源AI应用在美国用户中的受欢迎程度超过了OpenAI的王牌产品 ,这一幕令业界震惊。

DeepSeek以微薄成本实现高性能,直接质疑了开发AI必须投入天量资金和算力的传统观念 。

华尔街对此反应剧烈,微软和谷歌股价应声下挫 ,而AI芯片巨头英伟达的市值甚至蒸发了约17%,相当于约6000亿美元。

资本市场用脚投票,开始重新审视AI赛道的投入产出模型:烧钱打造封闭模型的路线 ,或许并非高枕无忧的康庄大道。

开源低成本路线的核弹,Kimi K2 Thinking震撼登场

DeepSeek年初点燃的星星之火尚未平息,中国另一家初创公司月之暗面在年末投下了一枚震撼弹 。

本周 ,月之暗面发布了最新的开源巨模型Kimi K2 Thinking(以下简称K2 Thinking) ,以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5 。

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

要知道,GPT-5可是闭源巨头最先进的成果之一 ,而K2 Thinking仅用几百万美元训练,却在高难度推理和编码测试上正面较量并拔得头筹。

K2 Thinking在综合编程挑战「SWE-Bench Verified」上取得了71.3%的通过率,略高于GPT-5的成绩 ,甚至在复杂网页搜索推理任务BrowseComp上,以60.2%对54.9%的得分大幅领先GPT-5。

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

这些数字宣示了一个历史拐点:开源模型与顶级闭源模型之间性能鸿沟的实质性塌陷 。

K2 Thinking的问世标志着开源免费模型在高端推理和编码能力上与封闭系统平起平坐 ,这一点在过去几乎难以想象。

而实现这一壮举,月之暗面投入的算力成本据传约为460万美元,比起OpenAI宏图中的万亿投入 ,几乎可忽略不计。

一边是几百万美元造就的开放奇迹,另一边是幻想烧钱万亿的巨无霸帝国,鲜明对比令人不禁怀疑:AI行业过去坚持的大投入逻辑 ,难道真的站不住脚了?

技术路径的胜利 ,巧用架构胜过砸钱堆料

K2 Thinking并非魔法横空出世,而是技术路线差异带来的成本逆袭 。

传统的GPT-5这类闭源模型采用的是「通用大脑」式架构,每个参数对每个输入都会发动运算 ,因而模型越大推理开销越惊人。

K2 Thinking则采用混合专家架构,将庞大模型划分为384个专长各异的专家模块。

每次仅有8个专家(外加1个通用专家)被激活参与计算,相当于只动用320亿参数来解决特定问题 。

换言之 ,K2-Thinking拥有一个「万智百宝箱」,每个token只调用其中不到3.5%的智力,却能享受近似万亿参数的知识储备。

这一架构设计让K2 Thinking在推理时既聪明又节省:「大而不笨重」。

架构优化带来的成本效率提升达百倍之多 ,令人叹为观止 。

更关键的是,月之暗面研发了名为「MuonClip」的自定义优化器,在训练过程中自动稳压梯度 ,成功杜绝了超大模型常见的梯度爆炸和损失发散问题。

Kimi-K2在长达15.5万亿token的训练中实现了「零训练崩溃」,无需人为中途干预重启,这意味着即使资金设备相对有限的团队也能可靠地训练超大模型。

DeepSeek也在工程上强调「强化学习后训练」等高效策略 ,使得小团队得以攀登AI高峰 。

这些技术路径上的创新 ,等于是用聪明才智破解了过去只有砸钱才能解决的难题 。

曾经只有巨头烧钱才能铺就的康庄大道,如今民间高手另辟蹊径,用技术巧思抄了近路。

开源风暴的经济学冲击

当技术壁垒被攻克 ,开源路线在经济层面的优势便愈发凸显。

K2 Thinking的模型权重可在相应许可证条款下自由下载部署 。

这与OpenAI等闭源模式形成鲜明对比,它们的模型被封藏于云端,只能通过昂贵API租用它们的大脑。

以K2 Thinking为例 ,其官方提供的API价格是每百万输入token收费4元(命中缓存时更低至1元)、输出token16元。

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

相比之下,OpenAI的GPT-5 API价格约为每百万输入token收1.25美元(约9元) ,输出token高达10美元(约71元) 。

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

换算下来,同样百万token的处理 ,K2 Thinking的费用仅为GPT-5的十分之一不到。

对开发者和企业而言,这无疑极具诱惑力,更何况K2完全可以本地部署 ,不愿付API费的话 ,大可以自建服务。

正因如此,我们已看到市场正在迅速响应:越来越多AI工具和平台开始集成K2 Thinking模型,许多开发者在社区分享如何用K2 Thinking微调自定义应用 。

DeepSeek-R1发布后 ,其MIT开源权重更是被无数开源社区下载、魔改,用于各种插件和研究项目。

小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」

甚至政府机构和大型企业也开始重新考虑 ,与其斥资购买封闭模型的算力配额,不如采用开源模型作为基础,掌控自主可控的AI能力——尤其当这些开源模型已经足够好且成本低廉。

这种用脚投票的风向转变 ,不仅出现在技术圈,更在资本圈引发连锁反应:OpenAI此前天价的数据中心投资承诺,正面对质疑和压力 。

OpenAI高管甚至在公共场合暗示需要政府贷款支持 ,事后又忙不迭出来「灭火」澄清不寻求政府背书,以平息外界对其烧钱计划的担忧。

当巨头为融资「续命」四处游说时,开源对手们正用实际成绩证明 ,也许根本不需要那么多钱 ,也能把事情办成。

行业叙事的改写与泡沫的冷却

DeepSeek和Kimi K2 Thinking带来的并非单纯的「追赶」,而更像是一场对旧路线的证伪 。

过去,封闭巨头们的护城河建立在一种假设之上:只有不断投入数量级增长的资金和算力 ,才能保持模型性能的领先 。

这一假设曾让OpenAI们在资本市场上如日中天,甚至形成了某种估值泡沫,AI公司和底层芯片厂商的价值被无限推高 ,因为所有人相信烧钱会带来奇迹。

然而当开源挑战者以区区百万量级美元达到同类水准,这个故事的结局便不再那么线性。

事实证明,「性能领先的最后20%」或许并非大多数用户真正需要的 ,尤其如果为此要付出十倍乃至百倍的价格 。

从普通消费者到中小企业,更青睐的是「够用+便宜」的实惠。

OpenAI等公司无疑依然握有行业顶尖的研究人才和技术积累,但他们再难宣称自己的路线是「唯一正确且必不可少」的。

行业叙事正在转向:与其痴迷于砸钱堆出更大模型 ,不如在架构创新和工程稳定性上下功夫,以换取成本效率和开放生态 。

投资者也日趋清醒,过去见谁谈AI就砸钱的狂热减退了许多 ,现在更关注实际效能和商业可行性。

最危险的对手 ,不是那个跟你拼烧钱的人,而是那个证明根本不需要烧那么多钱的人。

参考资料

Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力

DeepSeek-R1 发布 ,性能对标 OpenAI o1 正式版

本文来自微信公众号“新智元”,作者:艾伦,36氪经授权发布 。

本文来自作者[姿妮]投稿,不代表视听号立场,如若转载,请注明出处:https://www.stddy.com/keji/202511-57193.html

(13)

文章推荐

  • 那尔那茜官方通报后,72小时内竟连遭4个噩耗,演艺生涯要凉透?

    6月21日晚,对于演员那尔那茜来说,无疑是噩梦的开始。内蒙古自治区联合工作组的一纸通报,将她的过往黑料彻底曝光。而在通报后的短短72小时内,她接连遭遇四个重大噩耗,演艺生涯似乎已岌岌可危。第一个噩耗,无疑是品牌方的火速切割。原本与那尔那茜合作的众多品牌,纷纷开启“紧急避险模式”。阿迪达斯秒删合作物料

    2025年06月24日
    106
  • 打哈儿麻将原来真的有挂呢(确实有挂)(打哈儿麻将怎么玩)

    哈儿麻将怎么设置女声〖壹〗、首先打开哈儿麻将游戏,进入游戏主页面。其次在页面中点击设置,进入设置页面中。最后在页面中点击声音,点击女声即可完成设置。〖贰〗、在桌面上右击,选取个性化;在弹出的窗口中,选取桌面背景;选取设置的壁纸,之后只勾选上想设置的壁纸,点击保存需”即可,此时图片就不会在切换了即就

    2025年08月28日
    110
  • 实测结果“手机打麻将软挂(专用辅牌神器免安装)

    这软件超神了!微乐斗地主骗局大揭秘(插件可信吗)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐斗地主骗局大揭秘是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以

    2025年09月01日
    62
  • 玩家必看攻略“陕麻圈到底有没有外挂(助赢神器通用版)

    神器实力强劲!微乐龙江麻将漏宝神器(如何提高胜率)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐龙江麻将漏宝神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可

    2025年09月07日
    58
  • 实测分享“微乐麻将怎么看对方有没有猫腻(助赢神器通用版)

    软件神器称王!开心跑得快辅助神器(怎么调胜率)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”开心跑得快辅助神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微

    2025年09月15日
    50
  • 玩家实测“手机麻将助赢神器(专用辅牌神器免安装)

    软件神器超燃!微乐浙江麻将辅助器脚本(怎么能得到好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐浙江麻将辅助器脚本是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的

    2025年09月18日
    52
  • 挖出戴手铐的女遗骨,鉴定后确定,她就是中央苦苦寻找的人!

    1975年,重庆歌乐山的蝉鸣被一声惊呼声斩断。铁锹挖出的大坑内,一具女性尸骨赫然显露出来。湿润的泥土裹着两节泛青的腕骨,骨头上缠着铁质手铐早已锈成褐红色,像一道嵌入生命里的枷锁。森森的白骨在阳光的照耀下反射出刺目的光,这具遗骨,与档案馆里那份寻找多年未果的失踪者记录,悄然对上了暗号。历经反复核查与审

    2025年09月21日
    52
  • 玩家实测“微乐山西麻将斗地主有挂吗(专用辅牌神器免安装)

    软件神器称王!微乐四川麻将助赢神器(输赢跟id号有关系吗)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐四川麻将助赢神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要

    2025年09月27日
    49
  • 军报这句话,说到咱心坎里了!军中容不得半个腐败分子

    刷到军报今天发的评论,有一句话特别提气:“军中绝不能有腐败分子藏身之地!”读着像唠家常,可字字都砸在关键处。咱普通老百姓可能不懂啥叫“军队肌体纯洁性”,但都明白一个理儿——当兵的是拿枪杆子的,要是队伍里有“蛀虫”,那不是自己人拆自己台吗?前几年看反腐新闻,多少曾经穿军装的“老虎”“苍蝇”被查,老百姓

    2025年10月24日
    37
  • 高考288分女生的贪念和扁担女孩的淡泊,两个人生极点,令人唏嘘

    最近,有一个事件备受关注,有一位女孩高考查出考了288分,不悲伤,反而全家欢庆,如此反常的举动引发巨大关注,本来这是一个很正常的查分流程,不管分数高低,自己知道就好,然后再根据分数的高低,做出不同的选择。但正是这个考了288分的女孩,上升到了舆论争议的焦点,刚开始,风评很好,各大媒体都在夸赞这个高考

    2025年06月30日
    106

发表回复

本站作者后才能评论

评论列表(4条)

  • 姿妮
    姿妮 2025年11月11日

    我是视听号的签约作者“姿妮”!

  • 姿妮
    姿妮 2025年11月11日

    希望本篇文章《小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」》能对你有所帮助!

  • 姿妮
    姿妮 2025年11月11日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 姿妮
    姿妮 2025年11月11日

    本文概览:2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本、开源权重,凭MoE与MuonClip等优化,在...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们