第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型,在被誉为全球最难的高中数学竞赛中达到了金牌水...

DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型 ,在被誉为全球最难的高中数学竞赛中达到了金牌水平,成为首个实现这一成就的开源模型,标志着开源人工智能在复杂推理能力上的一次重大突破。

昨日DeepSeek宣布推出其最新的数学推理模型DeepSeekMath-V2 ,该模型在模拟的2025年国际数学奥林匹克竞赛(IMO)中解决了6个问题中的5个 ,达到了金牌水平 。

这一成就使其成为第一个在IMO级别竞赛中获得金牌的开源模型,引发了AI研究和开发者社区的高度关注。

这一表现直接对标了行业巨头。就在今年7月,谷歌DeepMind的Gemini高级版本和一个来自OpenAI的实验性推理模型也达到了IMO 2025的金牌标准 ,同样解决了5个问题,它们是首批达到该水平的人工智能模型 。

然而,与谷歌和OpenAI的闭源实验模型不同 ,DeepSeekMath-V2的模型权重根据Apache 2.0许可证公开发布,可供公众下载 。

值得一提的是,DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”(verifier) ,其任务是评估证明过程的质量,而不是最终答案的对错。

而且为了防止模型过度拟合其自身的检查机制,DeepSeek通过增加计算量和自动标记难以验证的证明 ,来不断提升验证过程的难度,确保验证器与生成器同步进化 。

此举被视为人工智能民主化的重要一步。该模型的发布不仅证明了开源社区有能力在尖端AI研究领域追赶甚至比肩顶级闭源实验室,也可能再次引发了市场对于开源模型是否会侵蚀闭源产品商业护城河的讨论——这一话题曾一度动摇投资者对英伟达等AI巨头的信心。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

跻身顶尖行列:与OpenAI和谷歌同台竞技

DeepSeekMath-V2的卓越表现 ,标志着其在复杂的数学推理领域,与全球领先的AI实验室站在了同一起跑线上 。国际数学奥林匹克竞赛(IMO)通常被认为是全球难度最高的高中生数学竞赛,在2025年的竞赛中 ,630名人类参赛者中仅有72人获得金牌。

除了在IMO 2025取得的成就,该模型还在其他高难度数学竞赛中展现了顶级水平。据DeepSeek称,它在中国最顶尖的全国性竞赛——中国数学奥林匹克(CMO)中也达到了金牌水平 。

在面向大学本科生的普特南数学竞赛(Putnam 2024)中 ,该模型在12道题中完全解决了11道,另一道题也仅有微小错误,最终得分118/120 ,超过了人类参赛者90分的最高分记录。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

开源的里程碑:社区盛赞“了不起的发布”

与谷歌和OpenAI尚未公开的实验模型相比,DeepSeekMath-V2的核心吸引力在于其彻底的开放性。该模型的权重已在开源社区Hugging Face上发布 ,允许研究人员和开发者自由下载 。

Hugging Face的联合创始人兼首席执行官Clement Delangue在社交平台X上盛赞道:“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”

他补充说,“据我所知 ,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。 ”他强调 ,用户可以不受限制地探索 、微调、优化模型,并运行在自己的硬件上,“没有任何公司或政府可以收回它 。这是人工智能和知识民主化的最佳体现 。 ”

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

另一位网友elie也评论称:“DeepSeek Math V2是第一个在IMO上达到金牌水平的开源模型吗?而且我们还得到了技术报告,这真是一次了不起的发布。”

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!

还有网友评论称 ,他们喜欢 5-7 个想法,每个想法都相对简单,不断堆叠 ,结果出乎意料地越来越好,看起来更像工程而不是研究。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

自我验证框架:超越答案,关注推理过程

DeepSeek在技术报告中指出,近期的人工智能模型虽然擅长在数学基准测试中获得正确答案 ,但往往缺乏严谨的推理过程 。报告写道:“许多像定理证明这样的数学任务 ,需要严谨的逐步推导,而非仅仅一个数值答案。”

为了解决这一问题,DeepSeekMath-V2采用了一种创新的自我验证训练框架。该方法的核心是训练一个专门的“验证器 ”(verifier) ,其任务是评估证明过程的质量,而不是最终答案的对错 。随后,这个验证器被用作奖励模型 ,来引导一个独立的“证明生成器”(proof-generator)。只有当生成器成功识别并修复自身证明中的错误时,它才会获得奖励。

这种机制激励模型在最终确定答案之前,尽可能多地发现和解决自身推理链条中的问题 。DeepSeek强调 ,“对于没有已知解决方案的开放性问题,自我验证在扩展测试时计算(test-time compute)方面尤为重要。”测试时计算指的是在推理阶段分配大量计算资源,让模型有更长时间进行推理、探索多种解决方案并完善答案。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

动态进化系统:破解“自我过度拟合 ”难题

为了防止模型过度拟合其自身的检查机制——即只学会欺骗自己的验证器——DeepSeek采用了一种动态进化的策略 。该团队通过增加计算量和自动标记难以验证的证明,来不断提升验证过程的难度,确保验证器与生成器同步进化。

DeepSeek在技术文件中解释 ,这种方法允许他们“扩展验证计算 ,以自动标记新的 、难以验证的证明,从而创造新的训练数据来进一步改进验证器。”通过这种验证-生成闭环和元验证机制,模型能够实现全自动化的数据标注和持续的性能优化 ,验证了自驱动学习系统在解决复杂数学推理任务上的可行性 。

⭐星标华尔街见闻,好内容不错过本文不构成个人投资建议,不代表观点 ,市场有风险,投资需谨慎,请独立判断和决策 。

第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件	,了不起!

本文来自作者[华发囚徒]投稿,不代表视听号立场,如若转载,请注明出处:https://www.stddy.com/cskp/202511-60768.html

(32)

文章推荐

  • 杭州又开始封城了2021.2021年最新杭州封城消息属实吗?

    2021年元月十五号封城是真的吗〖壹〗、年元月十五号封城是假的。以下几点可以说明:没有官方宣布:没有正式宣布在元月十五号暂停工作和营业。尽管某些地区出现了新情况,但这不会危及整个国家,只有患者所在地会被封锁。疫情防控体系完善:我国在过去几个月中已编制了一整套预防和控制计划。〖贰〗、年元月十五号封城

    2025年06月29日
    124
  • 我是重庆人,去了趟山东济南,忍不住想讲讲,济南给我的7个印象

    我是重庆嘉陵江边长大的崽儿,从小在火锅红汤的雾气里听着“巴适得板”长大。上个月替老汉去济南谈钢材生意,本以为就是逛逛厂子签个字,哪晓得在齐鲁大地泡了整十天!回来时行李箱塞着趵突泉捡的泉华石,鼻尖还萦绕着把子肉的焦香。今儿个就摆摆龙门阵,跟老乡们唠唠这个让我胶鞋沾满泉水青苔的“泉城”(济南人老挂在嘴边

    2025年07月05日
    130
  • 必看教程“微乐插件程序教程(助赢神器通用版)

    软件神器超亮眼!开心泉州麻将小程序攻略(为啥我总是输)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”开心泉州麻将小程序攻略是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的

    2025年08月31日
    89
  • 3分钟学会“胡乐麻将赢牌诀窍(专用辅牌神器免安装)

    这软件超神了!决胜麻将插件购买(怎么打才赢)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”决胜麻将插件购买是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载

    2025年09月05日
    81
  • “性侵工伤认定”案当事人丈夫:双方都提交了新证据,妻子穿被侵害时的衣服出庭算是一种治疗

    9月23日,全国首例“性侵工伤认定”案当事人崔丽丽,与前公司天津市德科智控股份有限公司(简称德科智控)劳动争议案,在天津市津南区人民法院八里台第二法庭一审开庭。庭审结束后案件未当庭宣判。本次开庭时间在崔丽丽受侵害的两年后。九派新闻从崔丽丽处获悉,她及其委托代理人要求德科智控赔偿停工留薪期内崔丽丽的工

    2025年09月24日
    74
  • 我看应该整治婚礼的恶俗

    今天突然看到一个离谱的新闻,10月3日,旬阳市一男子在小河北旬河大桥跳河失踪。该男子现年29岁,系旬阳市吕河镇居民。跳河原因是因婚礼琐事情绪失控,10时许从婚礼酒店门口跑至旬河大桥,直接跳河了。当时旬阳市就组织了应急、公安、消防、海事等部门全力搜救,结果因为最近旬阳市一直在下雨,男子当天跳下的旬河大

    2025年10月05日
    69
  • 3分钟学会“微乐海南麻将助赢神器(专用辅牌神器免安装)

    软件神器优选!微信小程序麻将怎么打才能赢(要怎么样拿到好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序麻将怎么打才能赢是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器

    2025年10月10日
    61
  • 李湘红衣亮相,与王岳伦"合体"现身机场,为女儿霸气豪办生日宴!

    这几天,北京机场里李湘带着前夫王岳伦,从英国一块儿回来了。这两人,早几年就各自天涯了,现在为了什么事儿能并排出现在机场?说白了,就是为了他们的宝贝女儿王诗龄。孩子刚过16岁生日,他们俩这当爹妈的,专门跑去英国给她过生日,这不,又一起护送闺女回国。你别说,李湘真是走到哪儿都是焦点。那天在机场,她身上那

    2025年10月19日
    62
  • 玩家实测“手机扑克辅助工具(助赢神器通用版)

    超牛软件工具!微信小程序雀神广东麻将开挂神器(怎么让系统给自己好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序雀神广东麻将开挂神器是一款可以让一直输的玩家,快速成为一个“必胜”的

    2025年11月06日
    56
  • 乌情报人员试图金钱诱惑俄飞行员劫持战机,并用毒面具杀害指挥官

    一名空中领航员与俄军米格-31战斗机飞行员披露,乌克兰情报人员曾试图招募他们劫持搭载“匕首”高超音速导弹的军机。该飞行员称,2024年秋季,一名自称谢尔盖·卢戈夫斯基、声称供职于新闻机构的陌生人通过社交媒体平台联系他,提出有偿咨询军事问题。飞行员表示:“我认为其接触我的目的,是企图通过谢尔盖设局策反

    2025年11月12日
    40

发表回复

本站作者后才能评论

评论列表(4条)

  • 华发囚徒
    华发囚徒 2025年11月29日

    我是视听号的签约作者“华发囚徒”!

  • 华发囚徒
    华发囚徒 2025年11月29日

    希望本篇文章《第1个获得数学奥赛金牌的开源模型!DeepSeek新模型获网友盛赞:公开技术文件,了不起!》能对你有所帮助!

  • 华发囚徒
    华发囚徒 2025年11月29日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 华发囚徒
    华发囚徒 2025年11月29日

    本文概览:DeepSeek最新发布的开源数学模型,正将其推向与OpenAI和谷歌等科技巨头同场竞技的舞台DeepSeekMath-V2的模型,在被誉为全球最难的高中数学竞赛中达到了金牌水...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们