OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

在阅读此文之前,辛苦您点击一下“关注” ,既方便您进行讨论和分享 ,又能给您带来不一样的参与感,感谢您的支持!

编辑:欣阅

在人工智能的叙事中,无数算法和模型的名字如雷贯耳 ,但一个神秘的代号“Bob ”,最近却在科技圈中,揭示了这场竞赛的另一个维度 。

据说这位“Bob ”是仅凭一己之力编写出支撑OpenAI每日数万亿次计算量核心代码的神秘人物 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

他写的训练内核,对精度的要求达到了令人发指的地步,因为一个微小的bug就可能让价值连城的算力付诸东流 ,导致整个训练任务回滚到上一个检查点。

当外界还在猜测“Bob”究竟是谁时,OpenAI的内部早已给出了答案。员工们创造了一个名为“Bobmagic”的Slack专属表情包,用来表达对技术难题被瞬间化解的崇敬 。

种种线索 ,最终都指向了一个名字:ScottGray。那为什么一个专注于底层代码、默默无闻的工程师,会被推上神坛,甚至成为科技巨头之间秘而不宣的“战略武器 ”?

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

和芯片讲悄悄话

ScottGray的价值 ,源于他一套近乎偏执的反传统哲学。在大多数开发者还在使用英伟达提供的官方工具链,依赖层层封装好的软件抽象时,他却早已看穿了这套体系的“性能天花板” 。

这个行业标准流程 ,就像一套多重翻译系统。开发者用高级语言CUDAC++写下指令,这些指令先被翻译成中间语言PTX,再由官方汇编器ptxas翻译成GPU能直接执行的底层机器码SASS。每一层翻译 ,都意味着性能的损耗和对硬件控制力的丧失 。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

ScottGray认为,官方的汇编器ptxas在寄存器分配和指令调度这些关键环节上 ,做得并不够好,甚至可以说是低效的。他无法忍受这种隔靴搔痒的沟通方式,他要做的 ,是绕过所有“官方语言”,直接与那块硅基芯片的灵魂对话。

为此,他亲手打造了一件“神器 ”——一个名为maxas的汇编器 。通过maxas ,他对GPU的掌控达到了匪夷所思的程度:寄存器的每一次分配 、内存延迟的精确计算 、指令流水线的完美衔接 ,全部实现了绝对的手动控制。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这听起来像天方夜谭,但他用一个无可辩驳的实验证明了自己。他使用maxas手写了一个SGEMM(单精度通用矩阵乘法)内核 ,在当时的GM204GPU上,这个内核跑出了硬件理论峰值98%的计算效率 。更惊人的是,这个成绩比英伟达自家专家团队呕心沥血优化的官方cuBLAS库 ,还要快上4.8% 。

他用代码证明了一个事实:硬件厂商制定的“黄金标准”,并非不可逾越的物理定律。在NervanaSystems工作的这段时间,他将这套方法论进一步推广 ,开发出名为maxDNN的卷积库。它采用了128位纹理加载、激进双缓冲等一系列汇编级的“黑魔法”,在AlexNet等经典模型上,效率稳定在93-95%的恐怖区间 。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

作为对比,当时官方的cuDNN效率则像过山车一样,在32%到57%之间剧烈波动。在某个特定卷积层上 ,maxDNN的效率峰值甚至摸到了96.3%的极限。

正是这些无可辩驳的数据 ,为他赢得了前CEO口中“全球最强GPU程序员 ”的赞誉 。他向业界证明,真正的极致性能,隐藏在被大多数人忽略的硬件底层深处。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

从拧螺丝到画蓝图

2016年加入OpenAI后,ScottGray的角色完成了一次战略性的升维。他不再仅仅是那个追求极致性能的“工匠”,而是成为了公司宏大技术蓝图的“使能者” 。

OpenAI的“ScalingLaws ”理论横空出世 ,它用无可辩驳的数据指出,模型规模的扩张是通往更强人工智能的关键路径。整个行业都为之疯狂,但一个现实的物理墙很快挡在了所有人面前:稠密模型的无限扩张 ,意味着计算量和成本的指数级爆炸。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

就在大家觉得这条路快要走到尽头时,ScottGray的工作为OpenAI开辟了一条全新的航道 。他的工作重心 ,从单纯压榨现有算法的极限,转变为创造一种全新的计算范式,让“更大”成为可能。

2017年 ,他作为第一作者 ,发表了一篇关于块稀疏GPU内核的论文。这篇论文的核心思想简单粗暴:既然模型中有很多权重接近于零,与其一个个跳过这些零值,不如直接将整块整块的权重矩阵置零 ,然后在计算时“无视”这些零值块 。

这种方法带来的效率提升是数量级的 。他亲手编写的高性能内核,在处理这类稀疏模型时,比处理稠密矩阵的cuBLAS或通用稀疏矩阵的cuSPARSE要快上几个数量级。

OpenAI的幕后大神!全球最强GPU程序员	,扎克伯格亲自挖墙角!

这意味着,在同等算力预算下,OpenAI可以构建出参数量远超竞争对手的庞大模型 ,比如一个宽度达到传统模型5倍的LSTM。这不再是简单的性能优化,而是直接将ScalingLaws的理论发现,稳稳地转化为了工程上的巨大优势 。

也正因如此 ,他的名字开始频繁出现在OpenAI那些里程碑式的论文中,从GPT-3到GPT-4的技术报告,无一例外。他不再是那个只追求“更快 ”的工程师 ,而是通过底层的革命性创新 ,为顶层的算法研究者们开辟了“更大 ”、“更高效”的新大陆,重新定义了什么在工程上是“可能的”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

小扎的秘密愿望单

ScottGray的存在 ,已经超越了技术本身,成为硅谷AI人才战争进入白热化的一个生动缩影 。他的价值,由他个人的极端稀缺性和对公司的极端重要性共同定义。

编写高性能训练内核 ,这项技能的门槛高得吓人。它要求一个人必须同时是并行计算专家 、GPU硬件架构大师和深度学习算法的行家 。能够将这三大领域的知识融会贯通,并做到世界顶尖水平的人,据业内估算 ,全球可能不超过一百个。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

在OpenAI内部,一位前同事曾感叹 ,自己耗费整整一周都无法解决的性能瓶颈,ScottGray只用了几分钟就定位并解决了。这种降维打击般的能力,让“Bobmagic ”的表情包在公司内部广为流传 ,成为一种图腾 。

这种内部的崇拜 ,不可避免地会外溢,成为外部世界觊觎的目标。一个广为流传的段子是,当“Bob”的故事在网上发酵后 ,Meta的CEO马克·扎克伯格已经将他列入了“暗挖名单”。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

这并非空穴来风 。在此之前,Meta已经成功从OpenAI挖走了多位核心研究员 ,这场围绕顶尖人才的战争早已硝烟弥漫 。像ScottGray这样的人物,被硅谷的AI公司视为核心机密资产,他们通常不会公开承认自己的具体身份和贡献 ,以避免被对手盯上。

这揭示了当前AI竞赛的本质:囤积再多的GPU显卡,也只是打赢战争的物质基础。真正决定胜负的,是那些能够将这些硬件潜能100%压榨出来的顶尖人才 。一个不可复制的ScottGray ,其战略价值,甚至超过了成百上千块物理显卡。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

结语

在AI时代的聚光灯下 ,我们习惯于为那些发布颠覆性模型的科学家和侃侃而谈的CEO们欢呼。但真正的英雄 ,或许也包括像ScottGray这样的人 。

他们在沉默中,用一行行汇编代码,为摩尔定律“续命 ” ,为人工智能这座摩天大楼,打下了最坚实、最深入地核的地基。

OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!

他代表了AI发展中一个容易被忽视 ,却至关重要的维度——工程的深度,最终决定了理论所能企及的高度。

奥特曼和他的公司能否守住自己的“Bob”,或许将是这场漫长AI长跑中 ,一个值得持续关注的关键变量 。

本文来自作者[怀儿小公主]投稿,不代表视听号立场,如若转载,请注明出处:https://www.stddy.com/zlan/202510-48776.html

(71)

文章推荐

  • 混不下去了?那尔那茜不到72小时迎来四大噩耗,官方通报让人震惊

    那尔那茜高考移民丑闻持续发酵,官方通报证实其学历造假,引发连锁反应。图片来源于网络十几天来,她避而不谈,忙着直播捞金,如今终于尝到苦果。央视八套火速删除其名字,电影项目摇摇欲坠,代言品牌纷纷切割,她的演艺生涯已走到尽头。图片来源于网络2008年,那尔那茜以内蒙古户籍考入上海戏剧学院委培班,享受降分录

    2025年06月25日
    177
  • 胜率设置方法“手机app打牌有外挂吗(助赢神器通用版)

    这软件超神无敌!闲逸碰胡怎么拿到好牌(会员会提高胜率吗)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”闲逸碰胡怎么拿到好牌是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的

    2025年08月30日
    85
  • 胜率设置方法“东游麻将怎么赢(助赢神器通用版)

    软件神器登场!微信小程序中至上饶麻将到底是不是有挂(挂件神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信小程序中至上饶麻将到底是不是有挂是一款可以让一直输的玩家,快速成为一个“必胜”的

    2025年09月12日
    79
  • 终于发现了“微信打麻将怎么设置赢(专用辅牌神器免安装)

    软件神器超酷!海迅麻将能操纵输赢吗(怎么让系统给你发好牌)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”海迅麻将能操纵输赢吗是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要

    2025年09月12日
    71
  • 我来教大家“微乐麻将系统发牌规律(专用辅牌神器免安装)

    软件神器超闪!微信斗牛技巧解析(插件可信吗)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微信斗牛技巧解析是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载

    2025年09月16日
    77
  • 俄罗斯碳氢收入降了百分之25,财政企业没活力,而战争资助力不减

    2025年俄乌冲突还没见停的意思,美欧又给俄罗斯来了一轮新制裁,又是禁油气又是卡资金链。可让人纳闷的是,明明俄罗斯经济看着有点“蔫”,通胀高、增速慢,私营企业也没活力,却偏偏还能撑着给乌克兰那边的战争掏钱,今天就掰开揉碎了说说,这到底是怎么回事。俄经济,看着蔫实则没崩先说说俄罗斯这经济的“表面功夫”

    2025年10月31日
    54
  • 特朗普传出访华消息,阅兵有他一席之地?中方的回应只有2句话

    这几天,有国外正规媒体,传出了特朗普可能访问中国,并出席93阅兵的消息。对于相关问题,中国外交部只说了2句话。第一句是,在上周的国新办记者会上,有关部门介绍了抗战胜利80周年纪念活动邀请外国领导人的情况和安排。【美国总统特朗普可能访问中国】第二句是,关于提到的具体问题,目前没有可以提供的信息。虽然结

    2025年06月30日
    133
  • 实测教程“微乐四川助赢神器(助赢神器通用版)

    软件神器超灵!心悦麻将拍分输赢规律(提高胜率技巧)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”心悦麻将拍分输赢规律是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可

    2025年09月18日
    76
  • 我来教大家“科乐麻将摸宝神器(助赢神器通用版)

    软件神器爆赞!蜀山四川麻将辅牌器购买(万能开挂神器)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”蜀山四川麻将辅牌器购买是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用

    2025年10月10日
    66
  • 八段锦心得:开始挺有效,一段时间后就没感觉了,这三点做到没?

    练了两年八段锦,体检报告上的箭头一个没少,半夜还是刷手机到两点,这就是你以为的养生?别急着把锅甩给功法。北京体育大学去年做过跟踪,同一批学员,半年后一半人血压降了,另一半原地踏步,差别只在三个小动作。先问一句:今天做第八式攒拳怒目,脚趾抓地了吗?大多数人脚底太平,力从腰出,肝气根本没被拉醒,白

    2025年10月26日
    66

发表回复

本站作者后才能评论

评论列表(4条)

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    我是视听号的签约作者“怀儿小公主”!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    希望本篇文章《OpenAI的幕后大神!全球最强GPU程序员,扎克伯格亲自挖墙角!》能对你有所帮助!

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 怀儿小公主
    怀儿小公主 2025年10月04日

    本文概览:在阅读此文之前,辛苦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑:欣阅在人工智能的叙事中,无数算法和模型的名字如雷贯耳,但一个神秘...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们