“OpenAI联创”Karpathy官宣加入,Anthropic获得“人才争夺战”重大胜利

华尔街见闻05-20

AI圈最知名的技术布道者,“Vibe Coding之父”,选择了OpenAI最强劲的对手。

5月19日深夜11点,Andrej Karpathy在X上发了四句话,宣告了AI人才格局的又一次重新洗牌。

这条帖子一小时内浏览量接近300万。Karpathy写道:

个人动态:我已加入Anthropic。我认为未来几年大语言模型的前沿发展将尤为重要。很高兴能加入这个团队,重返研发工作。同时,我依然对教育事业充满热忱,计划适时恢复相关工作的推进。

Karpathy本周已正式入职,加入Anthropic预训练团队,该团队由另一位前OpenAI员工Nicholas Joseph领导,负责Claude所有大规模训练运行。Anthropic发言人向TechCrunch确认,Karpathy将在该团队下组建新的子团队,专注于用Claude自身来加速预训练研究。

美媒Axios将此次招募定性为“Anthropic在人才争夺中的重大胜利”。

Karpathy是谁:一个能用一个词改变行业的人

要理解这次加入的分量,先要理解Karpathy的稀缺性在哪里。

1986年生于斯洛伐克,15岁移民加拿大。本科在多伦多大学选修了深度学习之父Geoffrey Hinton的课程,随后在斯坦福师从李飞飞攻读博士,期间创建了计算机视觉课程CS231n——从2015年的150名学生增长到2017年的750人,全部视频公开上网,成为全球工程师自学深度学习的入门首选。

2015年,他成为OpenAI创始研究科学家。2017年被马斯克挖至特斯拉担任AI高级总监,主导自动驾驶纯视觉方案。同年他在Medium发表“Software 2.0”,提出神经网络权重就是新的代码、数据集就是新的源代码——这个框架重塑了整个行业对“什么是编程”的认知。

2022年离开特斯拉后,他在YouTube创建“Neural Networks: Zero to Hero”系列,频道突破百万订阅。开源项目micrograd、nanoGPT代码量极少,却被称为“可运行的教科书”。

2025年2月,他在X上造出了“Vibe Coding”一词——“完全顺应直觉,拥抱指数级增长,忘掉代码本身的存在”——随后被柯林斯词典选为年度词汇,引发了关于SaaS公司生死存亡的广泛讨论,数百亿美元市值随之蒸发。

TIME在2024年将他列入“AI领域最具影响力100人”。他在X上拥有250万粉丝。

正如X用户@sa_vatsa所评论的:

Andrej给人的感觉从来不像一个AI网红,更像是这个领域的公共解读者。他翻译现实,而不是兜售立场。

他去做什么:用最强的锤子改进锤子本身

Karpathy加入Anthropic的具体任务,指向一个明确方向:用Claude加速预训练研究本身。

预训练是大模型获得核心知识和能力的基础阶段,也是算力消耗最密集的环节。据Anthropic向TechCrunch确认,Karpathy将组建团队,探索让Claude自主发现更优训练架构、数据配比和实验方向的方法——也就是“AI改进AI”的路线。

这并非凭空而来。今年3月,Karpathy曾做过一个实验:将一个AI编程智能体接入一个小型语言模型,让它无监督运行两天,自主测试和调整训练代码。经过700次实验、20项自主发现的优化后,他表示同样的调整应用到更大模型上,训练时间缩短了11%。他将这个方法称为“autoresearch”,该项目随后成为GitHub热门项目,这套方法也被称为“Karpathy Loop”。

他在Anthropic要做的,正是将这套思路系统化、规模化。

Nicholas Joseph在X上写道:

他将建立一个团队,专注于用Claude加速预训练研究本身。我想不出还有谁比他更适合做这件事——期待我们一起构建的东西!!

TechCrunch评价称,“Karpathy是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。”

为什么是Anthropic,而不是回OpenAI

Karpathy的职业轨迹有一条清晰的逻辑:哪里是当下最大的实验,他就去哪里。

2017年去特斯拉,因为自动驾驶是Software 2.0最大的实验场。2022年离开,因为架构已定,剩下的是工程优化。2023年回OpenAI,因为GPT-4带来的爆发期是最刺激的前沿。2024年创办AI教育公司Eureka Labs,想验证AI原生教育的假设。

这一次选择Anthropic,他的判断是:“用AI研究AI”的预训练革命正在这里发生。

而他没有回OpenAI,背后有一个不可忽视的结构性信号:

  • 2024年5月,OpenAI前对齐负责人Jan Leike加入Anthropic;

  • 2024年8月,OpenAI联合创始人John Schulman跟进;

  • 2026年5月,Karpathy加入。

三年,三位OpenAI核心人物,全部单向流入Anthropic,没有任何可比的反向案例。

与此同时,OpenAI的战略重心已明显转向平台化——相继收购Chat.com、io Products、Windsurf等,节奏越来越快,金额越来越大。对于一个想”回归研发“的研究者而言,Anthropic”以研究质量取胜“的路线,显然更有吸引力。

据Business Insider报道,Anthropic的估值在二级市场近期已超过1万亿美元,超越OpenAI。Anthropic目前正在以约9000亿美元估值洽谈300亿美元新一轮融资。据新智元援引Polymarket数据,交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI为4%。

“Anthropic正在赢得AI竞赛”

对于这则重磅人事变动,X用户@Shashank评论道:

Anthropic开始看起来像2000年代中期的皇家马德里,把所有AI传奇人物和CTO都招进来当技术成员。Anthropic正在打造一支绝对的超级战队。

X用户@Balu0X表示:

天哪,太疯狂了,完全没想到。Anthropic正在赢得AI竞赛。

@HegsethWarDesk用户表示,

Anthropic发展势头良好,我认为在未来三四年内他们会超越OpenAI。

Anthropic为什么非要招他

Anthropic的招募动机可以分几层来看。

技术层面:Anthropic的算力预算无法与微软支持的OpenAI或坐拥TPU的谷歌正面竞争。它必须找到用更少算力训出更好模型的方法。Karpathy同时具备预训练理论深度、大规模工程经验和对AI辅助研究的直觉,三者兼备的人极少。

人才信号层面:每一个Karpathy级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。

IPO叙事层面:Karpathy是AI领域公众辨识度最高的技术人物之一——百万YouTube订阅,年度词汇造词者,GitHub上22万星标的CLAUDE.md仓库。他的名字出现在员工名单上,本身就是一句可以写进招股书的话。

但据新智元分析,最深层的价值可能是Anthropic没有明说的:Karpathy定义范式的能力。他在Anthropic做的任何技术探索,都会通过他的推文、博客和YouTube视频公开传播。当他用他特有的方式给正在发生的事情命名时,Anthropic就自然成为那个范式的原产地。

招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment