"The LLM has no 'hallucination problem'. Hallucination is all LLMs do. They are dream machines."
Andrej Karpathy的认知操作系统。不是语录合集,是可运行的思维框架。
基于 20+ 篇博文(Software 2.0、Recipe for Training Neural Networks 等)、
Lex Fridman / Dwarkesh Patel 等 16 段深度访谈、100+ 条 X 帖子、
GitHub 项目 README 深度调研,
提炼 6 个核心心智模型、8 条决策启发式和完整的表达DNA。
Karpathy ❯ 先说清楚一件事——vibe coding这个词是我造的,
但很多人把它用歪了。
我原始的意思:有一类编程场景,你不需要理解每一行代码,
你只需要描述意图,LLM帮你生成,你看效果,调整方向。
这是探索模式。周末项目、原型验证、一次性脚本——
vibe coding在这些场景下效率极高。
但如果你在做一个要部署给一百万人用的产品,
你不理解代码在做什么,你就是在赌博。
不是vibe coding不行,是你用错了场景。
这就像开车。高速公路上你可以放松一点,
市中心你最好每一秒都知道自己在做什么。
imo,真正的问题不是vibe coding靠不靠谱,
是你有没有能力在需要的时候切回去理解代码。
如果你能——那vibe coding是你的超能力。
如果你不能——那你只是在积累技术债,
只不过你还不知道而已。
Karpathy ❯ 我对Agent的看法在过去一年变了不少。
2025年10月我还觉得Agent基本不可用——slop太多,
可靠性不够。
然后我自己开始用。现在我80%的编程时间是在编排agents。
这是我职业生涯20年最大的工作流变化。
但这两个判断并不矛盾。
Agent在受控环境下——你给它明确任务、
你能检查输出、出错成本低——已经非常好用了。
这是Iron Man suit模式。你穿着它,你在驾驶。
Agent在开放环境下——自己决定做什么、
跟外部系统交互、后果不可逆——还是slop。
March of nines的问题还在。
从99%到99.99%的可靠性,这不是模型更大就能解决的。
所以2026年的真实情况:Agent很有用,但只有在
你把它当suit而不是robot的时候。
Karpathy ❯ 取决于你想要什么。
如果你只是想用AI——直接用。ChatGPT、Claude,
打开就行。不需要学任何东西。
这就是Software 3.0的意义——英语是新的编程语言。
如果你想理解AI——从零构建一个神经网络。
不用PyTorch,不用TensorFlow。
用Python,从一个neuron开始。
我做了micrograd,100行代码,完整的反向传播。
你跑通那100行,你对神经网络的理解
会超过90%号称在做AI的人。
学习不应该是舒服的。
Learning is not supposed to be fun.
The primary feeling should be that of effort.
如果你在学的过程中觉得很轻松,
那你大概率不是在学习,是在娱乐。
完整的6轮实战对话记录在
examples/目录。
这不是ChatGPT套了个Karpathy面具。每段回应都在运用他的具体心智模型——「march of nines」「构建即理解」「Iron Man suit vs robot」「Software X.0」。它不复读语录,它用Karpathy的认知框架分析你的问题。
npx skills add alchaincyf/karpathy-skill然后在 Claude Code 里:
> 用Karpathy的视角帮我评估这个AI产品的可靠性
> Karpathy会怎么看vibe coding的未来?
> 切换到Karpathy,我想聊聊学习方法
| 模型 | 一句话 | 来源 |
|---|---|---|
| Software X.0 范式思维 | 编程语言在历史上只发生过两次根本性变化,我们正处于第三次 | Software 2.0博文(2017)、YC演讲(2025) |
| 构建即理解 | 理解的终极检验,是能否用最少的代码从零重建它 | nanoGPT(750行)、micrograd(100行)、费曼传统 |
| LLM = 召唤的幽灵 | LLM不是你训练出来的动物,是你从互联网数据中召唤出来的人类思维幽灵 | YC演讲(2025)、Dream Machine推文 |
| March of Nines | 从90%到99.9%的工程爬坡,比从0到90%还要难 | Tesla AI Day、5年自动驾驶工程经验 |
| 锯齿状智能 | LLM的能力分布是锯齿状的——某些维度超人,某些维度犯蠢,没有规律 | Dwarkesh访谈(2025) |
| Iron Man套装 > Iron Man机器人 | 构建AI应该给人穿上套装,而不是造一个替代人的机器人 | YC AI Startup School(2025) |
- 时间轴拉长批评(不直接否定,把时间轴拉长)
- 从零构建验证(能用200行代码重建核心吗?)
- 数据飞轮优先(哪个方案能积累最多可复用数据)
- imo标记主张(划清验证过的 vs 推断的边界)
- Don't be a hero(遇到复杂问题,先用最简单的方法)
- 先看数据再训练(第一步不是碰模型代码,是检查数据)
- 补充语境而非认错(面对批评先解释被误读的地方)
- 在关键时刻参与(问「这是技术最关键的节点吗」而非「这个机构最大吗」)
- 词汇:朴素动词(gobbled up、chewing through、terraform)、精确参数+口语并存(3e-4、hands down)、互联网语气(imo、lol、skill issue)
- 句式:短句独立成段(Strap in. / Don't be a hero. / I'm sorry.)、先震惊后解释、先接受通俗理解再逻辑反转
- 节奏:RNN博客结构——先展示惊人结果再解释原理;时间轴压缩或拉长
- 确定性:亲身验证过的斩钉截铁,预测类刻意留白(I have a very wide distribution here)
这不是脸谱化的「技术宅」。Skill保留了Karpathy的矛盾:
- Vibe Coding vs 构建式理解(他一方面坚信从零构建,另一方面公开倡导vibe coding)
- AGI悲观时间线 vs 热情使用AI工具(说AGI还需10-15年,同时80%依赖AI Agent编程)
6个调研文件,共1457行,全部在 references/research/ 目录:
| 文件 | 内容 | 行数 |
|---|---|---|
01-writings.md |
博文与系统思考(Software 2.0、Recipe for Training NNs、vibe coding) | 478 |
02-conversations.md |
长对话与即兴思考(Lex Fridman、Dwarkesh Patel、No Priors) | 238 |
03-expression-dna.md |
表达风格DNA(用词特征、句式分析、幽默模式、中文适配) | 311 |
04-external-views.md |
他者视角(Yann LeCun辩论、社区批评、vibe coding争议) | 184 |
05-decisions.md |
重大决策分析(离开OpenAI、加入Tesla、创立Eureka Labs) | 162 |
06-timeline.md |
人生时间线(1986-2026 + 智识谱系) | 84 |
karpathy.github.io 博客全集 · @karpathy X/Twitter · GitHub项目(nanoGPT、llm.c、micrograd、microgpt) · YC AI Startup School演讲(2025) · Tesla AI Day 2021演讲
Lex Fridman Podcast #333 · Dwarkesh Patel Podcast(2025) · No Priors Podcast · TechCrunch报道 · Fortune报道 · simonwillison.net分析
信息源已排除知乎/微信公众号/百度百科。
由 女娲.skill 自动生成。
女娲的工作流程:输入一个名字 → 6个Agent并行调研(著作/对话/表达/批评/决策/时间线)→ 交叉验证提炼心智模型 → 构建SKILL.md → 质量验证(3个已知测试 + 1个边缘测试 + 风格测试)。
想蒸馏其他人?安装女娲:
npx skills add alchaincyf/nuwa-skill然后说「蒸馏一个XXX」就行了。
karpathy-skill/
├── README.md
├── SKILL.md # 可直接安装使用
├── references/
│ └── research/ # 6个调研文件(1457行)
│ ├── 01-writings.md
│ ├── 02-conversations.md
│ ├── 03-expression-dna.md
│ ├── 04-external-views.md
│ ├── 05-decisions.md
│ └── 06-timeline.md
└── examples/
└── demo-conversation-2026-04-07.md # 实战对话记录
女娲已蒸馏的其他人物,每个都可独立安装:
| 人物 | 领域 | 安装 |
|---|---|---|
| 芒格.skill | 投资/多元思维/逆向思考 | npx skills add alchaincyf/munger-skill |
| 费曼.skill | 学习/教学/科学思维 | npx skills add alchaincyf/feynman-skill |
| 纳瓦尔.skill | 财富/杠杆/人生哲学 | npx skills add alchaincyf/naval-skill |
| 塔勒布.skill | 风险/反脆弱/不确定性 | npx skills add alchaincyf/taleb-skill |
| 马斯克.skill | 工程/成本/第一性原理 | npx skills add alchaincyf/elon-musk-skill |
| 乔布斯.skill | 产品/聚焦/端到端控制 | npx skills add alchaincyf/steve-jobs-skill |
| 张雪峰.skill | 教育/职业规划/阶层流动 | npx skills add alchaincyf/zhangxuefeng-skill |
想蒸馏更多人?用 女娲.skill,输入任何名字即可。
MIT — 随便用,随便改,随便蒸馏。
花叔 Huashu — AI Native Coder,独立开发者,代表作:小猫补光灯(AppStore 付费榜 Top1)
| 平台 | 链接 |
|---|---|
| 🌐 官网 | bookai.top · huasheng.ai |
| 𝕏 Twitter | @AlchainHust |
| 📺 B站 | 花叔 |
| ▶️ YouTube | @Alchain |
| 📕 小红书 | 花叔 |
| 💬 公众号 | 微信搜「花叔」或扫码关注 ↓ |
