
rohitg00 在 GitHub 开源了一份号称从零到一的 AI 工程教程:435 节课、20 个阶段、约 320 小时课时,涵盖 Python、TypeScript、Rust、Julia 四种语言。仓库名 ai-engineering-from-scratch,截至 5 月 22 日 stars 数 10.7k,MIT 许可证。
它把 AI 工程教学切成 20 个阶段
课程的目录是按工程实践推进而不是按学院派课表排的,从环境与工具开始,依次是数学基础、ML 基础、深度学习核心、计算机视觉、NLP、语音音频、Transformer 深入、生成式 AI、强化学习、从零写 LLM、LLM 工程、多模态、工具与协议、Agent 工程、自主系统、多 Agent 与 swarm、生产化基础设施、伦理对齐安全,最后是 capstone 项目。
每节课产出一份可复用的 artifact——一段 prompt、一份 skill、一个 agent、一个 MCP server。作者把这一点写在 README 第一句:你不只是学 AI,你把它端到端造出来。
课程材料的真实状态:四分之一完成度
仓库目录里 phases/ 已经开了 20 个文件夹,但并不是每节课都已经填完内容。从 README 给出的”435 lessons”badge 看,作者把全部计划写进了 ROADMAP,但实际可跑的课时还在持续提交。这跟 fast.ai、karpathy/nn-zero-to-hero 当年一上来就放完整版不一样,rohitg00 走的是”开源教科书边写边公开”的路子。
仓库还配了一套自动化脚本:scripts/audit_lessons.py 检查课程结构完整性,build_catalog.py 生成索引,link_check.py 跑外链可用性。site/ 下有个独立的静态网站构建(aiengineeringfromscratch.com),catalog.html 把所有课列成可搜索的目录。
它的差异化是”每节课都给你一个能上线的小东西”
同类教程不少。Andrej Karpathy 的 LLM-from-scratch 是最经典的,但只覆盖 transformer 训练那一段;Hugging Face 的 NLP 课走完整路线但偏研究风格;Sebastian Raschka 的书 Build a Large Language Model 把代码塞进章节而不是项目。rohitg00 这个仓库的切口在于——每节课都收尾在一份 artifact 上,跟”生产环境真在用什么”对齐。
看 outputs/ 目录就明白:agents/、mcp-servers/、prompts/、skills/ 四个子目录是课程产出的归档点。学完一节,仓库里多一个能 import 的对象。这种产出导向比起单纯的 jupyter notebook 教学,更接近现在做 AI 工程师的真实工作流。
10.7k 星的含金量取决于作者能撑多久
开源教程的最大风险是中途断更——rohitg00 自己也在 ROADMAP.md 里承认课程是分批发布。如果他能在未来 12 个月把 19 个阶段的内容填到 70% 以上,这就是 fast.ai 之后又一份值得存进书签的 AI 工程教科书;如果只填到一半,10.7k stars 就只是一份”待办清单收藏夹”。
真正决定它命运的不是已经写完的部分,而是 14-Agent Engineering、16-Multi-Agent and Swarms、17-Infrastructure and Production 这三段——也是 2026 年 AI 工程师真正缺教程的地方。如果作者能把这三段写得像 Karpathy 写 transformer 那样硬核,10.7k 还会再涨一截。
参考链接