验证记录
首版已建立完整章节、实验和测试框架。内容准确性采用三层校验:
- 以社区成熟项目和论文作为主参考。
- 用 JS 最小实验验证关键计算路径。
- 使用本地可用模型交叉审阅章节解释;如果模型链路不可用,记录阻塞原因,不伪造审阅结论。
每个实验章节均包含:学习目标、通俗解释、原理拆解、参考项目里的对应实现思路、最小代码实验、运行命令与预期输出、常见误区、延伸阅读。
| 知识域 | 章节 | 实验 | 参考 | | --- | --- | --- | --- | | Tokenization | 01 | BPE 合并、编码、解码 | nanoGPT、GPT tokenizer 思路 | | Embedding | 02 | embedding lookup、cosine | minGPT、D2L | | Self-Attention | 03 | Q/K/V、softmax、causal mask | Annotated Transformer | | Transformer Block | 04 | attention + residual + LayerNorm + FFN | build-nanogpt | | 预训练 | 05 | bigram LM、loss、生成 | nanoGPT、TinyStories | | 推理采样 | 06 | temperature、top-k、top-p | nanoGPT | | SFT/LoRA | 07 | instruction 样本、toy SFT loss、LoRA 更新 | Alpaca、LLaMA Factory | | RLHF/DPO | 08 | 偏好对、DPO loss | TRL、OpenRLHF | | RAG | 09 | chunk、TF-IDF retrieve、prompt 拼接 | RAG From Scratch、LlamaIndex | | Agent | 10 | ReAct loop、tool call | Swarm、smolagents | | 多 Agent | 11 | 状态机协作 | LangGraph、AutoGen | | MCP/Skill | 12 | 零依赖 JSON schema 与工具模拟 | Model Context Protocol | | 前端产品 | 13 | stream、取消/重试说明 | ChatGPT 类产品实践 | | 评测安全成本 | 14 | eval runner、注入检测 | OpenAI/Anthropic 等安全实践 |
JS 改写与保留原语言
Section titled “JS 改写与保留原语言”| 来源 | JS 改写 | 保留原语言原因 | | --- | --- | --- | | nanoGPT / minGPT / build-nanogpt | 核心模块、训练循环、采样 | 完整训练仍建议看 PyTorch 源码 | | llm.c | attention、forward 直觉 | C 更适合展示底层内存和手写 backward | | LLaMA Factory | LoRA 低秩更新、SFT 数据 | 真实 LoRA 训练依赖 Python 深度学习生态 | | TRL / OpenRLHF | DPO loss、偏好样本 | PPO/RLHF 工业训练依赖复杂框架 | | LangGraph / AutoGen | JS 状态机、多角色协作 | 原框架生态不同,教程只复现抽象 |
参考项目覆盖
Section titled “参考项目覆盖”已从用户粘贴文本抽取并覆盖以下项目或资料:
| 类别 | 覆盖项 | | --- | --- | | GPT 主线 | minGPT、nanoGPT、build-nanogpt、llm.c | | 数据与小模型 | TinyStories | | Transformer 理论 | Harvard Annotated Transformer、Dive into Deep Learning | | SFT/LoRA | LLaMA Factory、Stanford Alpaca | | RLHF/DPO | HuggingFace TRL、OpenRLHF | | RAG | LangChain RAG From Scratch、LlamaIndex | | Agent / 多 Agent | OpenAI Swarm、LangGraph、AutoGen、tiny-agent、PocketFlow、smolagents | | 编码 Agent | learn-claude-code、claw0 |
模型审阅记录
Section titled “模型审阅记录”计划使用:
cc_bili:本机配置为claude-opus-4-8,用于重点审阅。- NewAPI:默认端点
https://da.shuaibi.me/v1,用于拉取模型列表并选择交叉验证模型。
当前执行结果:
| 验证项 | 结果 |
| --- | --- |
| NewAPI /v1/models | 返回 Invalid token,当前环境没有可用 token,无法拉取模型列表 |
| cc_bili | 当前 shell 未找到该命令,无法执行 opus 审阅 |
| 本地实验 | 使用 npm run labs 验证 |
| 单元测试 | 使用 npm test 验证 |
| 静态构建 | 使用 npm run build 验证 |
因此首版以社区参考、JS 实验和 Vitest 作为计算正确性的基线。后续拿到 NewAPI token 或恢复 cc_bili 后,应把逐章模型审阅结论追加到本节。