跳转到内容

验证记录

首版已建立完整章节、实验和测试框架。内容准确性采用三层校验:

  1. 以社区成熟项目和论文作为主参考。
  2. 用 JS 最小实验验证关键计算路径。
  3. 使用本地可用模型交叉审阅章节解释;如果模型链路不可用,记录阻塞原因,不伪造审阅结论。

每个实验章节均包含:学习目标、通俗解释、原理拆解、参考项目里的对应实现思路、最小代码实验、运行命令与预期输出、常见误区、延伸阅读。

| 知识域 | 章节 | 实验 | 参考 | | --- | --- | --- | --- | | Tokenization | 01 | BPE 合并、编码、解码 | nanoGPT、GPT tokenizer 思路 | | Embedding | 02 | embedding lookup、cosine | minGPT、D2L | | Self-Attention | 03 | Q/K/V、softmax、causal mask | Annotated Transformer | | Transformer Block | 04 | attention + residual + LayerNorm + FFN | build-nanogpt | | 预训练 | 05 | bigram LM、loss、生成 | nanoGPT、TinyStories | | 推理采样 | 06 | temperature、top-k、top-p | nanoGPT | | SFT/LoRA | 07 | instruction 样本、toy SFT loss、LoRA 更新 | Alpaca、LLaMA Factory | | RLHF/DPO | 08 | 偏好对、DPO loss | TRL、OpenRLHF | | RAG | 09 | chunk、TF-IDF retrieve、prompt 拼接 | RAG From Scratch、LlamaIndex | | Agent | 10 | ReAct loop、tool call | Swarm、smolagents | | 多 Agent | 11 | 状态机协作 | LangGraph、AutoGen | | MCP/Skill | 12 | 零依赖 JSON schema 与工具模拟 | Model Context Protocol | | 前端产品 | 13 | stream、取消/重试说明 | ChatGPT 类产品实践 | | 评测安全成本 | 14 | eval runner、注入检测 | OpenAI/Anthropic 等安全实践 |

| 来源 | JS 改写 | 保留原语言原因 | | --- | --- | --- | | nanoGPT / minGPT / build-nanogpt | 核心模块、训练循环、采样 | 完整训练仍建议看 PyTorch 源码 | | llm.c | attention、forward 直觉 | C 更适合展示底层内存和手写 backward | | LLaMA Factory | LoRA 低秩更新、SFT 数据 | 真实 LoRA 训练依赖 Python 深度学习生态 | | TRL / OpenRLHF | DPO loss、偏好样本 | PPO/RLHF 工业训练依赖复杂框架 | | LangGraph / AutoGen | JS 状态机、多角色协作 | 原框架生态不同,教程只复现抽象 |

已从用户粘贴文本抽取并覆盖以下项目或资料:

| 类别 | 覆盖项 | | --- | --- | | GPT 主线 | minGPT、nanoGPT、build-nanogpt、llm.c | | 数据与小模型 | TinyStories | | Transformer 理论 | Harvard Annotated Transformer、Dive into Deep Learning | | SFT/LoRA | LLaMA Factory、Stanford Alpaca | | RLHF/DPO | HuggingFace TRL、OpenRLHF | | RAG | LangChain RAG From Scratch、LlamaIndex | | Agent / 多 Agent | OpenAI Swarm、LangGraph、AutoGen、tiny-agent、PocketFlow、smolagents | | 编码 Agent | learn-claude-code、claw0 |

计划使用:

  • cc_bili:本机配置为 claude-opus-4-8,用于重点审阅。
  • NewAPI:默认端点 https://da.shuaibi.me/v1,用于拉取模型列表并选择交叉验证模型。

当前执行结果:

| 验证项 | 结果 | | --- | --- | | NewAPI /v1/models | 返回 Invalid token,当前环境没有可用 token,无法拉取模型列表 | | cc_bili | 当前 shell 未找到该命令,无法执行 opus 审阅 | | 本地实验 | 使用 npm run labs 验证 | | 单元测试 | 使用 npm test 验证 | | 静态构建 | 使用 npm run build 验证 |

因此首版以社区参考、JS 实验和 Vitest 作为计算正确性的基线。后续拿到 NewAPI token 或恢复 cc_bili 后,应把逐章模型审阅结论追加到本节。