09 RAG：让模型使用外部资料

学习目标

模型参数里不可能包含所有最新资料。RAG 的做法是先从外部知识库找相关片段，再把片段放进 prompt，让模型基于资料回答。

Document
↓ chunk
Chunks
↓ embedding / lexical index
Retrieve
↓ rerank
Context
↓ prompt
LLM answer

LangChain RAG From Scratch 从切分、检索、生成逐步构建 RAG。LlamaIndex 展示了更完整的数据连接和索引工程。

这个实验使用 TF-IDF 风格检索复现 RAG 数据流。

运行：

npm run lab:09

实验使用 TF-IDF 风格检索，而不是向量模型。这样可以先理解 RAG 数据流，不被模型 API 和向量库细节挡住。