
#### 2.1 RAG 的核心思想

RAG = **检索**（Retrieval） + **生成**（Generation）

1. **检索阶段**：用户提问 → 转为向量 → 在向量数据库中找最相关的几段原文。
2. **生成阶段**：把原文片段 + 用户问题 一起喂给大模型 → 生成自然、准确的回答。

这样既避免了大模型“胡说八道”（幻觉），又能让回答紧扣原著内容。

#### 2.2 电子书 RAG 的典型流程

以《三体.epub》为例：



`EPUB 文件     ↓ (用 EPubLoader 加载) 按章节分割的文档     ↓ (用 TextSplitter 切片) 500 字左右的文本块（带章节、页码等元数据）    ↓ (用 OpenAI Embedding 模型) 每个文本块 → 1024 维向量    ↓ (存入 Milvus) 向量 + 元数据 存入集合（Collection）    ↓ (用户提问) 问题 → 向量 → Milvus 检索 Top-K 相似片段    ↓ (送入 ChatGPT) 生成最终答案`

整个过程自动化，用户只需问一句“红岸基地是做什么的？”，系统就能精准定位到相关段落并总结回答。

  

作者：Tzarevich  
链接：https://juejin.cn/post/7618434890031202319  
来源：稀土掘金  
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。