跳到正文
🟠 需外部服务 — 需自备相关账号/权限 入门 办公效率

本地知识库问答

把你的文档、PDF、笔记变成可以直接对话的知识库,用自然语言提问,秒得精准答案。

⚔️ 难度 ★☆☆ 入门
⏱ 配置耗时 5-10 分钟
🎁 掉落 节省 5-10 分钟
📜 所需秘籍 filesystem
🦞 部署 可一键部署

🎯 做完你会得到

把本地文档接入 OpenClaw,直接用对话提问,不再翻文件找答案。

🛠 需要什么

  • filesystem

👤 适合谁

  • 知识工作者
  • 律师
  • 研究员
  • 企业培训

⚡ 效果预览

问公司内部文档的问题,AI 直接给出答案并标注来源文件和段落

⚠️ 待验证案例:本案例基于 OpenClaw 文件读取能力的真实描述,具体效果因文档质量而异。如果你跑通了,欢迎联系站长提交验证记录。

🔧 Step 0:先确认外部工具配置

⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →

解决什么问题

公司内部文档越来越多,每次找一个信息要翻几十个文件。这个场景让你用对话代替搜索:

  • 谁会用到:有大量文档需要查阅的个人用户、小团队、研究人员
  • 省了什么:不用翻文件夹、不用 Ctrl+F,直接问直接得
  • 效果是什么:OpenClaw 读取你指定的文档,像专家一样回答你的问题,并标注来源段落

典型场景

  • 产品经理查 PRD 里的某个需求细节
  • 研究人员从论文笔记里找某个结论
  • 运维查内部 SOP 手册的某个操作步骤
  • 开发查自己写的技术设计文档

前置条件

  • OpenClaw 已安装(任何平台均可)
  • 你的文档放在本地可访问的路径(支持 .md、.txt、.pdf、.docx 等)
  • Claude Max 账号,或 Anthropic API Key

文档最好是纯文本或可提取文本的格式,扫描版 PDF 效果较差。

用到的工具

工具用途获取方式
文件读取(内置)读取本地文档内容OpenClaw 内置,无需安装
anthropic/claude-sonnet-4-6理解文档内容,回答问题Claude Max 账号,或 console.anthropic.com 获取 API Key

预期结果

做完之后你会看到:

  • 提问时:OpenClaw 先读取你指定的文档,再根据内容回答
  • 回答时:答案精准,并引用原文根据第3章……
  • 找不到时:明确告诉你文档中没有相关内容,不乱编

最简上手:直接发这句话

复制下面的话,发给你的 OpenClaw,把路径换成你自己的:

我有一批文档在 /Users/你的用户名/Documents/知识库/ 目录下,格式是 .md 和 .txt。

请帮我读取这个目录里所有文件,作为我的本地知识库。之后我问你问题,你先查这些文档再回答,并告诉我答案来自哪个文件的哪个部分。

第一个问题:[你的第一个问题]

OpenClaw 会自动扫描目录、读取文件、提取关键内容,然后回答你的问题。

进阶用法:让知识库持续可用

如果你想每次对话都能直接问,不用每次都重新指定路径,可以让 OpenClaw 帮你写进 SOUL.md 或 AGENTS.md:

帮我在工作区 AGENTS.md 里加一段,说明我有一个知识库在 /path/to/知识库/ 目录,
每次我问查文档文档里说手册里这类关键词时,
自动读取该目录的文档再回答。

这样配置后,OpenClaw 每次对话都会记住你的知识库位置。

直接上代码:批量读取文档目录

如果你想让 OpenClaw 一次性把整个目录的文档都加载进来,可以让它执行这个命令:

# 列出知识库目录里所有文档
find /path/to/你的知识库 -type f \( -name "*.md" -o -name "*.txt" -o -name "*.pdf" \) | head -50

然后告诉 OpenClaw根据上面列出的文件,逐个读取内容,建立索引后告诉我准备好了。

怎么验证成功了

  1. 让 OpenClaw 读取你的文档目录
  2. 问一个你知道答案的问题(比如文档里有明确写的某个数字或规定)
  3. 检查回答是否准确,以及是否引用了正确的文件名或段落

踩坑记录

文档太多,读取超时

症状:目录里有几百个文件,OpenClaw 卡住或超时。

解法:不要一次性读所有文件。先让 OpenClaw 列出文件名,你指定最相关的 5-10 个,再读取。或者把文档按主题分子目录,按需读取。

PDF 内容识别不准

症状:PDF 里的表格、图片内容无法被正确提取。

解法:把重要 PDF 转成 .md 或 .txt 格式再导入。可以用 pdftotext 命令行工具批量转换:

pdftotext 文件名.pdf 文件名.txt

回答内容来自”记忆”而非文档

症状:OpenClaw 回答了,但不确定是文档里的内容还是模型的通用知识。

解法:在问题里加一句只根据我提供的文档回答,如果文档里没有就直接说没有,这样强制限定信息来源。

中文文档乱码

症状:读取 .txt 文件时出现乱码。

解法:确保文件是 UTF-8 编码保存。用文本编辑器(VSCode 等)重新以 UTF-8 保存即可。

不满意怎么调

  • 想问某类文档 → 指定子目录或文件名,比如只看 2024 年的笔记
  • 想定期更新知识库 → 配合 cron,每天让 OpenClaw 扫描新增文件,更新索引摘要
  • 想多人共享 → 把文档放到共享网络路径,或用 Git 仓库同步
  • 想接入 PDF 表格 → 使用专门的 PDF 解析工具(如 Camelot)先提取成 CSV,再让 OpenClaw 读取

延伸阅读

#知识库#RAG#文档问答#效率工具