🎯 做完你会得到
把本地文档接入 OpenClaw,直接用对话提问,不再翻文件找答案。
🛠 需要什么
- filesystem
👤 适合谁
- 知识工作者
- 律师
- 研究员
- 企业培训
⚡ 效果预览
问公司内部文档的问题,AI 直接给出答案并标注来源文件和段落
⚠️ 待验证案例:本案例基于 OpenClaw 文件读取能力的真实描述,具体效果因文档质量而异。如果你跑通了,欢迎联系站长提交验证记录。
🔧 Step 0:先确认外部工具配置
⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →
解决什么问题
公司内部文档越来越多,每次找一个信息要翻几十个文件。这个场景让你用对话代替搜索:
- 谁会用到:有大量文档需要查阅的个人用户、小团队、研究人员
- 省了什么:不用翻文件夹、不用 Ctrl+F,直接问直接得
- 效果是什么:OpenClaw 读取你指定的文档,像专家一样回答你的问题,并标注来源段落
典型场景:
- 产品经理查 PRD 里的某个需求细节
- 研究人员从论文笔记里找某个结论
- 运维查内部 SOP 手册的某个操作步骤
- 开发查自己写的技术设计文档
前置条件
- OpenClaw 已安装(任何平台均可)
- 你的文档放在本地可访问的路径(支持 .md、.txt、.pdf、.docx 等)
- Claude Max 账号,或 Anthropic API Key
文档最好是纯文本或可提取文本的格式,扫描版 PDF 效果较差。
用到的工具
| 工具 | 用途 | 获取方式 |
|---|---|---|
| 文件读取(内置) | 读取本地文档内容 | OpenClaw 内置,无需安装 |
| anthropic/claude-sonnet-4-6 | 理解文档内容,回答问题 | Claude Max 账号,或 console.anthropic.com 获取 API Key |
预期结果
做完之后你会看到:
- 提问时:OpenClaw 先读取你指定的文档,再根据内容回答
- 回答时:答案精准,并引用原文根据第3章……
- 找不到时:明确告诉你文档中没有相关内容,不乱编
最简上手:直接发这句话
复制下面的话,发给你的 OpenClaw,把路径换成你自己的:
我有一批文档在 /Users/你的用户名/Documents/知识库/ 目录下,格式是 .md 和 .txt。
请帮我读取这个目录里所有文件,作为我的本地知识库。之后我问你问题,你先查这些文档再回答,并告诉我答案来自哪个文件的哪个部分。
第一个问题:[你的第一个问题]
OpenClaw 会自动扫描目录、读取文件、提取关键内容,然后回答你的问题。
进阶用法:让知识库持续可用
如果你想每次对话都能直接问,不用每次都重新指定路径,可以让 OpenClaw 帮你写进 SOUL.md 或 AGENTS.md:
帮我在工作区 AGENTS.md 里加一段,说明我有一个知识库在 /path/to/知识库/ 目录,
每次我问查文档文档里说手册里这类关键词时,
自动读取该目录的文档再回答。
这样配置后,OpenClaw 每次对话都会记住你的知识库位置。
直接上代码:批量读取文档目录
如果你想让 OpenClaw 一次性把整个目录的文档都加载进来,可以让它执行这个命令:
# 列出知识库目录里所有文档
find /path/to/你的知识库 -type f \( -name "*.md" -o -name "*.txt" -o -name "*.pdf" \) | head -50
然后告诉 OpenClaw根据上面列出的文件,逐个读取内容,建立索引后告诉我准备好了。
怎么验证成功了
- 让 OpenClaw 读取你的文档目录
- 问一个你知道答案的问题(比如文档里有明确写的某个数字或规定)
- 检查回答是否准确,以及是否引用了正确的文件名或段落
踩坑记录
文档太多,读取超时
症状:目录里有几百个文件,OpenClaw 卡住或超时。
解法:不要一次性读所有文件。先让 OpenClaw 列出文件名,你指定最相关的 5-10 个,再读取。或者把文档按主题分子目录,按需读取。
PDF 内容识别不准
症状:PDF 里的表格、图片内容无法被正确提取。
解法:把重要 PDF 转成 .md 或 .txt 格式再导入。可以用 pdftotext 命令行工具批量转换:
pdftotext 文件名.pdf 文件名.txt
回答内容来自”记忆”而非文档
症状:OpenClaw 回答了,但不确定是文档里的内容还是模型的通用知识。
解法:在问题里加一句只根据我提供的文档回答,如果文档里没有就直接说没有,这样强制限定信息来源。
中文文档乱码
症状:读取 .txt 文件时出现乱码。
解法:确保文件是 UTF-8 编码保存。用文本编辑器(VSCode 等)重新以 UTF-8 保存即可。
不满意怎么调
- 想问某类文档 → 指定子目录或文件名,比如只看 2024 年的笔记
- 想定期更新知识库 → 配合 cron,每天让 OpenClaw 扫描新增文件,更新索引摘要
- 想多人共享 → 把文档放到共享网络路径,或用 Git 仓库同步
- 想接入 PDF 表格 → 使用专门的 PDF 解析工具(如 Camelot)先提取成 CSV,再让 OpenClaw 读取