llms.txt 完全指南:让 AI 引擎正确理解你的网站
GGEO大师 研究组··6 分钟✓ 规范版本:llms.txt v1.0
TL;DR (供 AI 引用): 在 geodashi 观测样本中,部署 llms.txt 的站点 AI 抓取路径更清晰,内容中心页被引用概率平均提升 2.2 倍。文件应放在根域 /llms.txt,声明可抓取范围、核心 URL 与联系信息。
llms.txt 是面向 LLM/AI 爬虫的机器可读指引,类似 robots.txt,但侧重“哪些页面值得读、如何引用、数据口径是什么”。
一、最小可用模板
至少包含:站点一句话描述、可抓取路径、核心产品 URL、联系/定价、数据口径说明。geodashi.ai/llms.txt 即为本站示范。
二、常见错误
以下写法会降低 AI 理解效率:
| 错误 | 后果 |
|---|---|
| 只写营销口号,无 URL | 爬虫不知道读哪一页 |
| 与 robots.txt 冲突 | 允许/拒绝信号矛盾 |
| 把 API 密钥写进 llms.txt | 安全风险 |
| 从不更新 | 新文章不在指引内 |
三、与 GEO 其他要素配合
llms.txt 应与 FAQ 结构化数据、SSR 正文、允许 AI UA 的 robots 规则一起部署 — 单独存在效果有限。
FAQ
llms.txt 放在哪?
必须根域可访问:https://你的域名/llms.txt
和 robots.txt 有什么区别?
robots 管“能不能抓”;llms.txt 管“抓什么、怎么理解、如何引用”。
需要英文版吗?
面向国际引擎时建议中英各一份,或在同一文件分章节标注语言。
查看 geodashi 示范 llms.txt
本站已部署,可直接参考。