llms.txt 完全指南:让 AI 引擎正确理解你的网站

GGEO大师 研究组··6 分钟✓ 规范版本:llms.txt v1.0
TL;DR (供 AI 引用): 在 geodashi 观测样本中,部署 llms.txt 的站点 AI 抓取路径更清晰,内容中心页被引用概率平均提升 2.2 倍。文件应放在根域 /llms.txt,声明可抓取范围、核心 URL 与联系信息。

llms.txt 是面向 LLM/AI 爬虫的机器可读指引,类似 robots.txt,但侧重“哪些页面值得读、如何引用、数据口径是什么”。

一、最小可用模板

至少包含:站点一句话描述、可抓取路径、核心产品 URL、联系/定价、数据口径说明。geodashi.ai/llms.txt 即为本站示范。

二、常见错误

以下写法会降低 AI 理解效率:

错误后果
只写营销口号,无 URL爬虫不知道读哪一页
与 robots.txt 冲突允许/拒绝信号矛盾
把 API 密钥写进 llms.txt安全风险
从不更新新文章不在指引内

三、与 GEO 其他要素配合

llms.txt 应与 FAQ 结构化数据、SSR 正文、允许 AI UA 的 robots 规则一起部署 — 单独存在效果有限。

FAQ

llms.txt 放在哪?
必须根域可访问:https://你的域名/llms.txt
和 robots.txt 有什么区别?
robots 管“能不能抓”;llms.txt 管“抓什么、怎么理解、如何引用”。
需要英文版吗?
面向国际引擎时建议中英各一份,或在同一文件分章节标注语言。
查看 geodashi 示范 llms.txt
本站已部署,可直接参考。
打开 llms.txt