robots.txt生成器
以可视化方式生成robots.txt文件。为主流搜索引擎和AI机器人配置抓取规则。
User-agent: * Allow: / Disallow: /admin/ Disallow: /api/ Sitemap: https://example.com/sitemap.xml
如何使用本工具
- 1
Tick 'Allow all standard crawlers' to add an explicit Allow: / line, or untick it to leave it out.
- 2
Enter the paths you want crawlers to skip in the disallowed box, one per line (for example /admin/ or /api/).
- 3
Optionally tick 'Block AI training crawlers' to add Disallow rules for GPTBot, ClaudeBot, PerplexityBot, CCBot and Google-Extended, and paste your sitemap URL.
- 4
Select the generated text in the preview box, copy it, and save it as a file named robots.txt at your domain root.
什么是robots.txt生成器?
robots.txt告诉网络爬虫哪些页面可以访问、哪些不可以。它是一种自愿性协议:行为规范的爬虫会遵守它;恶意机器人则会无视它。本生成器创建符合标准的robots.txt文件。对于复杂规则,请查阅robotstxt.org和完整的规范。
常见使用场景
Keeping crawlers out of admin, API, or internal paths like /admin/ and /api/ while leaving the rest of the site open.
Generating a starter robots.txt for a brand-new site that does not have one yet.
Blocking the five named AI training crawlers (GPTBot, ClaudeBot, PerplexityBot, CCBot, Google-Extended) so your content is not scraped for model training.
Adding or correcting the Sitemap: line so search engines can discover your sitemap.xml.
Drafting rules quickly to paste into a CMS or static-site config, then hand-editing for anything advanced.
Teaching teammates what a minimal, readable robots.txt looks like before they edit the real one.
常见问题
我应该把robots.txt上传到哪里?▼
我应该屏蔽AI机器人吗?▼
相关工具
密码生成器
在你的浏览器中生成具有加密强度的密码。不会向任何服务器发送任何内容:随机字节来自你浏览器的crypto API。
WordPress用户名生成工具
生成安全、随机的WordPress管理员用户名。切勿使用“admin”:它是暴力破解的头号攻击目标。
域名生成器
根据一个关键词生成具有品牌潜力的域名创意。组合方式包含常见的前缀、后缀和修饰词。
公司名称生成器
生成具有品牌潜力的公司名称创意。将真实词汇与修饰词组合,生成易记的名称。
URL别名(slug)生成工具
将文本转换为适合URL的别名:转为小写、移除特殊字符,并用连字符分隔单词。
Lorem Ipsum生成器
为样机和设计稿生成占位文本。可选择段落、句子或单词。