RevealTheme logo

robots.txt检查器

解析robots.txt文件。按user-agent分组显示规则并标记问题。

什么是robots.txt检查器?

robots.txt是一种自愿性协议,用于告诉网络爬虫它们可以访问什么。主流搜索引擎会遵守它;恶意机器人则会无视它。常见错误包括屏蔽关键资源、错误使用通配符以及忘记包含Sitemap指令。本检查器会解析任意robots.txt并按user-agent对规则进行分组。

常见问题

robots.txt放在哪里?
始终放在域名的根目录:ejemplo.com/robots.txt。放在子目录里不起作用。
Disallow和noindex有什么区别?
Disallow阻止抓取;noindex(在meta标签中)阻止索引。两者不可互换。

相关工具