RevealTheme logo

Trình kiểm tra robots.txt

Phân tích các tệp robots.txt. Hiển thị các quy tắc được nhóm theo user-agent và chỉ ra các vấn đề.

Cách sử dụng công cụ này

  1. 1

    Enter a site URL, for example https://example.com. If you leave off the path, the tool appends /robots.txt automatically.

  2. 2

    Click Analyze. The server fetches that site's live robots.txt and returns it.

  3. 3

    Read the raw file at the top, then scroll the parsed cards below to see Allow, Disallow, and Sitemap entries grouped by User-agent.

  4. 4

    Adjust the URL and analyze again to compare another host or a different environment.

Trình kiểm tra robots.txt là gì?

robots.txt là một giao thức tự nguyện để cho các trình thu thập dữ liệu web biết chúng có thể truy cập những gì. Các công cụ tìm kiếm chính tôn trọng nó; các bot độc hại bỏ qua nó. Các lỗi phổ biến bao gồm chặn các tài nguyên quan trọng, dùng ký tự đại diện sai cách và quên đưa vào một chỉ thị Sitemap. Trình kiểm tra này phân tích bất kỳ robots.txt nào và nhóm các quy tắc theo user-agent.

Các trường hợp sử dụng phổ biến

  • Confirm a production site is not accidentally serving Disallow: / that blocks every crawler before a launch.

  • Audit a competitor's robots.txt to see which sections they keep out of search engines.

  • Check that your Sitemap directive is present and points at the correct sitemap URL.

  • Compare the robots.txt on a staging host against production to catch a stray block before deploy.

  • Verify that a specific bot, such as GPTBot or Bingbot, has its own group with the rules you expect.

  • Quickly inspect any third-party domain's crawl rules when debugging why a page is missing from search results.

Câu hỏi thường gặp

robots.txt được đặt ở đâu?
Luôn ở thư mục gốc của tên miền: ejemplo.com/robots.txt. Trong các thư mục con thì không hoạt động.
Sự khác biệt giữa Disallow và noindex là gì?
Disallow ngăn việc thu thập dữ liệu; noindex (trong một thẻ meta) ngăn việc lập chỉ mục. Chúng không thể thay thế cho nhau.

Công cụ liên quan