<script>
var ahrefs_analytics_script = document.createElement('script');
ahrefs_analytics_script.async = true;
ahrefs_analytics_script.src = 'https://analytics.ahrefs.com/analytics.js';
ahrefs_analytics_script.setAttribute('data-key', 'MHQ1VDZaUyv1pIHGIXm+fA');
document.getElementsByTagName('head')[0].appendChild(ahrefs_analytics_script);
</script>

Robots.txt je konfigurační soubor, který umisťujeme do kořenového adresáře webu (např. www.vasedomena.cz/robots.txt). Slouží k tomu, aby vyhledávačům sdělil, které části webu mají nebo naopak nemají procházet a indexovat.

Je to první soubor, který crawler (např. Googlebot) při návštěvě webu hledá. Přestože jeho pokyny nejsou právně závazné, většina vyhledávačů je respektuje.

Proč je robots.txt důležitý

Jak má vypadat robots.txt

Robots.txt je jednoduchý textový soubor s pravidly. Každé pravidlo začíná definicí robota (User-agent) a pokračuje povolením nebo zákazem přístupu.

Základní syntaxe

User-agent: [název robota]
Allow: [cesta]
Disallow: [cesta]

Jednoduchý příklad

User-agent: *
Disallow: /admin/
Disallow: /tmp/
Allow: /

Tento příklad zakazuje indexaci administrace a dočasných souborů, ale povoluje ostatní obsah.

Příklady použití pro různé weby

1. WordPress

Ve WordPressu často nechceme indexovat složky jako /wp-admin/ nebo /wp-includes/.

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /wp-admin/admin-ajax.php

2. E-shopy (např. Shoptet, WooCommerce)

E-shopy mají často filtry a parametry, které generují duplicity.

User-agent: *
Disallow: /*?orderby=
Disallow: /*?filter=
Disallow: /kosik/
Disallow: /checkout/

3. Vývojové prostředí nebo staging web

Pokud testujete nový web, nechcete, aby se dostal do indexu.

User-agent: *
Disallow: /

Pokročilé tipy

Sitemap: https://www.vasedomena.cz/sitemap.xml
User-agent: Googlebot
Disallow: /privatni-data/

Časté chyby, kterým se vyhnout

  1. Omylem blokované důležité stránky – například zákaz celé domény.
  2. Záměna Allow a Disallow – nesprávná syntaxe může způsobit zmatek.
  3. Snahy o bezpečnost – robots.txt není zabezpečení, jen doporučení. Citlivá data ukládejte mimo dosah veřejnosti.

 

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *