Robots.txt za WordPress: šta sme, a šta ne sme da se blokira

Aleksandar Đekić – stručnjak za izradu WordPress sajta i web dizajn u Beogradu

Robots.txt za WordPress: Vaš vodič za kontrolu indeksiranja

Robots.txt datoteka je prva linija komunikacije između vašeg WordPress sajta i pretraživača poput Google-a. To je jednostavan tekstualni fajl koji se nalazi u korenskom direktorijumu vašeg domena (npr. vašsajt.rs/robots.txt) i koji daje instrukcije web robotima o tome koje delove sajta smeju, a koje ne smeju da pregledaju i indeksiraju. Iako se često naziva "blokatorom", robots.txt je zapravo zahtev – poštovanje ovih instrukcija zavisi od dobronamernosti pretraživača.

Pravilno podešena robots.txt datoteka je ključna za SEO optimizaciju vašeg WordPress sajta. Ona štiti osetljive delove, usmerava "budžet za pretraživanje" (crawl budget) ka važnim stranicama i sprečava pojavu duplog sadržaja u indeksu. Međutim, jedna greška može da sakrije važne stranice od Google-a, što može katastrofalno da utiče na vaš rangiranje.

Šta je robots.txt i kako funkcioniše?

Robots.txt datoteka koristi jednostavan sintaksis. Osnovne komande su User-agent: (koji robot) i Disallow: (šta blokirati). Možete i da dozvolite pristup koristeći Allow:, što je korisno za precizniju kontrolu unutar blokiranih oblasti.

Kada pretraživač poseti vaš sajt, prvo traži ovu datoteku. Ako je pronađe, čita instrukcije i, u većini slučaja, poštuje ih. Važno je napomenuti da robots.txt ne sprečava pristup. On samo kaže robotima da ne treba da pristupe određenim URL-ovima. Ako neko zna direktnu adresu, i dalje može da vidi tu stranicu. Za potpunu zaštitu potrebna je autentifikacija ili .htaccess blokada.

Šta sme (i treba) da se blokira u WordPress-u

Blokiranje nevažnih, privatnih ili tehničkih delova sajta oslobađa resurse vašeg servera i fokusira pretraživače na sadržaj koji želite da rangira.

1. Administrativni i sistemski direktorijumi

Ovo je apsolutni minimum. Morate zaštititi wp-admin i wp-includes.

User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/

Direktorijum wp-admin sadrži kontrolnu tablu, a wp-includes sistemske fajlove. Pristup ovim folderima robotima je potpuno nepotreban i predstavlja bezbednosni rizik.

2. Tehnički i backup fajlovi

Blokirajte pristup fajlovima koji služe za funkcionisanje sajta ili su rezervne kopije.

Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-config.php
Disallow: /readme.html
Disallow: /license.txt

Blokiranje plugins i themes foldera sprečava konkurenciju da lako vidi koje dodatke i temu koristite. Fajlovi kao što su wp-config.php (sa podacima za bazu) i readme.html nikada ne treba da budu javno dostupni.

3. Parametarske i pretraživačke stranice

WordPress i posebno WooCommerce generišu mnoge varijante URL-ova koji mogu da stvore problem duplog sadržaja.

Disallow: /?s=*
Disallow: /search/
Disallow: /feed/
Disallow: /*?replytocom
Disallow: /*?utm_
Disallow: /wp-json/

Ovim se blokiraju interni rezultati pretrage, RSS feedovi (ako ih ne koristite namenski), komentari sa parametrima, URL-ovi za praćenje kampanja (UTM tagovi) i REST API endpointi (osim ako ih eksplicitno ne koristite). Za WooCommerce prodavnicu, posebnu pažnju posvetite optimizaciji XML sitemap-a koji će pravilno predstaviti vaše proizvode.

4. Privatni korisnički sadržaj

Ako imate deo sajta namenjen registrovanim korisnicima (npr. zona za članove, nalog kupca), blokirajte ga.

Disallow: /my-account/
Disallow: /members/
Disallow: /private/

Ovo je posebno važno ako radite na izradi sajta za online kurseve ili membership model.

Šta NE SME da se blokira u WordPress-u

Ovo je još važnije od znanja šta blokirati. Blokiranje pogrešnih stvari može da onesposobi vaš SEO.

1. Javni sadržaj: Stranice, Postovi, Kategorije

Nikada nemojte blokirati:

  • Vašu pocetnu-stranu (samo /)
  • Stranice (npr. /o-nama/, /usluge/)
  • Blog postove i kategorije bloga
  • Stranice sa proizvodima i kategorije prodavnice (ako imate WooCommerce)
    Ako blokirate Disallow: /, potpuno ćete sakriti ceo sajt od pretraživača. Uvek proverite da li važne stranice, poput one na kojoj postavljate jasnu ponudu, nisu slučajno isključene.

2. Ključni SEO fajlovi: XML Sitemap i Favicon

# OVO JE POGREŠNO:
Disallow: /sitemap.xml
Disallow: /favicon.ico

XML sitemap (sitemap_index.xml ili sitemap.xml) je mapa vašeg sajta koju Google koristi za efikasnije otkrivanje stranica. Blokiranjem mu otežavate posao. Favicon je potreban za prikaz u pretraživaču.

3. CSS, JavaScript i slike

# OVO JE POGREŠNO:
Disallow: /wp-content/uploads/
Disallow: /wp-content/themes/vas-tema/assets/css/
Disallow: /wp-content/themes/vas-tema/assets/js/

Moderni Google botovi moraju da vide CSS i JS fajlove kako bi pravilno renderovali stranicu i procenili korisničko iskustvo (pogotovo za Core Web Vitals). Blokiranjem ovih resursa možete dobiti lažno loše rezultate za brzinu i vizuelnu stabilnost. Slično važi i za slike iz uploads foldera koje su deo vašeg sadržaja.

4. Važni direktorijumi za korisničko iskustvo

Direktorijum wp-content/uploads/ (ili wp-content/cache/ ako koristite caching plugin) ne treba blokirati u celini, jer sadrži javne medijske fajlove. Umesto toga, možete blokirati specifične putanje unutar njih koje su tehničke prirode (npr. /wp-content/uploads/cache/), ali ne i celu glavnu uploads putanju.

Kako pravilno podesiti robots.txt u WordPress-u

  1. Ručno kreiranje: Kreirajte fajl robots.txt u korenu vašeg WordPress instalacijskog foldera na serveru (isti nivo gde je wp-config.php). Ovo zahteva FTP pristup.
  2. Korišćenje SEO plugina: Najjednostavniji i najsigurniji način. Plugini kao što su Yoast SEO, Rank Math ili All in One SEO imaju module za generisanje i upravljanje robots.txt datotekom kroz WordPress admin. Oni automatski dodaju osnovna pravila i omogućavaju vam jednostavno dodavanje custom pravila.
  3. Testiranje: Uvek testirajte svoju robots.txt datoteku. Koristite Google Search Console alat "Test robots.txt". Unesite URL koji želite da testirate i proverite da li je robotima dozvoljen ili zabranjen pristup.

Napredne smernice i najbolje prakse

  • Sitemap u robots.txt: Uvek dodajte lokaciju vašeg XML sitemap-a na vrhu robots.txt datoteke: Sitemap: https://vasajt.rs/sitemap_index.xml. Ovo pomaže pretraživačima da ga brže pronađu.
  • Specifični User-agenti: Možete davati različite instrukcije za različite botove (npr. User-agent: Googlebot-Image za Google bot koji indeksira slike).
  • Wildcards: Znak * se koristi kao džoker. Na primer, Disallow: /*?* blokira sve URL-ove koji sadrže upitnik i parametre.
  • Pravilno formatiranje: Svako pravilo mora biti u novom redu. Prazne linije mogu da prekinu parsiranje.

Konačno, imajte na umu da je robots.txt samo jedan deo SEO slagalice. Za maksimalan učinak, vaš sajt treba da ima i pravilno postavljen kanonikal tag, optimizovanu internu link strukturu i brzo učitavanje. Ako planirate redizajn postojećeg sajta, proverite i ažurirajte robots.txt datoteku kao deo procesa migracije kako biste izbegli pad pozicija.

Ukoliko vam je potrebna pomć oko podešavanja ili želite da proverite da li je konfiguracija vašeg sajta optimalna, slobodno mi se obratite putem kontakt forme. Takođe, možete da vidite kako sam primenjujem ove principe u praksi u mom portfoliju realizovanih radova.


Često postavljana pitanja (FAQ) o robots.txt u WordPress-u

1. Da li robots.txt garantuje da se stranica neće pojaviti u Google rezultatima?
Ne, robots.txt ne garantuje. To je zahtev pretraživačima da ne pregledaju (crawl) određeni URL. Međutim, ako postoje drugi linkovi ka toj stranici, Google je i dalje može indeksirati. Za potpunu zabranu indeksiranja koristite noindex meta tag ili X-Robots-Tag HTTP header, a zatim toj stranici dozvolite pristup u robots.txt kako bi Google bot mogao da vidi noindex direktivu.

2. Kako da proverim da li je moja robots.txt datoteka aktivna i da li je Google vidi?
Najlakši način je da u pretraživaču otvorite vassajt.rs/robots.txt. Zatim, koristite Google Search Console. U alatku "Test robots.txt" možete da simulirate kako Google bot tumači vaša pravila za određeni URL. Takođe, u izveštaju "Pokrivenost" (Coverage) možete videti da li Google nailazi na probleme prilikom pregledavanja zbog vaših pravila.

3. Da li treba da blokiram staging ili test okruženje?
Apsolutno da. Ako imate testnu verziju sajta na poddomenu (npr. test.vassajt.rs) ili u podfolderu, obavezno je blokirajte u njenoj sopstvenoj robots.txt datoteki sa Disallow: /. Ovo sprečava indeksiranje nedovršenog sadržaja i pojavu duplog sadržaja sa produkcijskim sajtom. Ovo je standardna procedura u profesionalnoj izradi WordPress sajtova.

4. Šta ako moj WordPress sajt nema robots.txt datoteku?
Ako ne postoji robots.txt fajl, pretraživači će podrazumevano pretpostaviti da im je dozvoljen pristup svim delovima sajta i nastaviće da ga pregledavaju. To nije nužno loše, ali nije optimalno. Bez robots.txt ne usmeravate "crawl budget" i ostavljate otvorenim pristup tehničkim folderima. Preporučuje se da je kreirate.

5. Kako robots.txt utiče na brzinu mog sajta?
Posredno, ali značajno. Pravilno konfigurisan robots.txt sprečava pretraživače da troše vreme i resurse vašeg servera na pregledavanje beskorisnih, tehničkih ili privatnih stranica (poput admin panela, parametarskih URL-ova). Ovo oslobađa server za opsluživanje stvarnih posetilaca i može doprineti boljim performansama, što je ključno za brzinu i konverziju sajta.

Treba ti sajt? Imate pitanje za mene?

Ako vam je potrebna pomoć oko izrade sajta ili imate bilo kakvo pitanje vezano za vaš online projekat, slobodno me kontaktirajte.

Ovde sam da vam pružim profesionalnu podršku i odgovorim na sva vaša pitanja.

Popunite formu ispod sa svojim podacima i porukom, a ja ću vam se javiti u najkraćem roku.

Hajde da zajedno kreiramo rešenje koje odgovara vašim potrebama i ciljevima!