De ce sa pui pe site-ul tau un fisier robots.txt?
Un fisier robots.txt este un fisier pentru a impiedica spider-ii motoarelor de cautare sa iti indexeze o parte din site (sau chiar tot site-ul). Poti intalni acest fisier si sub numele de Robots Exclusion Protocol. Robots.txt e o metoda complementara fata de Sitemap.xml.
Ce face un fisier robots.txt? Un astfel de fisier are rolul unei cereri catre roboti (pot fi toti robotii, sau se pot specifica doar niste roboti anume).
De ce ai exclude unele lucruri de la motoarele de cautare? E util sa faci acest lucru daca consideri ca continutul acela poate fi irelevant pentru motoarele de cautare. De asemenea, exista lucruri care poate doresti sa fie invizibile in cautarile Google din motive personale (vrei unele lucruri sa fie secrete).
Din pacate insa, protocolul e doar un sfat adresat robotilor de cautare, acestia il pot ignora. De asemenea, continutul poate fi invizibil robotilor, dar e perfect vizibil utilizatorilor obisnuiti ai site-ului.
Exemple de folosire a fisierului:
Asa permiti tuturor robotilor sa indexeze site-ul (varianta implicita, nu e nevoie de fisierul robots.txt in acest caz):
User-agent: *
Disallow:
In acest fel ii respingi pe toti:
User-agent: *
Disallow: /
Poti ignora doar anumite directoare de pe site-ul tau
User-agent: *
Disallow: /cgi-bin/
Disallow: /poze/
Disallow: /temporar/
Disallow: /masini/
Daca in loc de *, specifici un anume bot, doar acel bot va ignora continutul respectiv.
Daca vrei sa ne impartasesti parerea ta despre fisierul robots.txt, asteptam cu interes opinia ta.
Tags: bot, boti, cautare, cerere, cereri, crawler, fisier, fisiere, google, motoare de cautare, motor de cautare, request, requests, respingere, robot, roboti, robots.txt, sitemap, spider-ii, utilizator, vizibilitate

Februarie 6th, 2009 at 6:18 pm
Ai putea pune un astfel de robottxt pentru aia care sunt incepatori, robottxt este cel mai important dintre toate serviciile de trafic, adica ma refer ca, cu acest sitemap iti vin primi vizitatori targetati…
Toti ar trebui sa isi puna un robottxt, insa lenea si prostia prind teren
Februarie 9th, 2009 at 3:47 pm
E o diferenta intre sitemap si robots.txt. In robots.txt poti cel mult sa incluzi care e calea catre sitemap, si sa excluzi lucrurile, insa sitemap-ul s-ar putea sa fie uneori mai important.
Februarie 10th, 2009 at 3:30 am
[...] deci deunazi pe un foarte interesant blog o chestie foarte interesanta. Si m-am gandit ca merita mentionata. Suna cam vag, nu [...]
Martie 29th, 2009 at 9:18 pm
[...] Google Analytics: De ce ai folosi Google Analytics pe site-ul tau?; 7. About robots.txt standard: De ce sa pui pe site-ul tau un fisier robots.txt?; 8. HTML Sitemap: Care sunt functiile unui Sitemap general al site-ului?; 9. How to do SEO (some [...]
Mai 31st, 2009 at 7:06 pm
[...] http://www.anunturi-online-gratis.ro/robots.txt Problema trebuie rezolvata; De vazut mesajul: De ce sa pui pe site-ul tau un fisier robots.txt? De asemenea, ti-ar folosi din plin un sitemap.xml, pentru ca Google sa indexeze mai multe pagini: [...]