1 Temmuz 2011 Cuma

robots.txt nedir ne işe yarar

Domatez.net okurlarına bugun robot.txt ne işe yarar bilgilendirmek istedim.

Arama motorlarının indeksleme robotları bir web sitesine ulaştıklarında ilk olarak kök dizinde bulunan robots.txt dosyasını ararlar. Bu dosya robotlara hangi sayfaların indekslenip hangilerinin indekslenmeyeceğini anlatmak için yerleştirilir. Robotlar sadece kök dizindeki robots.txt dosyasına bakacakları için alt dizinlere bu dosyayı yerleştirmek anlamsızdır. Eğer alt dizinlerden birisine ait url (veya url’lerin) indekslenmesini istemiyorsanız bunlar da kök dizindeki robots.txt dosyasında bildirmeniz gerekiyor. Ya da alternatif olarak indekslenmesini istemediğiniz sayfalarda Meta Tag kullanabilirsiniz. Çoğu ücretsiz blog servisi kök dizine erişime izin vermediğinden Meta Tag’lardan yararlanmak gerekecetir…

User-agent: *
Disallow: /

User-agent: Googlebot
Disallow: /
User-agent: *
Disallow:

User-agent: *
Disallow:

Not: Boş bir robots.txt dosyası da aynı mesajı verecektir.

User-agent: *
Disallow: /dizin-adi/

User-agent: *
Disallow: /dizin-adi/ozel-sayfa.html

Robots.txt dosyasında “/dizin-adi/*” veya “/dizin-adi/*.html” gibi ifadeler kullanamazsınız. Hariç tutulmasını istediğiniz sayfaları ve dizinleri teker teker belirtmek zorundasınız. Tabii ki hariç tuttuğunuz bir dizinin içindeki dosyaları ayrıca belirtmenize gerek yok 

Örnek bir kod aşağıdaki şekilde olabilir;

# www.ornek.com için robots.txt dosyası
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/private/
Disallow: /private.html

robots txt nedirhttp://www.domatez.net/ robots.txt nedir ne işe yarar yazısında telif haklarına ve yasalara aykırı bir bilgi veya link bulunuyorsa lütfen buradan iletişime geçiniz.

Hiç yorum yok:

Yorum Gönder