Web Sitesi Tasarimi
İnternet Sitesi Verimliliği
Firmalar
Yapanlar
Robots.txt dosyası nedir, nasıl kullanılır, Robotları yönlendirme ve kontrol etme

Robots.txt dosyası, arama motorları ve spider denen bilgi toplayıcı örümceklere sitenizdeki dosya ve klasörleri gezip kayıt etmeleri için izin veren ya da engelleyen dosyadır. Robot.txt dosyası, normal bir text dosyasından farksızdır ve basit bir editor yazılımı (Notepad gibi) ile hazırlanabilir. Dikkat edilmesi gereken konu, robots.txt dosyasının anasayfanızın ya da sitenizin bulunduğu root (ana klasör) klasörüne konulmasıdır. Bilmeniz gereken bir diğer ayrıntı, bazı zararlı robot ya da örümcekler, robots.txt dosyasını dikkate almazlar, çünkü amaçları bilgi ve e-mail toplamaktır.

Eğer sitenize dosya gönderemiyorsanız (ücretsiz sunucularda olabilir), robotları <META> tagları ile kontrol etmelisiniz:

<META NAME="ROBOTS" CONTENT="NOINDEX"> Bu komut, robotların, yani arama motorlarının sitenizi kaydetmemesini sağlar.
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> Bu komut ise, linkleri takip etmemesini belirtir.

Eğer sitenize dosya gönderme hakkına sahipseniz, robots.txt dosyasını nasıl oluşturacağımızı görelim. Öncelikle, buna neden ihtiyaç duyulduğunu söylemek gerekiyor: Tüm önemli arama motorları (google, yahoo, msn, altavista vb) robotları, sitenize girer girmez öncelikli olarak bir robots.txt dosyası arar. Sitenizin herhangi bir bölümüne yada bütününe örümceklerin girmelerini isteyin yada istemeyin; Bir robots.txt dosyası bulundurmak her zaman için yararlıdır. Çünkü bu dosya, örümcekler için ne yapacağını bilmesi açısından bir yardımcı görev yapar. Şimdi de robotları siteden uzak tutmanın nedenlerine inelim:

 

Hangi durumlarda robotları ya da örümcekleri engellemeliyim?

  1. Siteniz henüz tamamlanmamış olabilir. Ya da henüz tam oalrak bitmemiş sayfalar içeriyor olabilir. Ve bu durumda sitenizin ya da sayfalarınızın yarım yamalak kayıt edilmesini istemeyebilirsiniz.
  2. Şifrelemeye gerek duymadığınız, ama yine de sizin için özel olan bir içeriğe ya da bir bölüme sahip olabilirsiniz ve bunun arama motorları tarafından kayıt edilmesini ve aramalarda çıkmasını istemeyebilirsiniz.
  3. Hata sayfalarının, cgi-bin gibi klasörlerin ya da teşekkür ettiğiniz, içinde sadece "tamam" gibi kısa mesajlar bulundurduğunuz dosya ve klasörlerinizin kayıt edilmesi kimsenin işine yaramayacaktır.
  4. İçerik açısından birbirine benzeyen, geçişli sayfalarınız varsa bütün robotların aynı şeyi kaydetmesini istemeyebilirsiniz. Bu spam riski doğurabilir ve arama motorlarında engellenmenize yol açabilir.
  5. En önemlisi de, yer almak istemediğiniz arama motorlarından ya da e-mail toplayan zararlı örümceklerden robots.txt dosyası aracılığıyla kurtulabilirsiniz.

Robots.txt dosyası oluşturmak

Robots.txt dosyasını herhangi bir text editor (Örn. Notepad) ile oluşturabilirsiniz. Text dosyasının içeriği şu şekilde olmalıdır:

User-Agent: Robot ya da Örümcek ismi (* işareti hepsini kapsar)
Disallow: Klasör ya da Dosya ismi

Değişik örneklere birlikte bakalım:

 

Robots.txt ile bir dosyayı ya da klasörü belli bir bottan korumak

Mesela "Forum" diye bir bölüm oluşturuyorsunuz ve henüz tamamlanmadan robotların gelip kayıt etmesini istemiyorsunuz. Bu durumda, hedef tüm robotlar olduğu için özellikle robot ismi belirtmek yerine yıldız işareti * kullanmalısınız.

User-Agent: *
Disallow: /Forum/

Koruduğunuz bölüm isminin başına ve sonuna "/" işareti koymanız o klasördeki tüm dosyaları kapsayacaktır.

 

Tüm robotlara kayıt izmi vermek

Eğer tüm arama motorlarının sitemizi gezmesini istiyorsak, yine yıldız * işareti kullanıyoruz. Alttaki Disallow bölümünü ise boş bırakarak, engelleme yapmıyoruz.

User-agent: *
Disallow:
 

Tüm robotları bütün dosya ve klasörlerinizden uzak tutmak

Eğer tüm arama motorlarının sitemizden uzak tutmak istiyorsak, alttaki kod ile tüm robotları bütün dosya ve klasörlerinizden uzak tutabilir, kayıt etmelerini engelleyebilirsiniz.

User-agent: *
Disallow: /

 

Robots.txt ile birden fazla klasör engellemek

Eğer tüm arama motorlarının sitemizin istediğimiz bölümlerinden bazılarını gezmesini istiyorsak, bunu altalta yazarak yaparız. Bu ayarları dikkatli bir şekilde yapmalısınız, yoksa istemediğiniz dosya ve klasörleri kayıt ettirebilir, istediklerinizi engelleyebilirsiniz. Disallow ile, engellemek istediklerimizi belirtiyoruz.

User-agent: *
Disallow: /cgi-bin/
Disallow: /resimler/
Disallow: /dosyalar/
Disallow: /css/
Disallow: /onemli/
Disallow: /ozel/

Burada, cgi-bin, resimler, dosyalar, css, onemli, ozel klasörleri ve içinde bulunan tüm dosyalar robotlara yasaklanmış oluyor. Her klasör için ayrı bir komut yazmak en verimlisidir.

 

Belirli bir Robot ya da örümceği belli bir dosyaya erişimini engellemek

Google'ın resim dosyalarımızdan uzak durmasını istiyorsak :

User-Agent: Googlebot-Image
Disallow: /images/

Eğer dosyalarınız "images" klasöründe değil ve dağınık olarak değişik yerlerdeyse o zaman :

User-Agent: Googlebot-Image
Disallow: /

Sadece Altavista örümceğinin girmesini istemediğimiz klasörümüze, Altavista robotunun ismi olan Scooter ı ekliyoruz.

User-Agent: Scooter
Disallow: /

Robot isimleri hakkında daha fazla bilgi için http://www.robotstxt.org sitesini ziyaret edebilirsiniz. (sadece ingilizce)

Önceki Sayfa

 

 

» 360 derece mekan tanıtım
» Arama motorlarına kayıt işlemi nedir?
» Arama motorlarında ne kadar zaman içinde yer alabiliriz?
» Backlink alırken nelere dikkat etmelisiniz?
» Bilgisayar kullanırken sağlığınıza dikkat edin
» Bir Siteye veya Bir Hizmete Abone Olurken Dikkat Edilmesi Gereken Kurallar
» Bir Web Sitesine ihtiyacım var mı?
» Domain alırken dikkat edilecek hususlar
» Domain alırken nelere dikkat etmeli?
» Domainlere Zam geliyor
» Düzenlemeler için web sayfalarımıza nasıl ulaşabiliriz?
» E-ticaret sistemi için neler gereklidir?
» En az kaç sayfa web tasarım yaptırmalıyım?
» En iyi Domain Açık Arttırım Siteleri
» Google Adsense ile ilgili bilgiler
» Google Adsense optimizasyonu, kanallar
» Google Adsense optimizasyonu, raporlar
» Google ile ilgili temel bilgiler
» Google sayfalarınızı hızlıca indekslesin
» Google Sitemap nedir, ne işe yarar ve nasıl hazırlanır?
» Google tarafından yayınlanan sıralamalar ile ilgili öneriler
» Hosting alırken dikkat edilecek hususlar
» Hosting firması seçerken dikkat edilecek hususlar
» İnternet sitenizden para kazanmak
» İnternetten para kazanmanın 10 yolu
» İyi Bir Web Sitesi Nasıl Olmalı?
» Meta Tag nedir?
» Outlook 2003 Kurulumu
» Outlook 2007 Kurulumu
» Outlook Express Kurulumu
» Pagerank hesaplama formulü ve link değişiminin etkisi
» PAYPAL nedir, sistem nasıl çalışıyor?
» Robots.txt dosyası nedir, nasıl kullanılır, Robotları yönlendirme ve kontrol etme
» Sandbox ve filtre nedir?
» Sayfa güncellemeleri nasıl ücretlendirilir?
» SEO (Search Engine Optimization) nedir?
» SEO / Search Engine Optimization nedir?
» SEO da Domain yaşı önemi
» SEO ve Türk İnternet Kullanım Alışkanlıkları
» SEO'da Backlink ve Pagerank Kavramları
» Site Hit Artırma Yolları
» Site Yönetim Paneli nedir?
» sitenizi arama motorlarına ekleyin - google - yahoo - bing
» Tasarım ödeme planı nasıldır?
» Ülkemizde domain piyasası gerçekleri ve yasal durum
» Ürün resimleri nasıl temin edilir?
» VPOS kurulumu için gerekli başvuru ve prosedürler ve banka komisyonları
» Web Hosting nedir, özellikleri ve dikkat edilecekler
» Web sayfalarında neler olmalı?
» Web sitemi ne sıklıkla güncellemeliyim?
» Web sitemiz üzerinde video gösterimi yapabilir miyiz?
» Web sitesi tasarımları nasıl ücretlendirilir?
» Web tasarımcı olmak isteyenlerin uyması gerekenler
» Websitenizin Trafiğini Hızla Arttırmak İçin 10 Yol
» Windows Hakkında Bilgiler, Kullanımı ve Bazı İpuçları
» Windows Mail kurulumu - Windows Vista
» XHTML nedir? Seo için önemli midir?
» XML Nedir, Neler Yapılabilir?

Bazı Referanslarımız

EMLAK İLAN PORTALIEMLAK İLAN PORTALI
Üyelik Sistemi, Bireysel ve Kurumsal Emlak Kayıt Sistemi, Ayrıntılı Kayıt İnceleme ve Arama Modülü, Banner Reklam Uygulamaları, Üye Kredi Sistemi, İstatistik ve E-bülten Uygulamaları
http://www.emlakilani.com
İNTERAKTİF CDİNTERAKTİF CD
Flash tabanlı web site tasarımı. Flash XML veritabanı kontrolü, yönetim paneli, tanıtım, referans ve görsel giriş kontrolleri
http://www.interaktifcd.com
ARTEDUKA DUVAR KAĞITLARIARTEDUKA DUVAR KAĞITLARI
Ürün tanıtım, arka plan sayfa yönetim programı, Uygulama fotoğrafları ekleme modülü, Mesaj Sistemi, Yetkili kişi kontrolü...
http://www.arteduka.com
google
 
Anasayfa   |    Kurumsal   |    Çözümler   |    Web Sitesi Başvurusu   |    Referanslar   |    Yararlı Bilgiler     |    İletişim

 

 

web dizayn şirketi
web dizayn
google uygun web tasarım
İNTERAKSİYON LTD. ŞTİ. © 2011