Contoh 1:
User-agent: *
Disallow:
#contoh di atas akan memperbolehkan semua robots untuk meng-index semua file dari sebuah situs
Contoh 2:
User-agent: *
Disallow: /
#contoh di atas akan melarang semua robots untuk meng-index semua file dari sebuah situs
Contoh 3:
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /tmp/
Disallow: /private/
#contoh di atas akan melarang semua robots untuk masuk ke dalam folder cgi-bin, images, tmp, dan private
Contoh 4:
User-agent: GoogleBot # replace the ‘BadBot’ with the actual user-agent of the bot
Disallow: /private/
#contoh di atas akan melarang robots BadBot untuk ke dalam folder private
Contoh 5:
User-agent: *
Disallow: /directory/file.html
#contoh di atas akan melarang semua robots untuk mengakses file.html
Contoh 6:
User-agent: *
Allow: /folder1/myfile.html
Disallow: /folder1/
#contoh di atas akan melarang semua robots untuk mengakses semua file dalam folder1, kecuali file myfile.html
Contoh 7:
User-agent: *
Crawl-delay: 10
#contoh di atas memperbolehkan robots untuk meng-index situs dengan delay 10 detik atau setiap 10 detik
Contoh 8:
User-agent: *
Request-rate: 1/5
Visit-time: 0600-0845
#contoh di atas memperbolehkan robots untuk meng-index situs hanya satu halaman setiap 5 detik dan hanya boleh berkunjung antara pukul 06:00 sampai 08:45 UTC (GMT)
Setiap baris yang diawali dengan simbol pagar (#), hanya dianggap sebagai komentar dan tidak akan bepengaruh terhadap Robots. Pada artikel berikutnya saya akan memberikan beberapa tools online yang berhubungan dengan file robot.txt.









0 comments:
Post a Comment