ไฟล์ robots.txt เป็นไฟล์ที่ใช้ควบคุมการเข้าถึงและการเก็บข้อมูลของบอท (Crawler) จากเสิร์ชเอนจินต่อเว็บไซต์ โดยมีโครงสร้างและคำสั่งพื้นฐานสำคัญดังนี้
-
User-agent
ใช้ระบุชื่อบอทที่คำสั่งนั้น ๆ จะมีผล เช่นUser-agent: *
หมายถึงบอททุกตัวUser-agent: Googlebot
หมายถึงบอทของ Google เท่านั้น
-
Disallow
ใช้ระบุเส้นทางหรือส่วนของเว็บไซต์ที่ไม่อนุญาตให้บอทเข้าถึง เช่นDisallow: /admin/
ห้ามบอทเข้าถึงโฟลเดอร์ adminDisallow: /
ห้ามบอทเข้าถึงทุกส่วนของเว็บไซต์ (ไม่แนะนำสำหรับเว็บไซต์ทั่วไป)- หากไม่มีค่าใด ๆ หลังคำสั่งนี้ หมายความว่าอนุญาตให้บอทเข้าถึงทุกส่วน
-
Allow
ใช้ระบุส่วนของเว็บไซต์ที่อนุญาตให้บอทเข้าถึงได้ แม้จะอยู่ในส่วนที่ถูก Disallow ก็ตาม เช่นAllow: /public/
อนุญาตให้บอทเข้าถึงโฟลเดอร์ public
คำสั่งนี้มักใช้ร่วมกับ Disallow เพื่อสร้างข้อยกเว้น
-
Sitemap
ใช้บอกตำแหน่งไฟล์ Sitemap ของเว็บไซต์ เพื่อช่วยให้บอทสามารถเข้าถึงและดาวน์โหลดข้อมูลโครงสร้างเว็บไซต์ได้ง่ายขึ้น เช่นSitemap: https://example.com/sitemap.xml
โดยโครงสร้างไฟล์จะประกอบด้วยกลุ่มคำสั่งที่แยกตาม User-agent เพื่อกำหนดกฎเฉพาะสำหรับบอทแต่ละตัว ตัวอย่างโครงสร้างง่าย ๆ เช่น
User-agent: *
Disallow: /private/
Allow: /private/public-info.html
Sitemap: https://example.com/sitemap.xml
ซึ่งหมายความว่า บอททุกตัวจะถูกห้ามไม่ให้เข้าถึงโฟลเดอร์ /private/ ยกเว้นไฟล์ public-info.html และบอทจะได้รับข้อมูล Sitemap เพื่อช่วยในการเก็บข้อมูลเว็บไซต์อย่างมีประสิทธิภาพ.
TH Ranking ให้บริการทราฟฟิกเว็บไซต์คุณภาพสูงที่สุดในประเทศไทย เรามีบริการทราฟฟิกหลากหลายรูปแบบสำหรับลูกค้า ไม่ว่าจะเป็น ทราฟฟิกเว็บไซต์, ทราฟฟิกจากเดสก์ท็อป, ทราฟฟิกจากมือถือ, ทราฟฟิกจาก Google, ทราฟฟิกจากการค้นหา, ทราฟฟิกจาก eCommerce, ทราฟฟิกจาก YouTube และทราฟฟิกจาก TikTok เว็บไซต์ของเรามีอัตราความพึงพอใจของลูกค้า 100% คุณจึงสามารถสั่งซื้อทราฟฟิก SEO จำนวนมากทางออนไลน์ได้อย่างมั่นใจ เพียง 398 บาทต่อเดือน คุณสามารถเพิ่มทราฟฟิกเว็บไซต์ ปรับปรุงประสิทธิภาพ SEO และเพิ่มยอดขายได้ทันที!
เลือกแพ็กเกจทราฟฟิกไม่ถูกใช่ไหม? ติดต่อเราได้เลย ทีมงานของเราพร้อมให้ความช่วยเหลือ
ปรึกษาฟรี