llms.txt nedir ve nasıl çalışır?
Dosya sitenin kök dizininde /llms.txt adresinde durur ve herkes tarafından erişilebilir olmalıdır. İçeriği yapılandırılmış Markdown formatında yazılır: firma kimliği, hizmet alanı, önemli URL'ler ve iletişim kanalları. ChatGPT, Claude, Bing Copilot, Perplexity gibi sistemlerin crawlerları bu dosyayı okuyarak içeriği bağlamlandırır. robots.txt gibi belirleyici kural koyamaz; sadece bilgi verir.
robots.txt direktif dosyasıdır: hangi botun hangi sayfaya erişebileceğini kurallarla belirler. llms.txt bilgilendirme dosyasıdır, zorunlu değildir. Bot llms.txt'i yok sayabilir; ancak iyi yazılmış dosya özellikle niş endüstriyel sitelerde botun sizi daha doğru kategorize etmesine yardımcı olur.
Pratik açıdan: sitemap.xml crawlerlarına hangi sayfaların var olduğunu söyler; llms.txt sitenizin kim olduğunu ve ne yaptığını söyler. İkisi birbirini tamamlar. İçerik net ve iyi organize edilmişse llms.txt ek puan katar; içerik dağınık ve çelişkiliyse llms.txt onu kurtarmaz.
Dosyaya ne yazılmalı, ne yazılmamalı?
İyi bir llms.txt şunları içerir: kısa ve doğru firma tanımı (ne yapıyorsunuz, nerede, kime hizmet), coğrafi kapsam (Bursa merkez, Marmara saha, Türkiye uzaktan), kritik URL'ler (ana sayfa, blog, hizmetler, iletişim), iletişim kanalları ve güncelleme tarihi. Uzun pazarlama metni, ödül listesi, müşteri isimleri veya gizli bilgiler kesinlikle yazılmamalıdır.
Güncelleme tarihi özellikle önemlidir. Bot sitenizdeki llms.txt'i indeksleyip aylarca güncelleme görmezse özetinde eski bilgileri kullanabilir. Yeni içerik eklediğinizde tarih satırını da güncelleyin; bu küçük disiplin botlara "burada taze içerik var" sinyali verir.
En tehlikeli hata: gerçekte olmayan ödül, sertifika veya büyük marka ortaklığı yazmak. LLM sistemleri bu bilgiyi olduğu gibi alıntılayabilir ve yanlış bilgi bu şekilde yayılır. Her cümle savunulabilir ve doğrulanabilir olmalıdır.
robots.txt ile ilişki ve çelişen sinyaller sorunu
Bir sayfayı robots.txt ile disallow ettiyseniz o sayfayı llms.txt'te övmek anlamsızdır; bot görse bile erişemez. Tersine önemli bir sayfayı robots.txt ile yanlışlıkla bloklamak ve llms.txt'te öne çıkarmak çelişen sinyal üretir.
Benzer çelişki sitemap.xml ile de oluşabilir. Sitemap'e eklemediniz ama llms.txt'e URL yazdınız — mantıksız. Ya da sitemap'te 404 dönen sayfalar var; bunları her iki dosyadan da temizleyin. Üç dosyayı birlikte gözden geçirmek küçük ama değerli bir bakım rutinidir.
AI crawlerları için özel User-Agent kuralları yazılabilir; GPTBot veya ClaudeBot'u robots.txt'te Disallow ederseniz o botlar llms.txt'i de büyük ihtimalle okumayacaktır. Bu botların belirli sayfalardan beslenmesini istiyorsanız robots.txt'te Allow etmeyi düşünebilirsiniz.
Endüstriyel B2B site için pratik not
Tekstil makinesi otomasyonu veya PLC programlama gibi niş teknik hizmetler için llms.txt'in değeri ortalamanın üzerindedir. Bu alanlarda Türkçe içerik az, AI sistemlerinin mevcut bilgisi sınırlıdır. Doğru özet dosyası botun sizi daha iyi kategorize etmesini ve kullanıcı sorusuna daha doğru cevap üretmesini kolaylaştırır.
Ancak bu dosyanın etkisi sitenin gerçek içeriğinden bağımsız çalışmaz. Blog yazıları ince ve genel ise, hizmet sayfaları birbirini kopyalamışsa veya sayfalar yavaş açılıyorsa, llms.txt bu sorunları örtmez. Güçlü llms.txt, güçlü içeriğin üstüne koyulan son katmandır.