· Mace Otomasyon

llms.txt: AI crawlerlar için ne işe yarar, hangi beklentiler boştur?

llms.txt AI crawlerlarına site haritası ve kimlik özeti sunar; içerik kalitesinin yerini almaz. robots.txt ile farkı, ne yazılmalı ne yazılmamalı; pratik rehber.

llms.txt bir web sitesinin kök dizinine konan ve içeriği hakkında yapay zekâ sistemlerine kısa, makine okunur özet sunan metin dosyasıdır. 2024'te önerilmeye başlayan bu format, crawlerların ve LLM'lerin site içeriğini daha doğru yorumlamasına yardımcı olmayı amaçlar. İşe yaradığı yer: botlara "şuraya bak, bunlar önemli URL'ler, şirketi bu kategoriye koy" demek. İşe yaramadığı yer: zayıf içeriği güçlü göstermek ya da sıralama garantisi vermek. maceotomasyon.com.tr kökünde bu dosya duruyor; kurulum notlarını paylaşıyoruz.

llms.txt nedir ve nasıl çalışır?

Dosya sitenin kök dizininde /llms.txt adresinde durur ve herkes tarafından erişilebilir olmalıdır. İçeriği yapılandırılmış Markdown formatında yazılır: firma kimliği, hizmet alanı, önemli URL'ler ve iletişim kanalları. ChatGPT, Claude, Bing Copilot, Perplexity gibi sistemlerin crawlerları bu dosyayı okuyarak içeriği bağlamlandırır. robots.txt gibi belirleyici kural koyamaz; sadece bilgi verir.

robots.txt direktif dosyasıdır: hangi botun hangi sayfaya erişebileceğini kurallarla belirler. llms.txt bilgilendirme dosyasıdır, zorunlu değildir. Bot llms.txt'i yok sayabilir; ancak iyi yazılmış dosya özellikle niş endüstriyel sitelerde botun sizi daha doğru kategorize etmesine yardımcı olur.

Pratik açıdan: sitemap.xml crawlerlarına hangi sayfaların var olduğunu söyler; llms.txt sitenizin kim olduğunu ve ne yaptığını söyler. İkisi birbirini tamamlar. İçerik net ve iyi organize edilmişse llms.txt ek puan katar; içerik dağınık ve çelişkiliyse llms.txt onu kurtarmaz.

Dosyaya ne yazılmalı, ne yazılmamalı?

İyi bir llms.txt şunları içerir: kısa ve doğru firma tanımı (ne yapıyorsunuz, nerede, kime hizmet), coğrafi kapsam (Bursa merkez, Marmara saha, Türkiye uzaktan), kritik URL'ler (ana sayfa, blog, hizmetler, iletişim), iletişim kanalları ve güncelleme tarihi. Uzun pazarlama metni, ödül listesi, müşteri isimleri veya gizli bilgiler kesinlikle yazılmamalıdır.

Güncelleme tarihi özellikle önemlidir. Bot sitenizdeki llms.txt'i indeksleyip aylarca güncelleme görmezse özetinde eski bilgileri kullanabilir. Yeni içerik eklediğinizde tarih satırını da güncelleyin; bu küçük disiplin botlara "burada taze içerik var" sinyali verir.

En tehlikeli hata: gerçekte olmayan ödül, sertifika veya büyük marka ortaklığı yazmak. LLM sistemleri bu bilgiyi olduğu gibi alıntılayabilir ve yanlış bilgi bu şekilde yayılır. Her cümle savunulabilir ve doğrulanabilir olmalıdır.

robots.txt ile ilişki ve çelişen sinyaller sorunu

Bir sayfayı robots.txt ile disallow ettiyseniz o sayfayı llms.txt'te övmek anlamsızdır; bot görse bile erişemez. Tersine önemli bir sayfayı robots.txt ile yanlışlıkla bloklamak ve llms.txt'te öne çıkarmak çelişen sinyal üretir.

Benzer çelişki sitemap.xml ile de oluşabilir. Sitemap'e eklemediniz ama llms.txt'e URL yazdınız — mantıksız. Ya da sitemap'te 404 dönen sayfalar var; bunları her iki dosyadan da temizleyin. Üç dosyayı birlikte gözden geçirmek küçük ama değerli bir bakım rutinidir.

AI crawlerları için özel User-Agent kuralları yazılabilir; GPTBot veya ClaudeBot'u robots.txt'te Disallow ederseniz o botlar llms.txt'i de büyük ihtimalle okumayacaktır. Bu botların belirli sayfalardan beslenmesini istiyorsanız robots.txt'te Allow etmeyi düşünebilirsiniz.

Endüstriyel B2B site için pratik not

Tekstil makinesi otomasyonu veya PLC programlama gibi niş teknik hizmetler için llms.txt'in değeri ortalamanın üzerindedir. Bu alanlarda Türkçe içerik az, AI sistemlerinin mevcut bilgisi sınırlıdır. Doğru özet dosyası botun sizi daha iyi kategorize etmesini ve kullanıcı sorusuna daha doğru cevap üretmesini kolaylaştırır.

Ancak bu dosyanın etkisi sitenin gerçek içeriğinden bağımsız çalışmaz. Blog yazıları ince ve genel ise, hizmet sayfaları birbirini kopyalamışsa veya sayfalar yavaş açılıyorsa, llms.txt bu sorunları örtmez. Güçlü llms.txt, güçlü içeriğin üstüne koyulan son katmandır.

Sıkça sorulan sorular

llms.txt olmadan AI sistemleri beni bulamaz mı?

Hayır, bulabilir. Sitemap ve sayfa içeriği AI botlarının sizi keşfetmesi için yeterlidir. llms.txt kategorilendirme doğruluğuna katkı sağlar; olmadığında botlar yine çalışır.

Dosya ne sıklıkla güncellenmelidir?

Firma bilgisi veya hizmet kapsamı değiştiğinde ve önemli yeni içerik eklediğinizde güncelleyin. Aylık kontrol genellikle yeterlidir. Güncelleme tarihi satırını da değiştirmeyi unutmayın.

Her blog yazısının URL'sini eklememiz gerekiyor mu?

Gerekmiyor. Çok uzun dosya okunmaz ve etkisizdir. Blog hub sayfasını listelemek yeterlidir; crawler oradan tüm yazılara ulaşabilir.

Yandex bu dosyayı dikkate alıyor mu?

Yandex resmi destek açıklamamıştır. Ancak Yandexbot dosyayı okuyabilir. Yandex görünürlüğü için asıl etkili olan Yandex İşletmem ve tutarlı yerel SEO sinyalleridir.

Fiyat bilgisi llms.txt'e yazılabilir mi?

Hayır. Dosya herkese açıktır. Fiyat değiştiğinde güncellemezseniz yanlış bilgi yayılır. Genel fiyatlandırma modelini anlatmak mümkündür ama rakam yazmaktan kaçının.