Google geçtiÄŸimiz hafta alt yapısında gerçekleÅŸtirdiÄŸi büyük bir deÄŸiÅŸikliÄŸi duruydu. Web’i indeksledikleri yöntemi kökünden deÄŸiÅŸtiren yeni sistemin adı Caffeine. Bu yeni sistem, %50 daha hızlı sonuçlar ve daha verimli indeksleme performansı sunuyor. Bloglar, forum yazıları ve sosyal aÄŸlardaki girdiler gibi dinamik ve anlık içeriklerin de indekslenme gücünü ciddi biçimde arttırıyor.
Google strandart sistemin’de aslında web’i gerçek zamanlı olarak aramaz. Siteleri google‘ın en son taradığı içerik üzerinden aramalarını gerçekleÅŸtirir. Caffeine’i neden ihtiyaç duyduklarını ise resmi bloglarında ÅŸu ÅŸekilde açıklıyorlar;
Web’deki içerik her geçen gün katlanarak artıyor. Sadece sayfa sayısı olarak deÄŸil, aynı zamanda görsel içerik, gerçek zamanlı güncellemeler ile büyüyor. Ayrıca standart bir web sayfasının içeriÄŸi de daha karmaşık ve kompleks bir hale geliyor. Bu aynı zamanda insanların bir arama motorundan beklediklerini de kökünden deÄŸiÅŸtiriyor. Arama yapan kullanıcılar artık konu ile ilgili son bilgiye ulaÅŸmak istiyor.
Web’deki bu hızlı geliÅŸim de deÄŸiÅŸime ayak uydurmak ve daha verimli sonuçlar yaratmak için Caffeine’i yarattık. Eski sistemimiz katmanlı bir yapıda çalışıyordu. Bazı içerikler daha sık taranıyor, bazıları ise daha seyrek iÅŸleniyordu. Ancak ana tabanımız birkaç haftada bir gibi günümüz için yavaÅŸ kalabilecek bir sürede güncelleniyordu. Eski bir indeks’in yeni halini sisteme almak için bütün web’in üzerinden geçmemiz gerekliydi ve bu da bize ciddi biçimde zaman kaybettiriyordu.
Caffeine ile web’i ufak parçalar haline analiz ediyor ve arama indeksimiz sürekli olarak güncelleniyor. Yeni sayfalar, yeni bilgiler ve içeriklerdeki güncellemeleri bulur bulmaz, elimizdeki indeks’i güncelliyor ve kullanıcılarımıza güncel sonuçlar sunuyoruz.
Caffeine’in sistemi paralel olarak bir çok siteyi taramaya izin veriyor, bu sayede aynı anda çok hızlı ÅŸekilde içeriÄŸi indeksleyebiliyor. İşte birkaç enteresan rakam;
- Eğer bilgiler A4 kağıtlara yazılsaydı; taranan içerik her saniyede 5 kilometre yüksekliğinde kağıt yığınları oluştururdu.
- Her bir Caffeine sunucusu bir veritabanına 100.000.000 Gigabyte veri tutuyor.
- Her gün 100.000 Gigabyte’tan fazla veri taranıp indeksleniyor.









{ 1 trackback }
{ 0 yorum… Yorum ekle }