10.11.2018 Güncellemeleri

Bildiğiniz üzre bul7 bilinen veritabanı sistemlerinin hiç birini kullanmamakta, bunun yerine geçici ön bellek üzerinde çalışan basit Javascript objelerini veritabanı olarak kullanmaktadır. Her bir veriyi olası her güncellenme de yeniden toplayıp test etmek zorunda olduğumuz için özellikle sıralama algoritması gibi fonksiyonları test etmek çok daha uzun sürüyor.

Oluşturduğumuz bu kalıcı olmayan veri tabanı yapılarında Apache Solr gibi sistemlerin kullandığı basit işlevleri yerine getirmeyi başardık. Artık Türkçede anlama etkisi olmayan veya çok düşük olan kelimeleri analiz edebiliyor ve bu çıkarımlara göre çok daha kaliteli sonuçlar üretebiliyoruz! Yeni güncelleme ile sıralama için kullanılan bazı faktörler aşağıda ki gibidir.

  • Sayfada yaptığınız link çıkışlarının sayfa içeriğine göre oranı
  • Dokümanın ağ içinde ki düğümlerin kaçında barındığı
  • Terim frekansı ve ters doküman sıklığı (TF-IDF)
  • Bağlantı adresinin Ssl sertifikası barındırması

Ayrıca örümceklerin daha stabil ve doğru çalışabilmesi içinde aşağıda ki meta kurallarını yapı içine dahil ettik. Artık aşağıda ki sinyallere sahip olmayan siteleri görmezden geleceğiz!

  • Sayfa tipinin, sayfa karakter setini kapsayacak şekilde belirtilmemesi.
  • Eski veya yeni standartlarda sayfa başlığının belirtilmemesi.
  • Javascript aktivasyonu gerektiren web sayfaları.

Sayfanın yüklenmesi için Javascript aktivasyonu gerektiren alan adları eğer ağ içine dahil olmak istiyorlarsa, Google veya sadece Bul7 user agent’ine erişim izni verebilirsiniz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir