SQL SERVER 2005 ‘DE FILLFACTOR KAVRAMI
Temmuz 18th, 2007 — ibrahimdemirBlogumdaki SQL Server 2005 ile ilgili önceki yazılarımda SQL Server Storage Engine ‘in biraz sorunlu olduğundan bahsetmiştim. Hal böyle olunca verilerimizi SQL Server üzerinde tutarken daha da dikkatli olmamız gerekiyor. Ben de bu konuda dikkat etmeniz gereken noktalardan bir kaçına değinmeye karar verdim.
SQL Server verileri diskten EXTENT dediğimiz formatta okur ve yazar . (the smallest unit of data that SQL Server can allocate is 64 KB) Extent ise bünyesinde 8 tane Page barındırır. Windows işletim sistemi ortamında 8*Page_Size=64K eder (İşletim Sistemleri dersini alan arkdaşların kulaklarını da çınlatmış olduk) ki bu da diskten bir defada okunabilecek veri boyutuna denk gelir.
Fillfactor kavramı ise verilerin page üzerinde ne kadarlık bir alanı kaplayacağını belirler. Yani veritabanı yönetim sisteminiz bir page ‘in ne kadarlık kısmını (yüzde olarak 1..100 aralığında) dolduracak ne kadarlık kısmını boş bırakacak bunu belirleyen parametredir. Fillfactor değeri index oluşturulurken veya rebuild edilirken karar verilen bir değerdir. Mesela indeks oluştururken 70 ‘lik bir fillfactor değeri belirlediğinizde page üzerinde yüzde 30 ‘luk bir alan sonradan eklenecek veriler için ayrılmış olacaktır. Burada dikkat edilmesi gereken en önemli nokta fillfactor değerini 100 vermek ile 0 (sıfır) vermek arasında bir fark olmadığıdır. Fillfactor değerleri 1-100 arasındadır o nedenle 0(sıfır) verdiğinizde bu 100 olarak kabul edilir ve tüm page doldurulur.
Gelelim bu kavramların önemine: Eğer veritabanınızdaki okuma sayısı fazla ise bu değerin yüksek olması çok önemli yani 100 seviyesinde olması en ideali (Zaten server bazında default değer 100 ) ama okuma işlemlerinin yanı sıra sıklıkla veri ekleme ve güncelleme (yazma) da yapıyorsanız böyle zamanlarda PAGE SPLIT dediğimiz vakit kaybettirici bir durumla karşılaşmanıza neden olabilir.(Elbette kaybettiğiniz vakti anlamanız o kadar kolay değil) Nasıl ki multi-threading yapabilen bir işletim sistemi CPU ‘da processleri çalıştırırken context-switching yapıyorsa (İşletim Sistemleri dersini alan arkadaşların kulaklarını bir kez daha çınlatmış oldum) aynı durum veriler okunurken ve yazılarken de geçerli. Tam dolu bir page’de sorgulama yaptığınızda aradığın verinin o page içerisinde olma olasılığı daha fazla olur. Öte yandan tam dolu bir page ‘e yazmaya kaltığınızda dolu olduğu için diğer page ‘e geçilir (Page Split) ve page split işlemi sırasındaki hesaplamalar vakit kaybına neden olur.
Tablolarınızın fillfactor bilgilerini incelemek için SQL Server üzerinde dbcc showcontig komutundan faydalanabilirsiniz. Aşağıdaki örnekte Northwind veritabanınki Categories tablosuna ait bilgiler çağırılmıştır:
use Northwind
go
dbcc showcontig (Categories) with tableresults (tableresults parametresi seçimliktir)
*Pages Scanned:1 Extent ‘i aşıyor mu aşmıyor mu görmenizi sağlar
*Extent Switches: 1 ise switch var demektir (tehlikeli bir durum )
*Scan Density: Düşükse indeksleri yeniden oluşturmak faydalı olabilir (ALTER INDEX REBUILD )
*Avg Page Density: Bu bilgi aracılığıyla pagelerin doluluk oranları hakında bilgi sahibi olabilirsiniz.
Fill factor kullanarak index oluşturmak isterseniz de aşağıdaki örnek size yol gösterebilir:
CREATE CLUSTERED INDEX deneme_indx ON my_table (col1, col2) WITH FILLFACTOR = 50
Yazımı bitirmeden evvel neden bu konuyu bloguma taşığıma da değineyim. JDBC_TR mail grubumuzda arkadaşım Emrah Şeker yapacağı proje için performanslı bir DBMS arayışına girmişti ve ona cevap verirken Flickr ’ın altyapısını anlatan bir sunumda bahsi geçen yazma ve okuma değerlerinin oranına değindim. (Kullanıcılar her 14 okumya (select) karşılık 1 yazma (insert,delete,update) yapılıyorlarmış) Yani aldığınız bir DBMS ‘i default değerlerle kullanmak her zaman akıllıca olmuyor. İşinizi ve kullanıcılarınızı iyi analiz etmek gerekir diye düşünüyorum. Yine aynı şekilde perfomans sorunlarını çözerken olayları donanım güncellemeleri ile ölçeklemeye kalkmak her zaman beklenen sonuçları doğurmayacaktır. Diyorsanız ki kim bu kadar detaylı şeylere dikkat ediyor? Ben de diyorum ki Dikkat Eden Kazanır!
Şimdilik benden bu kadar sağlıcakla kalın…
-Tavsiye-
Who Cares about FillFactor?
SQL Server 2005 Books On-Line
Understanding SQL Server’s DBCC SHOWCONTIG
NOT: Yukarıda bahsi geçen konu diğer DBMS ‘leri kapsayacağı gibi kapsamaya da bilir. O nedenle bu yazıyı sadece bilgi sahibi olduğum SQL Server ‘i örnekleyerek yazdım.