Naive Bayes sınıflandırıcısının temeli Bayes teoremine dayanır. lazy (tembel) bir öğrenme algoritmasıdır aynı zamanda dengesiz veri kümelerinde de çalışabilir. Algoritmanın çalışma şekli bir eleman için her durumun olasılığını hesaplar ve olasılık değeri en yüksek olana göre sınıflandırır.
Bayes teoremi bir olayın olma olasılığının, elde edilen yeni bilgiler ışığında nasıl etkilendiğidir. Tabi bunu yaparken bu yeni bilgilerin de doğru olduğunu varsayarak yapar. Aşağıdaki formüle baktığımızda, elimizde B bilgisi var iken, A’nın oluşma olasılığının ne olacağının formüle edildiğini görüyoruz. Bu da aslında A’nın olma olasılığı ile, elde A’nın bilgisi var iken B’nin olma olasılığının çarpımının B’nin olasılığına bölünmesi ile elde edilmiştir.
Analizimde yine diabets veri setini kullanacağım. İlk olarak veri setimi %30-%70 diye test-train olarak ayırıyorum ve veri setimi çağırıyorum.
Sklearn kütüphanesinden GaussianNB modülünü indirerek modelimi kuruyorum.
Şimdi tahmin aşamasına geçebilirim. Test setimi tahmin et dedikten sonra öncelikle ilkel doğruluk oranımı hesaplıyorum daha sonra 10 katlı cross validation yaparak doğrulanmış doğruluk oranını hesaplayıp analizime son veriyorum.
Yorumlar
Yorum Gönder