Ana içeriğe atla

Kayıtlar

Nisan, 2020 tarihine ait yayınlar gösteriliyor

Python - Veri Görselleştirme

Python’da veri görselleştirmesi analizi için seaborn kütüphanesi içinde bulunan iris, planets, tips, fmri, flights ve diamonds veri setlerini kullanacağım. Bunun için ilk olarak pandas ve numpy modüllerini yükledikten sonra seaborn kütüphanesini indiriyorum. Görselleştirme işlemlerini yapmak için çokça kullanılan seaborn yanı sıra matplot kütüphanesinden de faydalanacağım. Kategorik Değişkenler İlk olarak kategorik değişkenleri inceleyeceğim. Bunun için planets veri setini kullanacağım. Öncelikle görselleştirmeye başlamadan önce veri setimi çağırıyorum ve veriyi tanımaya çalışıyorum. Planets verisinin 1.035 satır ve 6 sütundan oluşan gezegenlere ilişkin bir veri seti olduğunu anlıyorum. İlk olarak veriyi tanımak adına değişkenlerimin özelliklerine bakıyorum. Burada sadece “method” değişkenimin kategorik, diğerlerinin ise numerik olduğunu görüyorum. Dolayısıyla kategorik değişkenlerin görselleştirmesi için method değişkenimi kullanacağım. Bunun için method değişkenini çağırd

Python - CART (Regresyon)

Karar ağacı algoritması, veri madenciliği sınıflandırma algoritmalarından biridir. Önceden tanımlanmış bir hedef değişkene sahiplerdir. Yapıları itibariyle en tepeden en aşağı inen bir strateji sunmaktadırlar. Bir karar ağacı, çok sayıda kayıt içeren bir veri kümesini, bir dizi karar kuralları uygulayarak daha küçük kümelere bölmek için kullanılan bir yapıdır. Yani basit karar verme adımları uygulanarak, büyük miktarlardaki kayıtları, çok küçük kayıt gruplarına bölerek kullanılan bir yapıdır. İki analizde de daha önce kullandığım “Hitters” veri setini kullanacağım. Bunun için verisetini jupyter notebooka getirdikten sonra ilk olarak boş değerleri analizden çıkarıyorum. Daha sonra string değişkenler için one hot coding yapıyorum. Salary’i bağımlı değişken diğer numerik değişkenleri de bağımsız değişken olarak tanımlıyorum. Dönüştürme işlemi yaptığım string değişkenleri de bağımsız değişkenlere dahil ettikten sonra veri setimi %25 test %75 train olacak şekilde ayırıyorum. Trai

Python - Yapay Sinir Ağları (Regresyon)

Yapay sinir ağları (YSA), insan beyninin özelliklerinden olan öğrenme yolu ile yeni bilgiler türetebilme, yeni bilgiler oluşturabilme ve keşfedebilme gibi yetenekleri, herhangi bir yardım almadan otomatik olarak gerçekleştirebilmek amacı ile geliştirilen bilgisayar sistemleridir. Yapay sinir ağları; insan beyninden esinlenerek, öğrenme sürecinin matematiksel olarak modellenmesi uğraşı sonucu ortaya çıkmıştır. Bu nedenledir ki, bu konu üzerindeki çalışmalar ilk olarak beyni oluşturan biyolojik üniteler olan nöronların modellenmesi ve bilgisayar sistemlerinde uygulanması ile başlamış, daha sonraları bilgisayar sistemlerinin gelişimine de paralel olarak bir çok alanda kullanılır hale gelmiştir. İki analizde de daha önce kullandığım “Hitters” veri setini kullanacağım. Bunun için verisetini jupyter notebooka getirdikten sonra ilk olarak boş değerleri analizden çıkarıyorum. Daha sonra string değişkenler için one hot coding yapıyorum. Salary’i bağımlı değişken diğer numerik değişke