Ana içeriğe atla

Python - XGBoost (Regresyon)

XGBoost, GBM'in hız ve ve tahmin performansını arttırmak üzere optimize edilmiş; ölçeklenebilir ve farklı platformlara entegre edilebilir halidir.

Bu analizimde de yine “Hitters” veri setini kullanacağım. Veriyi hazırladıktan sonra xgboost kütüphanesini indiriyorum. Daha sonra modele sokabilmek için xgboostun matrix yapısına göre test-train ayrımını yapıyorum. Daha sonra XGBRegressor modülünü indirdikten sonra modelimi kuruyorum.


Modelimi kurduktan sonra test setimi tahmin et dedikten sonra ilkel test hatamı hesaplıyorum.


Şimdi tuning kısmına geçebilirim. Modelimi tekrar çağırıyorum ve modelin argümanlarını inceliyorum. Daha sonra en önemli parametreler için manuel giriş yapıyorum ve bunun üzerinden 10 katlı cross validation yapıyorum.


Sonrasında modele en optimum parametreleri bul dedikten sonra bu değerlere göre modeli tune edip train setimi fit ediyorum. Son olarak, test setimi tahmin et dedikten sonra test hatamı hesaplıyorum.



Yorumlar