Regresyon Analizi
Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır.
Regresyon Analizini örnek bir case üzerinden ele alacak olursak; akıllı telefon satan bir marka düşünelim. Son yıllarda marka telefon satışlarında bir düşüş gözlemlemektedir. Bu sebeple; düşüşün sebeplerini araştırmak için pazarlama departmanı müşterilerin akıllı telefon satın alma alışkanlıkları üzerinde bir araştırma(anket) gerçekleştirmiştir. Bu araştırma çerçevesinde; müşterilerin satın alma alışkanlıklarını ölçmek üzere içinde 5 adet değişken bulunan bir anket yapılmıştır. Bu beş değişken üzerinden – price, design, quality, innovativeness ve brand - müşterilerin akıllı telefon satın alma eğilimleri ölçülmeye çalışılmıştır. Bu araştırmanın sonucunda marka, müşterilerin bu beş değişkenden hangisine/hangilerine göre akıllı telefon tercih ettiklerini tespit etmeyi amaçlamaktadır. Ayrıca, akıllı telefon satın alma alışkanlıkların da kadın – erkek arasında bir farkın olup olmadığı sorusu da cevaplanmayı beklemektedir. Buna ek olarak, pazarlama departmanı müşterilerin eğitim ve gelir grubunun da satın almayı ne derece etkilediğini ölçmeyi amaçlamaktadır.
İlk olarak bu 5 değişkenin (kriterin) satın almaya nasıl etki ettiğini bulmak için Lineer Regresyon Analizi yapmamız gerekiyor.
Burada SPSS’in Analyze sekmesinde Regresyonu oradan da Lineer Regresyonu seçiyoruz.
Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır.
Regresyon Analizini örnek bir case üzerinden ele alacak olursak; akıllı telefon satan bir marka düşünelim. Son yıllarda marka telefon satışlarında bir düşüş gözlemlemektedir. Bu sebeple; düşüşün sebeplerini araştırmak için pazarlama departmanı müşterilerin akıllı telefon satın alma alışkanlıkları üzerinde bir araştırma(anket) gerçekleştirmiştir. Bu araştırma çerçevesinde; müşterilerin satın alma alışkanlıklarını ölçmek üzere içinde 5 adet değişken bulunan bir anket yapılmıştır. Bu beş değişken üzerinden – price, design, quality, innovativeness ve brand - müşterilerin akıllı telefon satın alma eğilimleri ölçülmeye çalışılmıştır. Bu araştırmanın sonucunda marka, müşterilerin bu beş değişkenden hangisine/hangilerine göre akıllı telefon tercih ettiklerini tespit etmeyi amaçlamaktadır. Ayrıca, akıllı telefon satın alma alışkanlıkların da kadın – erkek arasında bir farkın olup olmadığı sorusu da cevaplanmayı beklemektedir. Buna ek olarak, pazarlama departmanı müşterilerin eğitim ve gelir grubunun da satın almayı ne derece etkilediğini ölçmeyi amaçlamaktadır.
İlk olarak bu 5 değişkenin (kriterin) satın almaya nasıl etki ettiğini bulmak için Lineer Regresyon Analizi yapmamız gerekiyor.
Burada SPSS’in Analyze sekmesinde Regresyonu oradan da Lineer Regresyonu seçiyoruz.
Analize konu olacak değişkenleri (price, design, quality, innovativeness ve brand) üst kısma giriyoruz.
Sağ üst köşede yer alan Statistics kısmında “Descriptives” kısmını işaretliyoruz.
Options sekmesinde ise “Replace with mean” kısmını işaretliyoruz. Böylece ankette boş bir değer gelmesi durumunda ortalamayı yerine koyuyoruz. Bunun sonucunda; Continue deyip regresyonu çalıştırıyoruz.
Analiz tamamlandığında önümüze regresyonun sonucunun bulunduğu yeni bir ekran çıkıyor. Burası bizim analizin sonucunda yorum yapacağımız verilerin yer aldığı özet tablo.
Descriptive Statistics tablosunda mean, standart deviation ve adet gibi temel bilgilerin değişken bazında özetini görüyoruz. Anketimiz 1 ve 5 arasında scale edilmiş bir anket olduğundan, ortalamayı (mean) da buna göre yorumlamamız gerekiyor. Buradan sonuçla, descriptive tablosunda en önemli değişkenin en yüksek meane sahip olan (3,9967) quality olduğunu görüyoruz. Ayrıca, scale 1-5 arasında olduğu için 3,5’un üstü meanleri önemli, 3’ün altı meanleri önemsiz olarak görebiliriz.
Descriptive Statistics tablosunda mean, standart deviation ve adet gibi temel bilgilerin değişken bazında özetini görüyoruz. Anketimiz 1 ve 5 arasında scale edilmiş bir anket olduğundan, ortalamayı (mean) da buna göre yorumlamamız gerekiyor. Buradan sonuçla, descriptive tablosunda en önemli değişkenin en yüksek meane sahip olan (3,9967) quality olduğunu görüyoruz. Ayrıca, scale 1-5 arasında olduğu için 3,5’un üstü meanleri önemli, 3’ün altı meanleri önemsiz olarak görebiliriz.
Regresyon sonucunda bakmamız gereken en önemli tablo Model Summary. Bu tablo bize modelin doğruluğunu ve verilerin kalitesi hakkında önemli sonuçlar verir.
Tabloda yer alan R değeri her zaman 0 ile 1 arasında bir değer alır. Buradan hareketle, 0,5 altı kötü bir değer, 0,5 iyi bir değer, 0,8 çok iyi değer diyebiliriz. Ancak R’ın 0,9’dan büyük olduğu durumlar verinin doğruluğu hakkında şüphe uyandırır ve istenen bir durum değildir. Tabloda bakacağımız bir diğer önemli parametre R Square’dir. Bu parametre modelin açıklama gücüdür ve yüzdeye çevrilerek ifade edilir. Bahse konu analizde 5 adet değişkenin (kriterin) müşteri satın alma alışkanlığını açıklama gücü %22’dir. Yani, müşteri satın alma alışkanlıklarında modele soktuğumuz 5 kriter, toplam müşteri satın alma alışkanlığının sadece %22’sini açıklamaktadır.
Tabloda yer alan R değeri her zaman 0 ile 1 arasında bir değer alır. Buradan hareketle, 0,5 altı kötü bir değer, 0,5 iyi bir değer, 0,8 çok iyi değer diyebiliriz. Ancak R’ın 0,9’dan büyük olduğu durumlar verinin doğruluğu hakkında şüphe uyandırır ve istenen bir durum değildir. Tabloda bakacağımız bir diğer önemli parametre R Square’dir. Bu parametre modelin açıklama gücüdür ve yüzdeye çevrilerek ifade edilir. Bahse konu analizde 5 adet değişkenin (kriterin) müşteri satın alma alışkanlığını açıklama gücü %22’dir. Yani, müşteri satın alma alışkanlıklarında modele soktuğumuz 5 kriter, toplam müşteri satın alma alışkanlığının sadece %22’sini açıklamaktadır.
Regresyon sonucunda bakmamız gereken bir diğer tablo ANOVA tablosudur. Burada en sağda yer alan Significant (Sig) değeri insignificant çıkarsa analizin hiçbir değeri yoktur. Sig değerinin < 0,05 olduğu durumlarda analiz olumlu kabul edilebilir. Bir diğer parametre olan F değerinin ortalama bir değeri olmamakla birlikte ne kadar büyük olursa model o kadar iyidir yorumunu yapabiliriz.
Son olarak bakacağımız tablo ise, her bir değişkenin önemini ölçen Coefficients tablosudur. Burada modele soktuğumuz değişkenlerin hangisinin etkili/önemli olduğunu anlarız.
İlk önce bakacağımız parametre yine sig değeri olacaktır. Tablodan görüleceği üzere Sig değerinin >0,05 olduğu Design ve Innovativeness değişkenlerinin müşterilerin akıllı telefon satın alma alışkanlığına hiçbir etki yaratmadığını söyleyebiliriz. Burada sadece Sig değeri 0.00 olan Price ve Image müşteri satın alma alışkanlığında rol oynamaktadır.
İlk önce bakacağımız parametre yine sig değeri olacaktır. Tablodan görüleceği üzere Sig değerinin >0,05 olduğu Design ve Innovativeness değişkenlerinin müşterilerin akıllı telefon satın alma alışkanlığına hiçbir etki yaratmadığını söyleyebiliriz. Burada sadece Sig değeri 0.00 olan Price ve Image müşteri satın alma alışkanlığında rol oynamaktadır.
Bir diğer parametre ise Beta değeridir. Beta linear regresyonda değişkenlerin önüne koyacağımız katsayıdır ve ilişkinin yönünü gösterir. Örneğin, price eksi bir katsayıya sahiptir yani fiyat ile müşteri satın alma alışkanlığı arasında ters yönlü bir ilişki vardır. Buradan hareketle, fiyat arttıkça müşterilerin satın alma alışkanlığı düşme eğilimi gösterir yorumunu yapabiliriz.
Regresyon Analizimizin sonucunda price, design, quality, innovative ve image parametrelerinin hangisinin ne oranda müşteri satın alma eğilimini belirlediğini görmüş olduk. Analizin sonucunda;
- Girmiş olduğumuz 5 parametrenin müşteri satın alma alışkanlığının sadece %22’sini oluşturduğu (açıkladığı)
- Design ve Innovative değişkenlerinin müşteri satın alma alışkanlıkları üzerinde herhangi bir etkisinin olmadığını
- Sadece Price, Quality ve Image’in müşteri satın alma alışkanlığı üzerinde rol oynadığını ve price’in satın alma alışkanlığında negatif bir etki yarattığını analiz etmiş olduk.
Şimdi, aynı parametrelerle satın alma alışkanlığının kadın – erkek özelinde nasıl fark ettiğini bulmamız gerekiyor. Bahse konu fark analizlerinde ANOVA testini kullanmamız gerekmektedir.
- Girmiş olduğumuz 5 parametrenin müşteri satın alma alışkanlığının sadece %22’sini oluşturduğu (açıkladığı)
- Design ve Innovative değişkenlerinin müşteri satın alma alışkanlıkları üzerinde herhangi bir etkisinin olmadığını
- Sadece Price, Quality ve Image’in müşteri satın alma alışkanlığı üzerinde rol oynadığını ve price’in satın alma alışkanlığında negatif bir etki yarattığını analiz etmiş olduk.
Şimdi, aynı parametrelerle satın alma alışkanlığının kadın – erkek özelinde nasıl fark ettiğini bulmamız gerekiyor. Bahse konu fark analizlerinde ANOVA testini kullanmamız gerekmektedir.
Tek Yönlü ANOVA Testi
SPSS’in Analyze sekmesinde Compare Means daha sonra da One-way ANOVA diyoruz:
Burada regresyondan elde ettiğimiz sonuçla sadece anlamlı sonuç ifade eden yani sig değeri <0,05 olan price, image ve quality değişkenlerini teste sokuyoruz.
Yine Options sekmesinde Descriptive’i işaretliyoruz ve continue diyoruz.
Testi yorumlamaya başlamaya yine Descriptives tablosundan başlıyoruz. Burada girmiş olduğumuz üç parametrenin kadın ve erkek özelinde mean, standart deviation ve adet bilgileri yer almakta. Buradan hareketle; Price değişkeninin erkek kadın arasındaki ortalamasına (mean) bakalım. Price değişkeninin meani 4,09 (3,5’un oldukça üstünde bir değer) kadınlar da ise 2,9’dur. Yani, price faktörü erkekler için oldukça önemliyken kadınlar için çok da önemli bir değişken değildir. Image değişkenine baktığımızda ise tam tersi bir eğilim görüyoruz. Erkekler için mean 2,7 iken kadınlar için 3,9’dur. Quality de ise kadın erkek arasındaki mean birbirine oldukça yakındır, yani ikisi de quality’e aynı ölçüde önem vermektedir.
Şimdi Anova tablomuzu yorumlamaya geçebiliriz. Yine en önemli madde olan Sig değerini inceliyoruz. Burada Quality değişkenin sig değeri >0,05. Yani kadın erkek arasındaki akıllı telefon satın alma farkını açıklamada quality’nin bir önemi yok. Üstteki Descriptive tablosunda da quality parametresinin kadın ve erkek için çok yakın bir mean’e sahip olduğunu görmüştük. Özetle, quality faktörü kadın erkek arasındaki satın alma alışkanlığı farkını açıklayamaz. Bir diğer parametre olan F ise farkın büyüklüğü hakkında bize fikir vermektedir. F değeri ne kadar büyükse fark da o kadar büyüktür. Ancak ele aldığımız case’de F değeri kadın ve erkek için birbirine oldukça yakındır.
Tek Yönlü ANOVA Testimizin sonucunda price, image ve quality değişkenlerinin kadın erkek satın alma alışkanlığı arasındaki farkı nasıl açıklayağını test ettik. Bunun sonucunda,
- Quality’nin iki taraf içinde eşit derecede önemli olduğunu yani farkı açıklamaya yetmeyeceğini
- Kadınların image, erkeklerin ise price konusunda hassas oldukları sonuçlarını elde ettik.
- Quality’nin iki taraf içinde eşit derecede önemli olduğunu yani farkı açıklamaya yetmeyeceğini
- Kadınların image, erkeklerin ise price konusunda hassas oldukları sonuçlarını elde ettik.
PostHoc ANOVA Testi
İkiden fazla grubun ANOVA testini yaparken PostHoc Anova Testini kullanıyoruz. Ele aldığımız casede 3 kategoriden (high, medium ve low) oluşan gelir parametresinin müşteri satın alma alışkanlığı üzerinde etkisini inceleyeceğiz.
Yine SPSS’in Analyze sekmesinde Compare Means ve One-way ANOVA diyoruz.
Burada sig değeri <0,05 olan değişkenleri girip, factor kısmını income yapıyoruz.
Sağdaki PostHoc sekmesini açıp Tukey varyansını seçip continue diyoruz.
Testi yorumlamaya yine Descriptive tablosundan başlıyoruz. Burada price, image ve quality’nin her bir gelir grubuyla olan ilişkisi özetlenmiş, mean, standart deviation ve adet verileri yer almaktadır. Buradan hareketle Price değişkeninin ortalamasının (mean) low income için 4,20, medium income için 3,61, high income için 2,68 olduğunu görüyoruz. Yani price değişkeni düşük gelirli grup için oldukça yüksek (1-5 skalasında 3,5’un oldukça üstünde bir değer) bir önem taşıdığını görürken high income grubu için o kadar da önemli olmadığını görüyoruz.
Bir diğer tablo olan ANOVA tablosunda ise quality değişkeninin yine sig değerinin <0,05 kriterini sağlamadığını görüyoruz. Yani quality tüm gelir grupları arasındaki satın alma alışkanlığı farkını açıklayabilecek bir değişken değil.
PosHoc Test tablosunda ise gelir gruplarının kendi içindeki ilişkisini değişken bazında ölçüyoruz. Burada price değişkeni için Low income Group’un high ve medium income ile olan ilişkisine bakalım. Öncelikle sig değerlerinin <0,05 olduğunu yani anlamlı olduğunu görüyoruz. Kendi aralarındaki mean’e baktığımızda ise low income ile mid income arasındaki mean’in 0,062, low income ile high income arasındaki mean’in 1,55 olduğunu görüyoruz. Yani low income ile medium income olan arasındaki farklılık, low income ile high income olan arasındaki farklılığa göre daha az.
PostHoc Anova Testimizin sonucunda gelir grupları arasındaki satın alma alışkanlığı farkını price, image ve quality değişkenleri üzerinde inceledik. Bunun sonucunda;
- Image ve Quality’nin (sig değerleri 0,05’ten büyük) gelir grupları arasındaki satın alma alışkanlığı farkını açıklayamayacağını
- Image ve Quality’nin (sig değerleri 0,05’ten büyük) gelir grupları arasındaki satın alma alışkanlığı farkını açıklayamayacağını
- Low-Medium-High Income arasındaki temel farklılığın price faktörü olduğunu tespit ettik ve bunların kendi içindeki ilişkisini gözlemledik.
Yorumlar
Yorum Gönder