Rastgele Ormanlar(Random Forests) ile Churn Analizi

Churn Analizi Nedir? Müşteri Kayıp Oranı (Churn Rate), müşterilerin bir ürünü ya da hizmeti kullanmayı bırakma olasığı olarak tanımlanabilir. Araştırmalara göre, bir çok iş kolu için, yeni müşteri kazanmak mevcut müşteriyi elde tutmaktan çok daha maliyetlidir. Bu nedenle şirketler churn analizi ile ürün ya da hizmeti kullanmayı bırakma olasığı yüksek olan müşterileri tespit edip, bu … Okumaya devam et Rastgele Ormanlar(Random Forests) ile Churn Analizi

Reklamlar

Modellerin birleştirilmesi (Ensemble Learning) – 3

Rastgele Ormanlar (Random Forests) Karar ağaçları yazımızda (Link), karar ağaçlarının, rastgele ormanlar algoritmasının temel bileşeni olduğunu belirtmiştik. Rastgele ormanlar, çok sayıda karar ağacının bagging ya da pasting metodları ile bir araya getirilmesinden oluşur. Şimdi Scikit-Learn ile basit bir örnek yapalım. İlk olarak gerekli fonksiyonları içeri aktardık. Iris verisetini kullanıyoruz. RandomForestClassifier oluşturduk, verilerimizi sınıflandırıcıya besledik. Bir … Okumaya devam et Modellerin birleştirilmesi (Ensemble Learning) – 3

Rastgele Ağaçlar ile Kredi kartı dolandırıcılık tespiti

Verisetini buradan indirebilirsiniz. Verisetimiz, 284,807 kredi kartı işlemi içermektedir. 28 tane anonimleştirilmiş ve normalize edilmiş öznitelik içermektedir. Normalleştirme işlemi, tüm özniteliklerin değerlerinin aynı aralıkta olmasını sağlar. Anonimleştirme ve normalleştirme işlemi Temel Bileşen Çözümlemesi (Principal Component Analysis - PCA) ile yapılmıştır. Bu algoritmaya ileride değineceğiz. Verisetimiz, ayrıca, kredi kartı işleminin ne zaman gerçekleştiğini belirten bir zaman değişkeni ve … Okumaya devam et Rastgele Ağaçlar ile Kredi kartı dolandırıcılık tespiti