Scikit-Learn ile Stacking

Önceki yazımızda stacking metodundan bahsetmiştik. Şimdi uygulamalı olarak görelim. İlk olarak her zamanki gibi gerekli fonksiyon ve modülleri içeri aktarıyoruz: Verimizi içeri aktarıp, öznitelikler ve hedef olarak ayırıyoruz: Şimdi verimizi daha önceki örneklerden farklı olarak, %60 eğitim (train), %20 geçerleme (validation) ve %20 test verisi olarak ayırmamız gerekiyor. Bunun için bir yol train_test_split fonksiyonunu iki defa kullanmak: Şimdi üç farklı … Okumaya devam et Scikit-Learn ile Stacking

Reklamlar

Modellerin birleştirilmesi (Ensemble Learning) – 4

Boosting Boosting, bir çok zayıf öğreniciyi (weak learner) bir araya getirerek bir güçlü öğrenici (strong learner) oluşturmak anlamına gelir. Bir çok boosting metodunun ana fikri, tahmin edicileri ardışık olarak eğitmektir. En sık kullanılan boosting metodları, AdaBoost (Adaptive Boosting) ve Gradient Boosting metodlarıdır. Adaboost Bir tahmin edicinin, kendinden önce gelen tahmin ediciyi düzeltmesi için bir yol, … Okumaya devam et Modellerin birleştirilmesi (Ensemble Learning) – 4

Modellerin birleştirilmesi (Ensemble Learning) – 3

Rastgele Ormanlar (Random Forests) Karar ağaçları yazımızda (Link), karar ağaçlarının, rastgele ormanlar algoritmasının temel bileşeni olduğunu belirtmiştik. Rastgele ormanlar, çok sayıda karar ağacının bagging ya da pasting metodları ile bir araya getirilmesinden oluşur. Şimdi Scikit-Learn ile basit bir örnek yapalım. İlk olarak gerekli fonksiyonları içeri aktardık. Iris verisetini kullanıyoruz. RandomForestClassifier oluşturduk, verilerimizi sınıflandırıcıya besledik. Bir … Okumaya devam et Modellerin birleştirilmesi (Ensemble Learning) – 3

Modellerin birleştirilmesi (Ensemble Learning) – 2

Bagging ve Pasting Başka bir ensemble learning metodu ise, aynı algoritmayı verinin farklı altkümeleri üzerinde çalıştırmaktır. Altkümeleri oluştururken, örnekleme (sampling - kısaca verisetinden noktalar seçimi) işlemi yerine koyma (aynı nokta birden fazla kere seçilebilir) ile yapılırsa, bu yöntem bagging (bootstrap aggreating) olarak, yerine koyma ile yapılmıyor ise de, bu yöntem pasting olarak adlandırılır. Tüm tahmin ediciler eğitildikten … Okumaya devam et Modellerin birleştirilmesi (Ensemble Learning) – 2

Modellerin birleştirilmesi (Ensemble Learning) – 1

Karmaşık bir soruyu binlerce insana soralım ve verdikleri cevapları birleştirelim. Çoğu durumda, bu birleştirilmiş cevap, tek bir uzmanın verdiği cevaptan çok daha iyi olacaktır. Bu "Wisdom of the crowd" olarak adlandırılır (Daha fazla bilgi için tıklayınız). Benzer olarak, birden fazla tahmin edicinin (predictor) tahminlerini bir araya getirirsek, tek bir tahmin ediciden daha iyi sonuç elde … Okumaya devam et Modellerin birleştirilmesi (Ensemble Learning) – 1