k-En yakın komşular (k-Nearest Neighbors)

k-En yakın komşular algoritması en basit makine öğrenimi algoritmalarından biridir. Bir örnekle inceleyelim.

scenario1
Kaynak: www.analyticsvidhya.com

Elimizde kırmızı ve yeşil olarak sınıflandırılmış noktalar olsun. Yıldız noktasının sınıfını tahmin etmek istiyoruz. Yıldız noktasına en yakın noktalar “komşu” olarak adlandırılır. Algoritmanın adındaki k sayısı sınıflarına bakılacak komşu sayısıdır. Noktanın komşuları en çok hangi sınıfa ait ise, tahmin o sınıftır. k=3 alalım. Bu durumda,

scenario2
Kaynak: www.analyticsvidhya.com

Yıldız noktasına en yakın üç noktada kırmızı sınıfa ait. O halde yıldız noktasını da kırmızı olarak sınıflandırıyoruz.

Peki, uzaklığı nasıl ölçeceğiz? En sık kullanılan uzaklık formüllerini verelim.

X=(x_1, x_2, \ldots, x_n )  ve Y=(y_1, y_2, \ldots, y_n ) veri noktaları olsun. Bunlar arasındaki Minkowski uzaklığı (Minkowski Distance) aşağıdaki şekilde hesaplanır:

CodeCogsEqn2.gif

Burada:

  •  p=1 durumunda metrik, Manhattan uzaklığı adını alır.
  •  p=2 durumunda ise metrik, Öklid uzaklığı adını alır.

Bir sonraki yazıda görüşmek üzere.

 

 

 

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s