Yüklüyor…
Öznitelik seçim yöntemlerindeki yanlılık etkisinin sınıflandırma başarısı açısından değerlendirilmesi/
Günümüz dünyasında veri her yerde, bol bir şekilde, rahatlıkla ulaşılabilir bir haldedir. Veri bol, elde etmesi kolay ama sürekli olarak artan bir yapıda olması nedeniyle işlenmesi, anlamlı hale getirilmesi giderek zorlaşmaktadır. Özellikle büyük veri çalışmaları, görüntü tabanlı çalışmalar, veri ak...
Yazar: | |
---|---|
Kurumsal yazarlar: | , |
Diğer Yazarlar: | |
Materyal Türü: | Tez |
Dil: | Türkçe |
Konular: |
Özet: | Günümüz dünyasında veri her yerde, bol bir şekilde, rahatlıkla ulaşılabilir bir haldedir.
Veri bol, elde etmesi kolay ama sürekli olarak artan bir yapıda olması nedeniyle
işlenmesi, anlamlı hale getirilmesi giderek zorlaşmaktadır. Özellikle büyük veri
çalışmaları, görüntü tabanlı çalışmalar, veri akışı tabanlı çalışmalarda özniteliklerin
anlamlı alt kümeler şeklinde azaltılması önem kazanmaktadır. Öznitelik seçimi
yapılmazsa, işlemci gücü yoğun bir şekilde kullanılmakta, sınıflandırıcıların eğitim
süresi uzamakta ve bu durum da bazı verileri işlenemez hale getirmektedir. Makine
öğrenmesinde öznitelik seçimi günümüzde çok ilgi gören bir çalışma alanıdır.
Öznitelik seçimi verideki özniteliklerin sayısını azaltarak boyutsallık lanetinden (curse
of dimensionality) kaçınmayı amaçlamaktadır. Bu amaç için veriyi çeşitli
yaklaşımlarla incelemeye alır, çeşitli karar verme mekanizmaları kullanarak en
anlamlı olan öznitelikleri seçer.
Öznitelik seçimi yapılırken verinin doğasında bulunan etkiler nedeniyle yanlılık etkisi
oluşabilmektedir. Yanlılık etkisi öznitelik seçimini olumsuz yönde etkilemektedir.
Öznitelik seçiminde önemli konulardan biri de kullandığımız eğitim, geçerleme
(validation) ve test kümesinin iterasyonlar bazlı değişiminin yanlılık etkisi ortaya
çıkarmasıdır. Örnek sayısı ile seçilen özniteliklerin değişimi arasındaki ilişki de
önemli bir konudur. Örnek sayısının fazla olduğu durumlarda öznitelik seçimi
yaptığımızda her seferinde benzer öznitelik alt kümesinin seçilmesi beklenmektedir.
Yanlılık etkisinden kaçınmak için çeşitli çapraz geçerleme yöntemleri kullanmak
etkiyi azaltma yönünde olumlu bir durum oluşturmaktadır. Veriyi farklı çapraz
geçerleme yöntemleri kullanarak öznitelik seçimine sokmamız farklı benzerlik metriği
oranı vererek yanlılık etkisinin hangi yöntemde daha az olduğu hakkında bize bilgi
vermektedir. Bu konuyla ilgili araştırmalar yoğun bir ilgiyle sürmektedir.
Tez çalışmasında üç farklı veri seti ve üç farklı öznitelik seçim yöntemi kullanılarak
öznitelik seçimi yapılmıştır. Söz konusu öznitelik seçim yöntemleri de üç farklı çapraz
geçerleme yöntemi ve üç farklı sınıflandırıcı ile çalıştırılmıştır. Bu sayede seksen bir
farklı çalıştırma yapılmıştır. Yapılan çalışmalar için iki farklı benzerlik metriği
kullanılarak yanlılık etkisi gözlemlenmiştir. Elde edilen sonuçlara göre veri setinden
ve öznitelik seçim yönteminden bağımsız olarak yanlılık etkisinin en az olduğu çapraz
geçerleme yöntemi tespit edilmiştir. |
---|---|
Fiziksel Özellikler: | 50 sayfa ; tablo : 30 cm |
Bibliyografya: | Kaynakça : 41-43 sayfa. |