Loading…

Öneri sistemlerinde veri seyrekliği problemine derin öğrenme yaklaşımı/

Öneri sistemleri ile ilgili çalışmalar hem akademide hem de endüstri de oldukça yoğun bir şekilde ilgi görmektedir. Öneri sistemleri kullanıcıların geçmişteki tercihlerinden hareketle gelecekteki tercihlerini tahmin eden sistemlerdir. Bilgi teknolojilerinin gelişmesi ile birlikte şirketler müşterile...

Full description

Bibliographic Details
Main Author: Bölük, Ecem
Corporate Authors: Bursa Teknik Üniversitesi Bilgisayar Mühendisliği Ana Bilim Dalı, Lisansüstü Eğitim Enstitüsü
Other Authors: Cingiz, Mustafa Özgür
Format: Thesis
Language:Turkish
Subjects:
Description
Summary:Öneri sistemleri ile ilgili çalışmalar hem akademide hem de endüstri de oldukça yoğun bir şekilde ilgi görmektedir. Öneri sistemleri kullanıcıların geçmişteki tercihlerinden hareketle gelecekteki tercihlerini tahmin eden sistemlerdir. Bilgi teknolojilerinin gelişmesi ile birlikte şirketler müşterilerden çok fazla veri sağlarlar. Bu verileri müşteri deneyimlerini iyileştirme ve satışlarını arttırmak için öneri sistemlerinde kullanırlar. Fakat kullanıcılar her zaman tercihlerini bu şirketlerle paylaşmayabilir. Bu durum, öneri sistemleri tasarlanırken karşılaşılan en büyük sorunlardan biri olan veri seyrekliğine neden olur. Veri seyrekliği kullanıcı öğe matrisinde derecelendirme bilgisinin çok az olduğu durumlarda gerçekleşir. Bu durum öneri sistemleri için çok seyrek kullanıcı öğe matrisine neden olur. Veri seyrekliği problemini çözmek için çalışmalarda meta verilerden yararlanılarak seyrek kullanıcı öğe matrisi yeniden yapılandırılmaya çalışılmıştır. Fakat bu çözüm modelleri daha karmaşık hale getirmekte ve veri gizliliği nedeniyle her zaman meta verilere ulaşmak pek mümkün olmamaktadır. Derin öğrenme algoritmalarından otomatik kodlayıcılar, kısıtlı Boltzmann makineleri ve üretici çekişmeli ağlar sadece seyrek kullanıcı öğe matrisini kullanarak seyrek kullanıcı öğe matrisi içerisindeki verilerden öğrendiği iç görülerden hareketle bu seyrek matrisi yeniden doldurarak veri seyrekliği probleminin çözülmesini sağlar. Bu tezde derin öğrenme algoritmalarından Temel Otomatik Kodlayıcı, Gürültü Giderici Otomatik Kodlayıcı, Seyrek Otomatik Kodlayıcı ve Varyasyonel Otomatik Kodlayıcı olmak üzere dört farklı otomatik kodlayıcı, Kısıtlı Boltzmann Makineleri ve Üretici Çekişmeli Ağlar olmak üzere altı farklı algoritma kullanılarak veri seyrekliğine karşı performansları karşılaştırılmıştır. Veri seti olarak %27 ve %74,5 seyrek veri içeren üç farklı Jester veri setleri ve %93,6 ve %95,4 seyrek veri içeren iki farklı Movielens veri seti olmak üzere beş farklı seyrek kullanıcı öğe matrisi içeren veri setleri kullanılmıştır. Jester veri setleri kullanılarak geliştirilen öğe tabanlı modeller, kullanıcı tabanlı modellere göre daha fazla başarı gösterdiği gözlemlenmiştir. Jester veri seti üzerinde yapılan analizlere göre öğe tabanlı modellerde en başarılı algoritma Seyrek Otomatik Kodlayıcılar olurken, kullanıcı tabanlı modellerde en başarılı algoritmanın Temel Otomatik Kodlayıcılar olduğu gözlemlenmiştir. Movielens veri setlerinde ise kullanıcı tabanlı ve öğe tabanlı modellerin performansları algoritmaya göre değişiklik gösterse de çok büyük bir performans farkı olmadığı gözlemlenmiştir. Movielens veri setinde her iki modelde ve değerlendirme metriğinde en başarılı performans gösteren algoritmanın Temel Otomatik Kodlayıcılar olduğu gözlemlenmiştir.
Physical Description:52 sayfa ; 30 cm
Bibliography:Kaynakça : 48-51 sayfa.