Yüklüyor…
Trafik kazası yaralanma şiddeti tahmini için makine öğrenmesi yöntemlerinin karşılaştırılması /
Karayolu trafik kazaları, her yıl milyonlarca ölüm ve yaralanmaya yol açarak dünya çapında önemli bir halk sağlığı acil durumu oluşturmaktadır. Geleneksel istatistiksel modeller kaza şiddetini analiz etmek için yaygın olarak kullanılmaktadır, ancak karmaşık veri modellerini ve doğrusal olmayan bağla...
Yazar: | |
---|---|
Kurumsal yazarlar: | , |
Diğer Yazarlar: | |
Materyal Türü: | Tez |
Dil: | Türkçe |
Konular: |
Özet: | Karayolu trafik kazaları, her yıl milyonlarca ölüm ve yaralanmaya yol açarak dünya çapında önemli bir halk sağlığı acil durumu oluşturmaktadır. Geleneksel istatistiksel modeller kaza şiddetini analiz etmek için yaygın olarak kullanılmaktadır, ancak karmaşık veri modellerini ve doğrusal olmayan bağlantıları doğru bir şekilde yakalayamadıkları için çok kullanışlı değildirler. Bu tez, araç kazalarının şiddetini tahmin etmek için alternatif bir yöntem olarak makine öğreniminin (ML) kullanımını araştırmaktadır. Amaç, bu sınırlamaları ele almak ve tahminlerin kesinliğini artırmaktır. Araştırmada, bedensel zararla sonuçlanan trafik olaylarının kayıtlarını içeren Birleşik Krallık'ın STATS19 veri kümesi kullanılmıştır. Veri seti, sosyodemografik değişkenler, doğal çevre bileşenleri ve katkıda bulunan faktörler de dahil olmak üzere kaza koşulları ve kayıplarla ilgili pek çok parametre içermektedir. Araştırma, veri setinin titizlikle ön işlemden geçirilmesi, temizleme prosedürlerinin uygulanması ve ilgili özellik mühendisliği teknikleri kullanılarak çeşitli veri türlerinin uygun şekilde manipüle edilmesi yoluyla verilerin bütünlüğünün sağlanmasıyla başlar. Bu yaklaşımlar arasında kategori kodlama, veri gruplama, zaman damgası çıkarma ve uzamsal veri dönüşümü yer almaktadır. Daha sonra, özellik seçimi süreci ilk olarak gereksiz özellikleri belirlemek ve kaldırmak için Pearson korelasyonuna bağlı filtreleme yaklaşımlarının kullanılmasını içerir. Daha sonra, Özyinelemeli Özellik Eleme (RFE) ve Lojistik Regresyon sınıflandırıcı kullanan sarmalayıcı teknikler kullanılır. Dengesiz verilerle başa çıkmak için çeşitli teknikler karşılaştırılmış ve Rastgele Aşırı Örneklemenin modellerle en uygun olma eğiliminde olduğu bulunmuştur. Çalışma öncelikle "Hafif" ve "Ciddi/Ölümcül" yaralanma şiddeti seviyelerini tahmin etmeyi amaçlamaktadır ve bu, makine öğrenimi yöntemlerini uygulayarak ve farklı algoritmaların performanslarını karşılaştırarak kaza kayıtlarını kullanarak araba kazası şiddeti tahmin modellerini araştırarak yapılmıştır: Random Forest, Decision Tree, Logistic Regression, Support Vector Classifier, K-Neighbors Classifier, Extreme Gradient Boosting (XGBoost) ve Naïve Bayes, hangilerinin trafik kazası şiddet tahmin modelleri için en uygun olduğunu anlamak için. Araştırma her bir modeli doğruluk, kesinlik, geri çağırma, F1-skoru, G-Mean ve ROC AUC gibi birçok ölçüt kullanarak değerlendirmektedir. Değerlendirme hem veri dengesizliğini yöneten yaklaşımlar kullanılarak hem de kullanılmadan gerçekleştirilmiştir. Araştırma, Rastgele Aşırı Örneklemenin STATS19 veri setindeki veri dengesizliğini azaltmak için en uygun strateji olduğu sonucuna varmıştır. K-Komşu sınıflandırıcı, en yüksek G-Ortalaması skorunu elde ederek ve ROC AUC çalışmasına göre sağlam bir ayrımcılık performansı sergileyerek en verimli model olarak ortaya çıkmaktadır. Tez, kaza şiddetini etkileyen önemli faktörleri belirleyerek sona ermektedir. Ayrıca, karayolu güvenliğinin artırılması için veri odaklı tekniklerin önemini vurgulamaktadır. |
---|---|
Fiziksel Özellikler: | 82 sayfa ; 30 cm |
Bibliyografya: | Kaynakça : 74-79 sayfa |