Deep learning–based object detection systems are widely employed in various domains such as security, healthcare, mobile systems, and smart city infrastructures. The performance of these systems depends not only on the chosen architectures but also directly on the quality of the input data. Lossy compression formats such as JPEG can introduce visual distortions known as artifacts—especially at low quality levels—which significantly reduce detection accuracy and stability.
This study systematically investigates the effects of different JPEG compression quality levels (QF=30, QF=60, QF=90) on deep learning–based object detection models. For this purpose, three versions of the YOLO architecture (YOLOv5m, YOLOv8m, and YOLOv11m) were compared under identical data structures, parameters, and experimental conditions. During the revision process, the previously single-class dataset containing only the “person” category was extended to a multi-class dataset including “person,” “car,” “dog,” and “bicycle.” In addition, fine-tuning was performed on low-quality (QF=30) images to re-evaluate the robustness of the models.
Experimental analyses focused on standard evaluation metrics such as [email protected], [email protected]: 0.95, Precision, Recall, and FPS. The findings reveal that as JPEG quality decreases, all models experience performance degradation; however, fine-tuning significantly mitigates these losses. The YOLOv5m model demonstrated more stable performance on low-quality data, while YOLOv8m provided a balanced trade-off between accuracy and speed. YOLOv11m achieved the highest mAP values under high-quality conditions.
This study comparatively examines both earlier and recent YOLO architectures to provide a comprehensive evaluation of model robustness against compression-induced distortions. The obtained results contribute to enhancing the reliability of AI-based object detection systems operating on compressed images and to guiding future research in this field. The proposed comparative framework can be extended to other degradation types such as blur, noise, and motion for broader generalization.
Keywords: Deep Learning, JPEG Compression, Object Detection, Visual Artifacts, YOLO
Günümüzde güvenlik, sağlık, mobil sistemler ve akıllı şehir altyapıları gibi birçok alanda yaygın biçimde kullanılan derin öğrenme tabanlı nesne tespiti sistemlerinin başarımı, yalnızca mimari tercihlere değil, aynı zamanda girdi verisinin kalitesine de doğrudan bağlıdır. JPEG gibi kayıplı sıkıştırma formatları, özellikle düşük kalite seviyelerinde, görsellerde artefakt adı verilen bozulmalar oluşturarak tespit doğruluğunu önemli ölçüde düşürebilmektedir.
Bu çalışma, farklı JPEG sıkıştırma kalite seviyelerinin (QF=30, QF=60, QF=90) derin öğrenme tabanlı nesne tespiti modelleri üzerindeki etkisini sistematik biçimde incelemektedir. Bu amaçla, YOLO mimarisine ait üç farklı sürüm ( YOLOv5m, YOLOv8m ve YOLOv11m ) aynı veri yapısı, aynı parametreler ve aynı deneysel koşullar altında karşılaştırılmıştır. Revizyon sürecinde, yalnızca “person” sınıfını içeren önceki tek sınıflı yapı genişletilerek “person”, “car”, “dog” ve “bicycle” sınıflarını içeren çok sınıflı bir veri seti oluşturulmuş; ayrıca düşük kaliteli (QF=30) görüntüler üzerinde fine-tuning işlemi uygulanarak model dayanıklılığı yeniden değerlendirilmiştir.
Deneysel analizlerde [email protected], [email protected]: 0.95, Precision, Recall ve FPS değerleri incelenmiştir. Elde edilen bulgular, JPEG kalitesi azaldıkça tüm modellerde performans kayıpları yaşandığını, ancak fine-tuning sonrasında bu kayıpların önemli ölçüde azaldığını göstermektedir. YOLOv5m modeli düşük kalite verilerde daha kararlı bir performans sergilerken, YOLOv8m doğruluk ve hız arasında dengeli sonuçlar üretmiştir. YOLOv11m ise yüksek kalite koşullarında en yüksek mAP değerlerine ulaşmıştır.
Çalışma hem eski hem de yeni nesil YOLO mimarilerini karşılaştırmalı biçimde ele alarak, sıkıştırma kaynaklı bozulmalara karşı model dayanıklılığını kapsamlı biçimde değerlendirmektedir. Bu sonuçlar, sıkıştırılmış görsellerle çalışan yapay zekâ sistemlerinin güvenilirliğini artırmaya yönelik gelecekteki çalışmalar için yol gösterici niteliktedir. Önerilen karşılaştırmalı yapı, bulanıklık, gürültü ve hareket kaynaklı bozulmalar gibi diğer bozulma türlerine de genişletilerek daha genel bir çerçevede değerlendirilebilir.
Anahtar Kelimeler: Derin Öğrenme, JPEG Sıkıştırma, Nesne Algılama, Görsel Bozulmalar, YOLO