Rastgele ormanlardan kural ��karmada k�me b�l�nt�leme form�lasyonlar�n�n performans analizi

Edali, Mert

Cilt : 32 Say� : 4 Y�l : 2026

32/4Son Say� Dergipark Resmi Sayfam�z Erken Bask� Makale G�nderimi Dergipark 2026 sonras� (Yeni Sistem) 2025 ve �ncesi S�re�teki Makalelerin ��lemleri (Eski Sistem)

Dikkat! 1 Ocak 2026 tarihi itibariyle makale al�m i�lemleri dergipark �zerinden yap�lacakt�r. 2025 Aral�k �ncesi makaleler journalagent sisteminden devam edecektir. Hakemlik i�in l�tfen hangi sistemden mail gelmi� ise ilgili sisteme giri� yap�n�z.

Rastgele ormanlardan kural ��karmada k�me b�l�nt�leme form�lasyonlar�n�n performans analizi [Pamukkale Univ Muh Bilim Derg]

Pamukkale Univ Muh Bilim Derg. 2021; 27(4): 513-519 | DOI: 10.5505/pajes.2020.05926

Rastgele ormanlardan kural ��karmada k�me b�l�nt�leme form�lasyonlar�n�n performans analizi

Mert Edali
End�stri M�hendisli�i B�l�m�, Y�ld�z Teknik �niversitesi, �stanbul

Rastgele Ormanlar farkl� alanlardaki s�n�fland�rma ve regresyon problemleri i�in s�kl�kla kullan�lan bir yapay ��renme algoritmas�d�r. Y�ksek ba�ar�m g�stermelerine ra�men, yap�ta�lar� olan karar a�a�lar�na k�yasla yorumlanabilirlikleri olduk�a d��kt�r. Her bir �yesinin bir karar a�ac� oldu�u ger�e�inden yola ��karak, Rastgele Ormanlardan yorumlanabilir e�er-ise tipinde kurallar ��karmak i�in farkl� k�me b�l�nt�leme form�lasyonlar� �neriyoruz. Literat�rde s�kl�kla kullan�lan s�n�fland�rma ve regresyon veri setleri �zerinde yapt��m�z deneylerin sonu�lar� g�stermektedir ki orijinal k�me b�l�nt�leme model form�lasyonu, ba�ar�m� kabul edilebilir seviyelerde tutarak kural say�s�n� �nemli �l��de d��rebilmektedir. ��kar�lan kural say�s�n� daha da d��rebilmek i�in problemin ama� fonksiyonuna bir de�i�iklik �neriyoruz. Bu de�i�iklikle birlikte, ��kar�lan kural say�s�nda daha da d�� g�zlemlerken ba�ar�m�n ayn� seviyelerde kald��n� g�zlemliyoruz. K�me b�l�nt�leme problemi
NP-zor olmas�na ra�men, �o�u veri seti i�in yirmi dakika i�inde en iyi ��z�m� buluyoruz.

Anahtar Kelimeler: Rastgele Ormanlar, Kural ��karma, K�me B�l�nt�leme, S�n�fland�rma, Regresyon, Yorumlanabilirlik

Performance analysis of set partitioning formulations on the rule extraction from random forests

Mert Edali
Department of Industrial Engineering, Yildiz Technical University, Istanbul

Random Forests is a widely used machine learning algorithm for classification and regression problems from different domains. Although they are generally accurate, their interpretability is low compared to their building blocks: single decision trees. Using the fact that each member of a Random Forest is a decision tree, we propose different set partitioning formulations to extract interpretable if-then rules from Random Forests. Our experiments on well-known classification and regression datasets show that the original set partitioning model formulation significantly reduces the number of rules while keeping the accuracy at acceptable levels. We also propose a modification to the problem's objective function, which aims to reduce the number of extracted rules further. We observe a further reduction in the number of extracted rules while the accuracy values stay nearly the same. Although the set partitioning problem is NP-hard, we obtain optimal results for most datasets within twenty minutes.

Keywords: Random Forests, Rule Extraction, Set Partitioning, Classification, Regression, Interpretability

Sorumlu Yazar: Mert Edali, T�rkiye
Makale Dili: �ngilizce

ATIF KOPYALA

Tam Metin PDF At�f dosyas� indir RIS EndNote BibTex Medlars Procite Reference Manager Yazara e-posta g�nder Benzer makaleler Google Scholar