E-ISSN: 2587-0351 | ISSN: 1300-2694
Pamukkale University Journal of Engineering Sciences Prediction of stock index movement direction with multiple logistic regression and k-nearest neighbors algorithm [Pamukkale Univ Muh Bilim Derg]
Pamukkale Univ Muh Bilim Derg. 2021; 27(4): 556-569 | DOI: 10.5505/pajes.2020.57383

Prediction of stock index movement direction with multiple logistic regression and k-nearest neighbors algorithm

Gulder Kemalbay1, Begum Nur Alkis2
1Department of Statistics, Faculty of Arts and Sciences, Yildiz Technical University, Istanbul, Turkey
2Graduate School of Science and Engineering, Graduate Student,Yildiz Technical University, Istanbul, Turkey

In financial data mining, stock index movement direction prediction is a challenging classification problem, since stock index is affected by many economic and political factors. The accurate prediction of this problem is of interest to many researchers as it can serve as an early recommender system for short-term financiers. This study aims to predict daily upward or downward movement direction of Borsa Istanbul 100 (XU100) index with the aid of supervised machine learning algorithms based on classification. Problem we deal with includes whether on a specific day the XU100 index fall into up bucket or fall into down bucket. For this purpose, the multiple logistic regression and K-nearest neighbors algorithm models are fitted using independent variables whose effect on BIST100 index movement direction was statistically significant. Lastly, the out-of sample predictions are compared with the actual movements in the stock market. Performances are measured not only with accuracy but also other statistical metrics. According to the results obtained, logistic regression analysis achieves better predict performance with 81% accuracy opposed to K-nearest neighbors algorithm on XU100 data over the given time period.

Keywords: Index Movement Direction, K-Nearest Neighbors Algorithm, Logistic Regression, Supervised Learning

Borsa endeks hareket yönünün çoklu lojistik regresyon ve k-en yakın komşu algoritması ile tahmini

Gulder Kemalbay1, Begum Nur Alkis2
1Yıldız Teknik Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, İstanbul, Türkiye
2Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans Mezunu, İstanbul, Türkiye

Hisse senedi piyasası birçok makroekonomik değişkenler ve politik faktörlerden etkilendiği için finansal veri madenciliğinde, hisse senedi endeksi hareket yönü tahmini zor bir sınıflandırma problemidir. Bu problemin doğru tahmini kısa vadeli yatırımcılara erken öneri sistemi olarak hizmet verebileceği için birçok araştırmacının ilgisini çekmektedir. Bu çalışma, sınıflamaya dayalı denetimli makine öğrenmesi algoritmaları yardımı ile Borsa İstanbul 100 (BIST100) endeksinin günlük aşağı veya yukarı hareket yönünü tahmin etmeyi amaçlar. İlgilendiğimiz problem, belirli bir günde BIST100 endeksinin yükseleceğini veya düşeceğini tahmin etmektir. Bu amaç doğrultusunda, BIST100 endeks hareket yönü üzerindeki etkisi istatistiksel olarak anlamlı bulunan bağımsız değişkenler kullanılarak çoklu lojistik regresyon ve K-en yakın komşu algoritması modelleri kurulmuştur. Son olarak, örneklem dışı tahminler borsadaki gerçek hareketlerle karşılaştırılmıştır. Performanslar sadece doğruluk ile değil, diğer istatistiksel metrikler ile de ölçülmüştür. Elde edilen sonuçlara göre, lojistik regresyon analizi verilen zaman dilimi içinde BIST100 verileri üzerinde K-en yakın komşu algoritmasına karşı %81 doğruluk oranı ile daha iyi tahmin performansı elde etmiştir.

Anahtar Kelimeler: Endeks Hareket Yönü, K-En Yakın Komşu Algoritması, Lojistik Regresyon, Denetimli Öğrenme

Gulder Kemalbay, Begum Nur Alkis. Prediction of stock index movement direction with multiple logistic regression and k-nearest neighbors algorithm. Pamukkale Univ Muh Bilim Derg. 2021; 27(4): 556-569

Corresponding Author: Gulder Kemalbay, Türkiye
Manuscript Language: Turkish
LookUs & Online Makale