E-ISSN: 2587-0351 | ISSN: 1300-2694
Türkçe otomatik bilimsel makale özetleme sistemi [Pamukkale Univ Muh Bilim Derg]
Pamukkale Univ Muh Bilim Derg. 2024; 30(4): 470-481 | DOI: 10.5505/pajes.2023.77905

Türkçe otomatik bilimsel makale özetleme sistemi

Nazan Kemaloğlu Alagöz1, Ecir Ugur Kucuksille2
1Isparta Uygulamalı Bilimler Üniversitesi, Isparta
2Süleyman Demirel Üniversitesi, Isparta

Günümüzde internet kullanımının yaygınlaşması, hızla artan bilgi ile birlikte büyük bir bilgi kirliliğini de beraberinde getirmiştir. bu büyük ve gürültülü verilerden anlamlı veriler elde etmek internet kullanıcıları için büyük bir sorun haline gelmiştir. Genellikle dijital ortamlardan elde edilen metinler üzerinde kullanılan metin özetleme, farklı alanlardaki bilimsel makalelerin özetlenmesinde de kullanılmaktadır. Bu çalışmada bilişim alanında yazılmış Türkçe makaleler üzerinde kullanılmak üzere bilimsel metin özet çalışması yapılmıştır. Dergipark'tan toplanan makalelerle geniş bir Türk Bilişim Literatürü veri seti oluşturulmuştur. Bu veri seti üzerinde literatürde mevcut olan metin ön işleme çalışmalarına ek olarak bilimsel makale formatı ile yeni özgün bir ön işleme fonksiyonu geliştirilmiştir. Özetleme yapılırken literatürde doğal dil işleme alanında kullanımı giderek artan Deep Belief Networks (DBN) kullanılmıştır. Geliştirilen sistemin performansını ölçmek için önceden eğitilmiş bir doğal dil işleme modeli olan BERT algoritması ile referans özetleri oluşturulmuştur. Bilimsel makaleler BERT ve Deep Belief Networks ile özetlendikten sonra, özetler BERT Puanı ve BERT Modeli'nin özel bir karşılaştırma metriği olan BART Puanı ile karşılaştırıldı. Elde edilen sonuçlar, geliştirilen Türk Bilişim Literatür Özetleme Yöntemi'nin BERT Puanı metriğinde 0.78 F-Puan ve 0.68 BART Puanı ile bilimsel bir makalenin özetini oluşturduğunu göstermiştir.

Anahtar Kelimeler: Türkçe Doğal Dil İşleme, Otomatik Metin Özetleme, Derin İnanç Ağları, BERT Skor, BART Skor

System of automatic scientific article summarization in Turkish

Nazan Kemaloğlu Alagöz1, Ecir Ugur Kucuksille2
1Applied Sciences Universty Of Isparta, Isparta
2Suleyman Demirel Universty, Isparta

The widespread use of the internet today, along with the rapidly increasing information, has brought along great information pollution. it has become a big problem for internet users to obtain meaningful data from this large and noisy data. Text summarization, which is generally used on texts obtained from digital media, has also been used for summarizing scientific articles in different fields. in this study, a scientific text summary study was carried out to be used on Turkish articles written in the field of informatics. A large Turkish informatics Literature data set was created with the articles collected from Dergipark. in addition to the text pre-processing studies available in the literature on this data set, a new original pre-processing function has been developed by the scientific article format. While summarizing, Deep Belief Networks (DBN), which has an increasing use in the field of natural language processing in the literature, has been used. To measure the performance of the developed system, reference summaries were created with the BERT algorithm, which is a pre-trained natural language processing model. After the scientific articles were summarized with BERT and Deep Belief Networks, the abstracts were compared with BERT Score and BART Score, a specialized comparison metric of the BERT Model. The results showed that the developed Turkish informatics Literature Summarization Method constitutes a summary of a scientific article with 0.78 F-Score and 0.68 BART Score in the BERT Score metric.

Keywords: Turkish Natural Language Processing, Automatic Text Summarization, Deep Belief Networks, BERT Score, BART Score

Sorumlu Yazar: Nazan Kemaloğlu Alagöz, Türkiye
Makale Dili: İngilizce
×
APA
MLA
Chicago
Kopyalandı!
ATIF KOPYALA
LookUs & Online Makale