CNN googlenet and alexnet architecture deep learning for diabetic retinopathy image processing and classification

Yükleniyor...
Küçük Resim

Tarih

2023

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

İstanbul Gelişim Üniversitesi Lisansüstü Eğitim Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

The objective of this study is to analyze the performance of the two widely used convolutional neural network (CNN) architectures, namely AlexNet and GoogLeNet, in order to determine their relative merits and demerits with regard to the classification of photographic images. The purpose of this test is to evaluate how effectively they can recognize and prepare for a variety of various kinds of pictures. Experiments and analyses include a broad variety of subjects, such as the implementation of algorithms, various pre-processing methods, the continuation of algorithms, and various strategies for fine-tuning. Investigation is conducted into a variety of training period settings, and the findings and graphs obtained from these investigations are compared. The findings indicate that both AlexNet and GoogLeNet have the capability of being utilized in the process of photo classification. AlexNet already has a performance advantage over its rivals after only six rounds of training. In the beginning, GoogleNet was not as accurate as Caffe, but it quickly caught up by engaging in enormous training repetitions. In general, the findings of the study imply that selecting the appropriate CNN architecture should be driven more by necessity than by personal taste. While AlexNet offers high accuracy with fewer epochs, GoogLeNet shows potential for higher performance with further training. This research not only helps academics and practitioners make more educated judgments when selecting models for image classification tasks, but it also increases our understanding of CNN architectures.

Bu çalışmanın amacı, yaygın olarak kullanılan iki evrişimli sinir ağı (CNN) mimarisinin, yani AlexNet ve GoogLeNet'in performansını, fotoğrafik görüntülerin sınıflandırılmasına ilişkin göreli avantajlarını ve dezavantajlarını belirlemek için analiz etmektir. Bu testin amacı, çocukların çeşitli türden resimleri ne kadar etkili bir şekilde tanıyabildiklerini ve bunlara hazırlanabildiklerini değerlendirmektir. Deneyler ve analizler, algoritmaların uygulanması, çeşitli ön işleme yöntemleri, algoritmaların devamı ve çeşitli ince ayar stratejileri gibi çok çeşitli konuları içerir. Çeşitli eğitim periyodu ortamlarında inceleme yapılır ve bu incelemelerden elde edilen bulgular ve grafikler karşılaştırılır. Bulgular, hem AlexNet hem de GoogLeNet'in fotoğraf sınıflandırma sürecinde kullanılma yeteneğine sahip olduğunu göstermektedir. AlexNet, yalnızca altı turluk bir eğitimden sonra rakiplerine göre şimdiden bir performans avantajına sahip. Başlangıçta, GoogleNet, Caffe kadar doğru değildi, ancak muazzam eğitim tekrarlarıyla uğraşarak kısa sürede yakalandı. Genel olarak, çalışmanın bulguları, uygun CNN mimarisinin seçilmesinin kişisel zevkten çok zorunluluk tarafından yönlendirilmesi gerektiğini ima etmektedir. AlexNet daha az dönemle yüksek doğruluk sunarken, GoogLeNet daha fazla eğitimle daha yüksek performans potansiyeli gösteriyor. Bu araştırma, akademisyenlerin ve uygulayıcıların görüntü sınıflandırma görevleri için model seçerken daha eğitimli kararlar vermelerine yardımcı olmakla kalmıyor, aynı zamanda CNN mimarileri hakkındaki anlayışımızı da artırıyor.

Açıklama

Danışman: DR. ÖĞR. ÜYESİ SEVCAN KAHRAMAN Yer Bilgisi: İstanbul Gelişim Üniversitesi / Lisansüstü Eğitim Enstitüsü / Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı / Elektrik Elektronik Mühendisliği Bilim Dalı Konu: Elektrik ve Elektronik Mühendisliği = Electrical and Electronics Engineering

Anahtar Kelimeler

AlexNet, Convolutional neural network, GoogleNet, Retinopathy diabetes, AlexNet, Konvolüsyonel sinir ağı, GoogleNet, Retinopati diyabeti

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye