An efficient FPGA implementation of cnn specialized in image recognition for breast cancer

Abdulhadi, Omar Mhmood

Gelişmiş Arama

Göster/Aç

Yüksek Lisans Tezi / Master's Thesis (5.085Mb)

Tarih

2022

Yazar

Abdulhadi, Omar Mhmood

Üst veri

Tüm öğe kaydını göster

Özet

Görüntü işlemenin popülaritesi ve sağladığı avantajlar nedeniyle tıp sektöründe özellikle hastalıkların teşhisinde görüntü işleme teknolojisi kullanılarak yeni alanlar kurulmaya başlanmıştır. Teşhis için kullanılan bilgiler görüntü pikselleri içinde korunur ve teşhisin kalitesi, her pikselde korunan bilgi miktarı veya kalitesi ile sınırlandırılır. Sorun, bazı/belirli görüntülerde yeterli piksel bilgisi olmadığında ortaya çıkar, bu da onu belirtilen tüm uygulamalar altında işlemeye uygun hale getirmez. Başka bir deyişle, herhangi bir görüntü tarafından korunan bilginin değeri, her pikselin koruduğu şeyin bir fonksiyonudur. Bu sorun, yalnızca gri kanallarla ilgili bilgilerin mevcut olduğu ve hiçbir kronik bilginin bulunmadığı gri tonlamalı görüntülerde (tıbbi uygulamalarda yaygın olarak kullanılan) kendini gösterir. Bu nedenle, görüntünün piksel bilgisi yalnızca bir değerle temsil edildiğinden (gri tonlamalı kanal) gri tonlamalı görüntüler görüntü işleme için uygun değildir ve gri tonlamalı herhangi iki görüntü arasında (aynı olay/nesne için varsayılır) güçlü bir korelasyon sağlanamaz. ). Evrişim sinir ağları, yüz, nesne ve aktivite tanıma dahil olmak üzere çok çeşitli sınıflandırma zorluklarına ulaştı. Ancak, kısa geliştirme süresi performans ve enerji ekonomisi pahasına gelir. PYNQ geliştirme kartları, son zamanlarda FPGA prototiplerinin CPU veya GPU'larınkine eşdeğer olduğu bir olgunluk düzeyine ulaşmış olsa da, FPGA prototipleme, gömülü CNN uygulamaları geliştirmek için hala sağlam bir alternatiftir. Burada yayınlanan araştırma, açık kaynaklı bir çerçeve kullanarak FPGA prototiplemeyi hızlandıracak bir tasarımı açıklamaktadır; CNN destekli FPGA uygulamalarını hızlı bir şekilde geliştirmek için basitleştirilmiş bir platform sunar. Bu tezde önerilen çerçeve, çok çeşitli ağ özellikleri için programlanabilen ve zaman açısından verimli bir şekilde üstün performans sunan yüksek seviyeli evrişimli ağları içermektedir. Bu çalışmada, meme kanseri tespiti için bir evrişimsel sinir ağı (CNN) kullanılmıştır; bu nedenle, CNN modelinin eğitimi için büyük, renkli biyopsi görüntüleri kullanılır. Rastgele orman, k-en yakın komşular, saf Bayes, destek vektör makinesi vb. gibi diğer modeller de kullanıldı. CNN sonunda kanser tahmininin doğruluğunu %97'ye kadar koruyabilir. Ayrıca VGG-16, AlexNet, ResNet-18, ShuffleNet ve LeNet gibi önceden eğitilmiş derin öğrenme paradigmaları da aynı amaç için kullanıldı. Önerilen CNN ağı, birçok derin öğrenme ağından daha iyi performans gösterdi.

Due to the popularity of image processing and its advantages, new fields have begun to be established using image processing technology in the medical sector, especially for diagnosing diseases. The information used for the diagnosis is preserved within the image pixels, and the quality of the diagnosis is restricted by the amount or quality of information preserved in every pixel. The problem arises when there is not enough pixel information in some/specific images, making it unfit for processing under all mentioned applications. In other words, the value of information preserved by any image is a function of what each pixel preserved. This problem is manifested in grayscale images (that are widely populated in medical applications) where only information about grey channels is available, and no chronic information exists. Because of that, grayscale images are unfit for image processing since the pixel information of the image is represented by one value only (grayscale channel), and no strong correlation can be ensured between any two images in grayscale (assumed for the same event/object). Convolution neural networks have achieved a wide range of classification challenges, including facial, object and activity recognition. However, short development time comes at the cost of performance and energy economy. Although PYNQ development boards have recently reached a level of maturity, where FPGA prototypes effort is equivalent to that of CPUs or GPUs, FPGA prototyping is still a solid alternative for developing embedded CNN applications. The research published here describes a design to speed up FPGA prototyping using an open-source framework; it offers a simplified platform for developing CNN-powered FPGA applications quickly. In this thesis, the proposed framework incorporates high-level convolutional networks, which are programmable for a wide range of network specifications and offer superior performance in a time-efficient manner. In this work, a convolutional neural network (CNN) is utilised for breast cancer detection; hence, big, coloured biopsy images are used for the training of the CNN model. Other models, such as random forest, k-nearest neighbors, naïve Bayes, support vector machine, etc., were also used. CNN could eventually preserve the accuracy of cancer prediction to 97%. Moreover, pre-trained deep learning paradigms were used for the same purpose, such as VGG-16, AlexNet, ResNet-18, ShuffleNet and LeNet. The proposed CNN network has outperformed many deep learning networks.

Bağlantı

https://hdl.handle.net/11363/3776

Koleksiyonlar

Yüksek Lisans Tezleri [1219]

Aşağıdaki lisans dosyası bu öğe ile ilişkilidir:

Creative Commons

Aksi belirtilmediği sürece bu öğenin lisansı: info:eu-repo/semantics/openAccess