0% Complete
English
صفحه اصلی
/
شانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
A hybrid CNN–transformer framework for retinal disease classification
نویسندگان :
Hanie Zomorrodi
1
Hassan Khotanlou
2
1- دانشگاه بوعلی سینا
2- دانشگاه بوعلی سینا
کلمات کلیدی :
convolutional neural network،retina،transformer encoder
چکیده :
Accurate diagnosis of retinal diseases is essential for preventing visual impairment and blindness. In this study, we propose a deep learning-based framework for automatic multi-class classification of retinal images that can detect 20 ocular diseases at once. The approach starts with preprocessing and improving fundus images, followed by data augmentation to boost the model’s generalization and strength. We extract features using a combined EfficientNet-ConvNeXt framework, which captures both local details and global context. Next, we refine the extracted features with a Transformer Encoder to model relationships across the entire retinal image. Finally, an MLP classifies the input. Experimental results show that our method achieves a Model Score of 0.903, surpassing earlier methods. These findings confirm that combining feature representations from the EfficientNet-ConvNeXt architecture with Transformer-based modeling significantly enhances the accuracy of retinal disease classification.
لیست مقالات
لیست مقالات بایگانی شده
یک رویکرد سریع تحلیل و شناسایی آسیب پذیری Next-Intent در برنامه های کاربردی اندروید
زهرا کلوندی - دکتر مهدی سخائی نیا زهرا کلوندی - مهدی سخائی نیا -
Vi-Net: A Deep Violent Flow Network for Violence Detection in Video Sequences
Tahereh Zarrat Ehsan - Seyed Mehdi Mohtavipour
طبقه بندی روش های شناسایی داده های تکراری در جهت تسهیل فرایند پاکسازی داده ها
مهدی جعفری - احمد عبدالله زاده بار فروش
An efficient hybrid approach for performance-based alternative design evaluation in systems engineering
Abbas Chaman Para - Maryam Nooraei Abadeh - Sondos Bahadori
Electrophysiological Modeling and Interactive Approaches of Electrical Circuits and Hypergraphs for Understanding Neural Circuit Dynamics
Arian Baymani - Maryam Naderi Soorki
A Real-Time and Robust Approach for Banknote Recognition
Hani Abdi - Mohammad Javad Parseh
COVID-19 Image Retrieval Using Siamese Deep Neural Network and Hashing Technique
Farsad Zamani Boroujeni - Doryaneh Hossein Afshari - Fatemeh Mahmoodi
From Faces to Words: An Efficient Persian Visual Lip Reading
Mana Amini - Sajjad Aemmi - Azadeh Ashouri - Reza Akhoundzadeh - Kourosh Hassanzadeh - Mohammad Reza Mohammadi
A Survey on Utilizing Reinforcement Learning in Wireless Sensor Networks Routing Protocols
Ali Forghani Elah Abadi - Seyedeh Elham Asghari - Sepideh Sharifani - Seyyed Amir Asghari - Mohammadreza Binesh Marvasti
امنیت در اینترنت اشیا؛ معماری، کاربردها، چالشها و راهکارها
مهدی موسی وند - دکتر پیام محمودی نصر مهدی موسی وند - پیام محمودی نصر -
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.8.0