0% Complete
English
صفحه اصلی
/
سیزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
بررسی روشها، مجموعههای داده و معیارهای ارزیابی در حوزهی پرسش از متون درون تصویر
نویسندگان :
کبری فرشیدی
1
حسن ختنلو
2
محرم منصوری زاده
3
الهام علی قارداش
4
1- دانشگاه بوعلی سینا همدان
2- دانشگاه بوعلی سینا همدان
3- دانشگاه بوعلی سیناهمدان
4- دانشگاه بوعلی سیناهمدان
کلمات کلیدی :
پاسخگویی به سوالات دیداری متن،سازکار توجه،تشخیص کاراکتر نوری،ویژگیهای پیشآموزش،مبدلها
چکیده :
امروزه مسائل مربوط به روابط چندوجهی بین وجههای مختلف داده، بطور مثال بین وجههای تصویر، متن، صوت یکی از حوزههای تحقیقاتی پرکاربرد و پرطرفدار در بین پژوهشگران شده است. یکی از انواع این مسائل، مسئلهی پاسخگویی به سوالات دیداری است که در آن از دو وجه بصری و متنی در ورودی استفاده میشود. در نوع خاصی از این مسئله که با عنوان پاسخگویی به سوالات دیداری متنی شناخته میشود، هدف، کشف ارتباط بین تصویر بخصوص متون و علائم درون تصویر و سوال متنی پرسیده شده، دربارهی آن تصویر می باشد. پرسش از متون درون تصویر بخصوص اگر شامل عبارات مهم باشد اهمیت پیدا میکند . پژوهشگران توسط مدلهای یادگیری عمیق، معماری مبدلها، مکانیزم توجه توانستهاند به نتایج خوبی دست پیدا کنند. با توجه به انواع تلاشهای پژوهشگران در 4 سال اخیر هماکنون در دورهای هستیم که میتوان مروری برتلاشهای آنها داشته باشیم و آنها را مقایسه کنیم و مسیر رو به پیشرفت را ببینیم و اقدامات انجام شده را بازبینی کنیم. بر اساس اطلاعات بدست آمده این مقاله، اولین مقاله به زبان فارسی است که به جمعآوری و مقایسه مطالعات موجود دربارهی مسئلهی پاسخگویی به سوالات دیداری متن و چالشهای آن میپردازد.
لیست مقالات
لیست مقالات بایگانی شده
A No-Code Platform for Developing Customizable Recommender Systems for Restaurants
Moein-Aldin AliHosseini - MohammadReza Sharbaf
Presenting an Edge-based Air Quality Management System for Smart City Scenarios
Tina Samizadeh Nikoui - Ali Balador - Amir Masoud Rahmani - Hooman Tabarsaied
Sparse Beamforming Design for Non-Coherent UD-CRAN with mm-Wave Fronthaul Links
Alireza M. Hosseini - Dr Abbas Mohammadi
Simulanteus Load Balancing of Servers and Controllers in SDN-based IoMT
Somaye Imanpour - Ahmadreza Montazerolghaem - Saeed Afahari
Towards Provable Privacy Protection in IoT-Health Applications
Samane Sobuti - دکتر سیاوش خرسندی
Enhancing Supervised Learning in Speech Emotion Recognition through Unsupervised Representations
Niloufar Faridani - Amirali Soltani Tehrani - Ramin Toosi
شبکههای نرمافزار محور در کلان داده: مطالعهی راهکارهای امنیتی و چالشها
احسان سلیمانی دهکردی - محمدرضا ملاخلیلی میبدی
User Preferences Elicitation in Bilateral Automated Negotiation Using Recursive Least Square Estimation
Farnaz Salmanian - Dr Hamid Jazayeri - Dr Javad Kazemitabar
A Novel Service Deployment Policy in Fog Computing Considering The Degree of Availability and Fog Landscape Utilization Using Multiobjective Evolutionary Algorithms
Maryam Eslami - Dr Mehdi Sakhaei-nia
Distributed coordination protocol for event data exchange in IoT monitoring applications
Behnam Khazael - Hadi Tabatabaee Malazi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.3