0% Complete
فارسی
Home
/
شانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
Listening with Precision: ASR-Guided Method and Fusion Strategy for Text-Dependent Speaker Verification
Authors :
Mohammad Reza Molavi
1
Reza Khodadadi
2
Hossein Zeinali
3
1- دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)
2- دانشگاه صنعتی شریف
3- دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)
Keywords :
speaker verification،text-dependent, ASR،speaker embedding fusion
Abstract :
This paper proposes a text-dependent speaker verification approach (TD-SV) that improves accuracy and robustness by leveraging automatic speech recognition (ASR) to guide the verification process and final fusion score. Our system inte- grates a Fast-Conformer-based ASR module to validate speech content, effectively filtering out target-wrong and impostor- wrong trials. We propose a feature fusion method for speaker verification that combines speaker embeddings from Wav2Vec- BERT and ReDimNet, leveraging self-supervised and task- specific representations for superior performance. This fusion significantly improves verification accuracy compared to indi- vidual embeddings. Our approach achieves a competitive nor- malized minDCF of 0.045 on the Iranian division of the TD- SV 2024 Challenge test set, demonstrating an optimal balance between performance and computational efficiency. Our best submission secured the second rank in the challenge.
Papers List
List of archived papers
Improving Training Stability in Variational Autoencoders Through the Integration of Score Matching Loss
Amirreza Mokhtari Rad - Pouya Ardehkhani - Hormehr Alborzi
Presenting an Edge-based Air Quality Management System for Smart City Scenarios
Tina Samizadeh Nikoui - Ali Balador - Amir Masoud Rahmani - Hooman Tabarsaied
معماری مبتنی بر مدلهای زبانی بزرگ برای تخصیص وظایف پویا و خودکار در سامانه رباتیک ازدحامی چندالگوریتمی
حمید هوشمند - سینا میرخانی - محمد حسین وارث وزیریان
Secure Web-Based Control of ROS 1 Robots Using AES-256-GCM Encryption and LLM Integration
Ali Godarzvand chegini - Mohammad Arabian
بهینهسازی مسیر وسیله ی نقلیه ی هوایی بدون سرنشین جهت کاهش زمان جمع آوری داده از حسگرها در شبکه ی اینترنت اشیا مبتنی بر الگوریتم یادگیری تقویتی عمیق
محمد ناظمی جنابی - هادی اشعریون - مهدی پورقلی
رویکردی در تشخیص خودکار بوهای بد در مدل های معماری سازمانی با استفاده از تحلیل گرافی
زهرا رحیمی تمندگانی - شهره آجودانیان
Classification of Personality Traits on Facebook Using Key Phrase Extraction, Language Models and Machine Learning
Faezeh Safari - Abdolah Chalechale
Design and modeling of a waiter robot
Amin Mohammadnejad - Hami Tourajizadeh
GNN-based Topology Feature Extraction for Adaptive 6G Network Slicing
Amirmasoud Sepehrian - Siavash Khorsandi
AI-Powered Beauty Insights: Sentiment Analysis in a Low-Resource Language
Sajedeh Talebi - Neda Abdolvand - Fatemeh Mahdian
more
Samin Hamayesh - Version 42.5.2