به گزارش روز شنبه گروه علمی ایران اکونومیست، در سالهای اخیر، پیشرفتهای چشمگیری در حوزه فناوریهای صوتی و سیستمهای دریافت صدا به وقوع پیوسته است. این پیشرفتها، دستگاههایی نظیر اسپیکرهای هوشمند، دستیارهای صوتی و سامانههای کنفرانس را به ابزارهای قابل اعتمادی برای تعامل انسان و ماشین تبدیل کرده است. با این حال، توسعه سیستمهای دریافت صدا از فواصل دور همچنان با چالشهای فنی متعددی همراه است که حل آنها مستلزم بهکارگیری فناوریهای نوآورانه است.
یکی از چالشهای اصلی در این حوزه، تأثیر نویزهای محیطی و انعکاس صدا (اکو) بر کیفیت سیگنالهای صوتی دریافتی است. نویزهای پسزمینه، تغییرات موقعیت منبع صدا، و بازتابهای چندگانه از سطوح محیطی میتوانند موجب کاهش کیفیت دریافت صدا شوند.
در پاسخ به این چالشها، روشهای مختلفی توسعه یافتهاند؛ از جمله این روشها میتوان به تکنیکهای پردازش سیگنال برای کاهش نویز و حذف اکو، استفاده از الگوریتمهای پرتودیسی (Beamforming) برای تمرکز بر منبع صوتی مشخص، و بهرهگیری از مدلهای یادگیری ماشین پیشرفته برای افزایش دقت تشخیص اشاره کرد.
فناوری آرایههای میکروفونی، بهعنوان یکی از نوآورانهترین ابزارهای موجود، امکان دریافت صدا از فواصل دور را با دقت بالا فراهم میکند. این فناوری با استفاده از الگوریتمهای پرتودیسی، میتواند سیگنالهای صوتی را از یک جهت خاص تقویت کرده و نویزهای محیطی را تقلیل دهد.
در عین حال، مدلهای یادگیری عمیق که در سالهای اخیر پیشرفت زیادی داشتهاند، نقش کلیدی در استخراج ویژگیهای صوتی، پیشبینی گفتار در محیطهای چالشبرانگیز و افزایش قابلیتهای سیستمهای صوتی ایفا میکنند.
با وجود این پیشرفتها، ترکیب بهینه این فناوریها بهگونهای که بتوانند عملکرد سیستمهای دریافت صدا را در شرایط واقعی و صنعتی تضمین کند، همچنان یک حوزه پژوهشی فعال و چالشبرانگیز است. همچنین طراحی سیستمهایی که از نظر محاسباتی و منابع مصرفی بهینه بوده و برای پیادهسازی در محصولات مصرفی مانند اسپیکرهای هوشمند مناسب باشند، نیازمند تحقیقات عمیقتر در زمینه بهینهسازی الگوریتمها و طراحی سختافزارهای تخصصی است.
اما بنیاد ملی علم ایران در راستای مأموریتگرا شدن پژوهشها و حمایت از طرحهای پژوهشی که به فناوری روز دنیا میپردازد و میتواند باری از دوش صنعتگران کشور بردارد، فراخوانهایی را با عنوان برنامه حمایت از پژوهش عمیق شرکتهای دانشبنیان منتشر میکند.
«توسعه سیستمهای نوآورانه دریافت صدا از فواصل دور با استفاده از آرایههای میکروفون و الگوریتمهای هوش مصنوعی» بهعنوان یکی دیگر از فراخوانهای این برنامه، منتشر میشود و افراد واجد شرایط تا پایان فروردین ۱۴۰۴ فرصت دارند که پروپوزال خود را از طریق سامانه کایپر برای بنیاد ملی علم ایران ارسال کنند.
هدف این پژوهش، طراحی و پیادهسازی سیستمهای پیشرفته دریافت صدا از فواصل دور، با هدف توسعه نسل جدید دستیارهای صوتی هوشمند است. در این راستا، از آرایههای میکروفون، الگوریتمهای پردازش سیگنال، پرتودیسی (Beamforming) و مدلهای پیشرفته یادگیری ماشین بهره گرفته میشود. این سیستم با هدف کاهش نویز، حذف اکو و بهبود برد و کیفیت دریافت صدا، قابلیت سازگاری با محیطهای گوناگون و زبانها و گویشهای متنوع را خواهد داشت.
این فراخوان پژوهشی به دنبال همکاری با تیمهای متخصص در حوزههای پردازش سیگنال دیجیتال، طراحی سیستمهای الکترونیکی و هوش مصنوعی است تا نمونه اولیهای از این فناوری توسعه یابد. نتایج این پژوهش میتواند در کاربردهایی همچون اسپیکرهای هوشمند، تماسهای کنفرانسی و هویتسنجی امنیتی مورد استفاده قرار گیرد.
هدف این طرح پژوهشی، طراحی و توسعه یک سیستم پیشرفته دریافت صدا از فواصل دور با استفاده از انتخاب و جایگذاری بهینه میکروفنها و ترکیب فناوریهای پردازش سیگنال، پرتودیسی و یادگیری ماشین است.
این سیستم باید توانایی مقابله با نویز و اکو را داشته و در عین حال از لحاظ منابع پردازشی، زمان پاسخگویی و قیمت تمامشده، بهینه باشد.
در این فراخوان از تیمهای پژوهشی دعوت شده تا با ارائه پیشنهادهای خود، در مسیر حل این مسئله مهم و توسعه سیستمهای صوتی هوشمند آینده سهیم باشند.
بر اساس اعلام بنیاد علم ایران علاقهمندان برای دسترسی به متن اصلی فراخوان اینجا را کلیک کنند.