جمعه ۰۷ دی ۱۴۰۳ - 2024 December 27 - ۲۴ جمادی الثانی ۱۴۴۶
۲۱ شهريور ۱۴۰۱ - ۰۸:۳۷

رمزگشایی از گفتار با هوش مصنوعی

پژوهشگران موفق شدند نوعی هوش مصنوعی طراحی کنند که قادر است با اندازه‌گیری فعالیت مغزی با دقت شگفت‌آوری از گفتار رمزگشایی کند. این فناوری می‌تواند به بیمارانی که هوشیاری بسیار کمی دارند در برقراری ارتباط کمک کند.
رمزگشایی از گفتار با هوش مصنوعی
کد خبر: ۵۱۱۶۱۴

به گزارش گروه علم و آموزش ایران اکونومیست از وبگاه سایِنس نیوز (Science News)، هوش مصنوعی می‌تواند کلمات و جملات را از روی فعالیت مغز با دقت شگفت‌آور اما محدود رمزگشایی کند. دانشمندان در تحقیقات اولیه دریافتند که فقط با استفاده از چند ثانیه داده فعالیت مغزی، هوش مصنوعی حدس می‌زند که یک شخص چه شنیده است و تا ۷۳ درصد اوقات، پاسخ صحیح را در میان ۱۰ احتمال برتر لیست می‌کند.  

این هوش مصنوعی که در شرکت والد فیس‌بوک - متا، طراحی شده است، ‌می‌تواند به هزاران نفر در سراسر دنیا که قادر نیستند از طریق سخن‌گفتن، تایپ‌کردن یا حرکات بدن ارتباط برقرار کنند، کمک کند؛ از جمله به بیمارانی که هوشیاری بسیار کمی دارند یا زندگی نباتی دارند، یعنی به افرادی که دچار مشکلی هستند که عموماً به‌عنوان سندرم بیداری بدون پاسخ شناخته می‌شود.

بیشتر فناوری‌های موجود که قصد دارند به چنین بیمارانی برای برقراری ارتباط کمک کنند، نیازمند عمل‌های پرخطر جراحی مغز برای کاشت الکترودها هستند. این شیوه جدید، به احتمال زیاد راهی بادوام و غیرتهاجمی برای کمک به بیمارانی فراهم خواهد کرد که در برقراری ارتباط مشکل دارند.

 

رمزگشایی از گفتار با هوش مصنوعی

 

پژوهشگران فرانسوی به یک ابزار محاسباتی آموزش دادند که کلمات و جملات ۵۶ هزار ساعت گفتار ضبط‌شده به ۵۳ زبان را تشخیص دهد. این ابزار که به‌عنوان مدل زبان نیز شناخته می‌شود، یاد گرفت که چگونه ویژگی‌های خاص زبان را هم در سطح دقیق، حروف یا هجاها و هم در سطح وسیع‌تر، مانند یک کلمه یا جمله، تشخیص دهد.

این تیم پژوهشی، هوش مصنوعی را با این مدل زبانی در پایگاه‌های داده چهار مؤسسه به‌کار برد که شامل فعالیت‌های مغزی ۱۶۹ داوطلب بود.

در این پایگاه‌های اطلاعاتی، شرکت‌کنندگان به داستان‌ها و جملاتی از برخی کتاب‌ها مثلاً کتاب پیرمرد و دریا نوشته ارنست همینگوِی و آلیس در سرزمین عجایب نوشته لوئیس کارول گوش می‌دادند و در همان زمان مغز آنها با استفاده از مغناطیس‌نگاری مغزی یا نوار مغزی اسکن می‌شد. این تکنیک‌ها جزء مغناطیسی یا الکتریکی سیگنال‌های مغز را اندازه می‌گیرد.

سپس، تیم پژوهشی تلاش کرد با کمک یک روش محاسباتی که به توضیح تفاوت‌های فیزیکی مغزهای شرکت‌کنندگان کمک می‌کرد، مواردی را که شرکت‌کنندگان شنیده‌اند، فقط با استفاده از سه ثانیه داده‌ فعالیت مغزی هرکدام از آن‌ها رمزگشایی کند.

این تیم به هوش مصنوعی آموزش داد که صداهایی را که هنگام خواندن داستان‌ها ضبط شده بود با الگوهای فعالیت مغزی که هوش مصنوعی آن را با آنچه مردم می‌شنوند مربوط می‌کرد، تراز کند سپس با توجه به بیش از هزار احتمال، پیش‌بینی‌هایی درباره آنچه ممکن است فرد در این مدت کوتاه بشنود، انجام داد.

پژوهشگران به این نتیجه رسیدند که با استفاده از مغناطیس‌نگاری مغزی در ۷۳ درصد مواقع، پاسخ درست در میان ۱۰ حدس برتر هوش مصنوعی قرار داشت. با نوار مغزی این مقدار به حدود ۳۰ درصد کاهش یافت. هرچند عملکرد مغناطیس‌نگاری مغزی بسیار خوب بود؛ اما پژوهشگران به استفاده عملی از آن خوش‌بین نبودند؛ زیرا نیازمند دستگاهی بزرگ و گران‌قیمت است. آوردن این فناوری به درمانگاه‌ها نیازمند نوآوری‌های علمی برای ارزان‌تر کردن آنها و آسان‌تر کردن استفاده از آنها است.

آخرین اخبار