به گزارش گروه علم و آموزش ایران اکونومیست از پایگاه خبری تِک اکسپلور (Tech Xplore)، پژوهشگران در مرکز علوم اعصاب رایکِن (RIKEN Center for Brain Science) در ژاپن به راهی برای ساخت شبکههای عصبی مصنوعی دست یافتند که میتواند اشیا را دقیقتر و سریعتر تشخیص دهند.
تمرکز این پژوهش بر حرکات چشمی ناخودآگاه است. این حرکات چشمی امکان تشخیص اشیا را برای ما فراهم میکنند. کاربرد این یافتهها در زمینه دید خودرویی (machine vision) است مثلاً تشخیص موانع مهمی را که در جادهها وجود دارند برای خودروهای خودران آسانتر میکند.
باوجود اینکه در طول روز، مدام سر و چشمهای خود را حرکت میدهیم، اشیا پیش چشمان ما تار یا غیرقابل تشخیص نمیشوند، حتی اگر اطلاعات واردشده به شبکیه چشمان مدام تغییر کند، باز هم این اتفاق نمیافتد. به احتمال زیاد آنچه باعث این ثبات ادراکی میشود، کپیهای عصبی فرمانهای حرکتی هستند. هر بار که ما حرکت میکنیم، این کپیها به همه قسمتهای مغز فرستاده میشوند و به مغز اجازه میدهند حرکات ما را گزارش کند و ادراک را ثابت نگه دارند.
براساس این پژوهش ممکن است حرکات چشم و کپیهای آنها برای تشخیص پایدار اشیا هم به ما کمک کنند اما چگونگی رویدادن این اتفاق یک راز است.
پژوهشگران یک شبکه عصبی پیچشی (convolutional neural network) طراحی کردند که راهحلی برای این مشکل پیشنهاد میکنند. این شبکه عصبی پیچشی برای بهینهسازی طبقهبندی اشیا در یک صحنه بصری در حین حرکت چشمها طراحی شده است.
ابتدا، شبکه به نوعی طراحی شده بود که ۶۰ هزار تصویر سیاه و سفید را در ۱۰ دسته طبقهبندی کند؛ کارکرد شبکه با موفقیت همراه بود اما در هنگام آزمایش با تصاویر تغییریافتهای که به تقلید از ورودیهای بصری تغییریافته طبیعی ساخته شده بودند، موفقیت این آزمایش بر پایه شانس قرار گرفت.
افزودن حرکات چشم و کپیهای آن به مدل شبکه، این اجازه را به سیستم داد تا بر اختلال در تصاویر بهتر فائق بیاید. از نظر پژوهشگران این دستاورد در دید خودرویی کاربرد خواهد داشت و از اشتباهات خطرناک پیشگیری می کند.
هرچقدر دید خودرویی بهتر باشد، احتمال کمتری وجود دارد که تغییرات پیکسلی باعث شوند یک خودروی خودران، نشان ایست را با چراغ روشنایی معابر اشتباه بگیرد یا پهپادهای نظامی، ساختمان بیمارستان را بهعنوان دشمن شناسایی کنند.