به گزارش ایران اکونومیست، محققان دانشگاه پرینستون و دانشگاه واشنگتن با ساخت دوربینی به اندازه یک دانه نمک (کمتر از نیم میلیمتر) که قادر به ثبت تصاویر کاملاً باورنکردنی و شفاف و تمام رنگی با جزئیات بیسابقه بود، به موفقیت بزرگی دست یافتند.
حالا به نظر میرسد که این تیم یک بار دیگر با توسعه نوع جدیدی از دوربین فشرده که برای بینش رایانهای طراحی شده است، مرزها را جابجا کرده است. بینش رایانهای نوعی از هوش مصنوعی است که به رایانهها کمک میکند اشیاء را در تصاویر و ویدئوها شناسایی کنند.
به نقل از آیای، نمونه اولیه این دوربین جدید که رویکرد جدیدی را برای بینش رایانهای معرفی میکند، به جای برق به نور متکی است، انرژی بسیار کمتری نسبت به رایانههای سنتی مصرف میکند و اشیاء را با سرعت نور شناسایی میکند.
فلیکس هاید(Felix Heide)، استادیار علوم رایانه در دانشگاه پرینستون و یکی از نویسندگان این مطالعه میگوید: سؤال برای من همیشه این بود که چگونه میتوانیم از الگوریتمها برای درک جهان استفاده کنیم؟
دکتر آرکا مجومدار(Arka Majumdar)، استاد مهندسی برق و رایانه و فیزیک در دانشگاه واشنگتن و نویسنده دوم این مطالعه نیز میگوید: این یک روش کاملاً جدید در مورد اپتیک است که با اپتیک سنتی بسیار متفاوت است. این طراحی، سرتاسری است، جایی که اپتیک در ارتباط با بلوک محاسباتی طراحی میشود.
وی افزود: در اینجا، ما لنز دوربین را با اپتیک مهندسی شده جایگزین کردیم که به ما امکان میدهد محاسبات زیادی را در اپتیک قرار دهیم.
هاید به یاد میآورد که این ایده زمانی شکل گرفت که او شروع به کاوش در فراسطحها کرد که مواد ورقهمانند مصنوعی با ویژگیهای زیر طول موج هستند.
مواد فراسطحی به دلیل هندسه منحصر به فرد خود مانند لنزهای سنتی، نور را از طریق شیشه یا پلاستیک خم نمیکنند. درعوض، آنها نور را دقیقاً مانند نحوه انتشار نور هنگام عبور از یک شکاف باریک، در اطراف ساختارهای کوچک پراکنده میکنند.
هاید و شاگردانش برای ساخت این دوربین، با کارشناسان آزمایشگاه نانوساخت واشنگتن که در ساخت دستگاههای کنترل کننده نور بسیار کوچک تخصص دارند، برای مهندسی کردن دوربین و ساخت تراشه متحد شدند.
این تیم به جای استفاده از یک لنز شیشهای یا پلاستیکی سنتی، ۵۰ متا لنز روی هم، تخت و سبک وزن را ادغام کردند که از نانوساختارهای میکروسکوپی برای دستکاری نور استفاده میکنند.
این متا لنزها به عنوان یک شبکه عصبی نوری و یک سیستم هوش مصنوعی الهام گرفته از مغز عمل میکنند و چندین مزیت کلیدی را به این رویکرد میدهند.
بدین ترتیب با وجود سرعت فوقالعاده، شناسایی و طبقهبندی تصاویر بیش از ۲۰۰ برابر سریعتر از شبکههای عصبی معمولی انجام میشود. ضمن اینکه از نظر مصرف انرژی نیز بسیار کارآمد است و برای کار به جای برق به نور ورودی متکی است.
هاید و تیمش در کاوش این فناوری، شگفتزده شدند، چرا که متوجه شدند نوری که از آرایههای ستون بیرون میآید، اصلاً نیازی به شباهت به تصویر اصلی ندارد. در عوض، ستونها به عنوان فیلترهای تخصصی عمل میکردند و دادههای نوری را به دستههایی مانند لبهها، مناطق روشن و تاریک یا حتی ویژگیهایی فراتر از درک انسان مرتب میکردند، بنابراین اطلاعات از پیشپردازش شده و ساختار یافته را برای رایانهها فراهم میکردند.
هاید میگوید: ما متوجه شدیم که نیازی به ثبت یک تصویر کامل نداریم، بلکه ما فقط میتوانیم ویژگیهای خاصی را ثبت کنیم که سپس میتوانیم آنها را برای انجام کارهایی مانند طبقهبندی جمعبندی کنیم.
این تیم خیلی زود، سیستمی را توسعه داد که با لنزهای فراسطحی که ۹۹.۴ از حجم کار را مدیریت میکنند، قادر به شناسایی اشیاء در تصاویر با استفاده از کمتر از یک درصد از توان محاسباتی مورد نیاز روشهای مرسوم بود.
این سیستم یک پارادایم جدید را معرفی میکند که صدها میلیون محاسبه(FLOPS) را به صورت آنی انجام میدهد. در حالی که شبکههای عصبی سنتی از فیلترهای ریاضی(هستهها) برای استخراج دادهها استفاده میکنند که نیاز به محاسبات متعدد حتی برای چند پیکسل دارد، این شبکه به طور طبیعی فیلتر پیچیدهای را با عبور نور انجام میدهد و چند فیلتر بزرگ را قادر میسازد تا کل تصویر را در لحظه تجزیه و تحلیل کنند.
ستونهای کوچک درون هر عدسی فراسطحی، نور را بدون برق یا کنترل فعال سازماندهی و انتزاعی میکنند. هاید و اتان تسنگ(Ethan Tseng)، دانشجوی دکترا تحت هدایت او مطمئن هستند که موفقیت طراحی به استفاده از هستههای نوری بزرگ کمتر و یکپارچهسازی سختافزار و نرمافزار متکی است.
تسنگ با ذکر نمونههایی مانند میگوی آخوندک، سنجاقک و سپیداج که قطبش نور را تشخیص میدهند، میگوید: دید حیوانی چیزی بین سختافزار نوری و پردازشهای پشتیبان عصبی مشترک است. حیواناتی هستند که بینایی عجیبتری نسبت به آنچه ما داریم، دارند و ما گمان میکنیم که سختافزار چشمهایشان با مغزشان برای انجام کارهای مختلف کار میکند.
هاید در بیانیه مطبوعاتی خود ادامه داد: این به طور بالقوه میتواند فراتر از پردازش تصویر باشد و اینجاست که ما فقط نوک کوه یخ را میبینیم.
مجومدار نیز میگوید: در حال حاضر، این سیستم محاسباتی نوری یک نمونه اولیه تحقیقاتی است و برای یک برنامه خاص کار میکند.
وی افزود: ما پتانسیل آن را برای متحول کردن چندین فناوری میبینیم. البته در اینجا ما اولین قدم را برداشتهایم و این یک گام بزرگ رو به جلو در مقایسه با سایر پیادهسازیهای نوری موجود در شبکههای عصبی است.
این پژوهش در مجله Science Advances منتشر شده است.