به گزارش ایران اکونومیست، عرضه ابزار هوش مصنوعی تبدیل متن به ویدیو موسوم به سورا(Sora) متعلق به شرکت اُپن ایآی در ماه گذشته با ترکیبی از ترس و هیجان از سوی محققانی مواجه شد که نگران استفاده نادرست از این فناوری بودند.
به نقل از نیچر، این شرکت مستقر در کالیفرنیا توانایی سورا را برای ایجاد ویدیوهای واقعی از روی چند متن کوتاه به نمایش گذاشت.
تریسی هاروود(Tracy Harwood)، متخصص فرهنگ دیجیتال در دانشگاه دی مونتفورت در لستر، بریتانیا، میگوید که از سرعت توسعه هوش مصنوعیِ تبدیل متن به ویدئو شوکه شده است. یک سال پیش بود که مردم به ویدیوی تولید شده توسط هوش مصنوعی که در آن ویل اسمیت بازیگر آمریکایی در حال خوردن اسپاگتی بود و بسیار غیر واقعی به نظر میرسید، میخندیدند. اکنون برخی از محققان نگران هستند که این فناوری بتواند سیاستهای جهانی را در سال ۲۰۲۴ تحت تاثیر قرار دهد.
شرکت اُپن ایآی که چت جیپیتی و فناوری تبدیل متن به تصویر دال. ای(DALL·E) را نیز توسعه داده است، سورا را در روز ۱۵ فوریه معرفی و اعلام کرد که این فناوری را برای ارزیابی بخشهای مهم از نظر مضرات یا خطرات در دسترس تیمهای قرمز قرار میدهد. «تیمهای قرمز» به انجام حملات شبیهسازی شده یا بهرهبرداری از یک فناوری میپردازند تا بررسی کنند که چگونه میتوان با فعالیتهای شرورانه، مانند ایجاد اطلاعات نادرست و محتوای نفرتانگیز در دنیای واقعی مقابله کرد.
«سورا» اولین نمونه از فناوری تبدیل متن به ویدئو نیست. سایرین عبارتند از ژن-۲(Gen-2) که توسط شرکت راناوی(Runway) در شهر نیویورک ایجاد شده و سال گذشته منتشر شده است و لومیر(Lumiere) تحت رهبری گوگل که در ماه ژانویه معرفی شد.
هاروود میگوید: اطلاعات نادرست یک چالش بزرگ برای این فناوریهای تبدیل متن به ویدئو است. ما خیلی سریع به نقطهای خواهیم رسید که در رگباری از اطلاعات به ظاهر قانعکننده غرق میشویم. این واقعا نگران کننده است.
ترس از انتخابات
این امر مشکلات خاصی را برای انتخابات آتی از جمله انتخابات ریاست جمهوری ایالات متحده در ماه نوامبر و انتخابات پارلمانی قریبالوقوع در بریتانیا ایجاد میکند. دومینیک لیز(Dominic Lees) که بر روی هوش مصنوعی و فیلمسازی مولد در دانشگاه ریدینگ بریتانیا تحقیق میکند، میگوید: تعداد عظیمی از ویدئوهای جعلی و صداهای جعلی پخش خواهند شد. صوت جعلی کییر استارمر(Keir Starmer)، رهبر حزب کارگر بریتانیا، در ماه اکتبر سال ۲۰۲۳ منتشر شد و صدای جعلی جو بایدن، رئیس جمهور ایالات متحده که دموکراتها را تشویق به عدم رایدهی میکرد نیز در ماه ژانویه منتشر شد.
یک راه حل ممکن است این باشد که هوش مصنوعی تبدیل متن به ویدیو ملزم به استفاده از واترمارک شود. چه به صورت علامت قابل مشاهده روی ویدیو دیده شود که آن را به عنوان هوش مصنوعی برچسبگذاری میکند، چه به عنوان یک امضای مصنوعی در فراداده ویدیو. البته لیز از موفقیتآمیز بودن این روش مطمئن نیست. او میگوید: در حال حاضر واترمارکها را میتوان حذف کرد و گنجاندن واترمارک در فراداده ویدیو به افرادی بستگی دارد که فعالانه درباره واقعی بودن یا نبودن ویدیویی که تماشا کردهاند تحقیق کنند. لیز میگوید: فکر نمیکنم بتوانیم صادقانه از مخاطبان در سراسر جهان بخواهیم برای هر ویدیویی که نگاه میکنند این کار را انجام دهند.
مزایای بالقوهای نیز از این فناوری وجود دارد. هاروود میگوید که میتوان از آن برای ارائه متون دشوار مانند مقالات دانشگاهی استفاده کرد به طوری که درک آنها آسانتر شود. او میگوید: یکی از بزرگترین کاربردهایی که میتوان برای آن متصور شد، انتقال یافتهها به مخاطبان عام است. این ابزار میتواند مفاهیم بسیار پیچیده را به صورت تجسمی ارائه کند.
یکی دیگر از کاربردهای بالقوه آن ممکن است برای مراقبتهای بهداشتی باشد. هوش مصنوعی تبدیل متن به ویدئو میتواند به جای پزشک انسانی با بیماران صحبت کند. کلر مالون(Claire Malone)، مشاور علم ارتباطات در بریتانیا، میگوید: ممکن است برای برخی افراد این موضوع نگرانکننده باشد. اما اگر افراد دیگری بخواهند چندین بار در روز از یک متخصص سوال بپرسند، ممکن است این کار بسیار برای آنها راحت شود.
مدیریت اطلاعات
مالون میگوید ابزارهای هوش مصنوعیِ تبدیل متن به ویدئو مانند سورا میتوانند به محققان کمک کنند تا از طریق مجموعههای دادهای عظیم، مانند آنهایی که توسط آزمایشگاه فیزیک ذرات اروپایی سرن(CERN) در نزدیکی ژنو در سوئیس تولید میشوند و دیگر پروژههای علمی بزرگ، کاوش کنند. او میافزاید که هوش مصنوعی مولد میتواند کدها را غربال کند و کارهای مبتدی تحقیقاتی را انجام دهد، اما همچنین کار بسیار پیچیدهتری مانند دریافت داده و پیشبینی نیز انجام دهد.
نگرانیهایی نیز از سوی افرادی که در صنایع خلاق کار میکنند، مطرح شده است. تام هنکس بازیگر آمریکایی سال گذشته بیان کرد که هوش مصنوعی میتواند به او کمک کند تا پس از مرگش به حضور در فیلمها ادامه دهد. لیز میگوید: اگر یک بازیگر جوان جاهطلب بودید که به آیندهاش فکر میکرد و به شما میگفتند متاسفم، تام هنکس همیشه نقشهای اصلی را بازی میکند، آیا برای آینده برنامهریزی میکردید؟
هوش مصنوعیِ تبدیل متن به ویدئو، مشکلات گستردهای را برای جامعه به وجود میآورد.
هاروود میگوید: ما باید یاد بگیریم محتوایی را که میبینیم به روشی ارزیابی کنیم و در گذشته چنین نبوده است. او میگوید: این ابزارها این فرصت را فراهم میکنند که یک تولیدکننده محتوای رسانهای در دستان همه باشد. ما با عواقب آن مقابله خواهیم کرد. این یک تغییر اساسی در نحوه مصرف ابزار است.