شرکت‌های فناور به دنبال مدل‌های کوچک‌تر هوش مصنوعی هستند

بسیاری از توسعه‌دهندگان فناوری تمایل دارند تا از نمونه‌های کوچک‌تر مدل‌های هوش مصنوعی استفاده کنند. این گزارش به بررسی دلایل این تمایل می‌پردازد.

کد خبر: ۷۲۳۴۱۲

به گزارش ایران اکونومیست؛ شرکت «اوپن‌ای‌آی»(OpenAI) روز پنجشنبه GPT-4o mini را معرفی کرد که نسخه کوچک‌تر و ارزان‌تر مدل هوش مصنوعی GPT-4o آن است.

به نقل از فست کمپانی، اوپن‌ای‌آی یکی از چندین شرکت‌ هوش مصنوعی است که نسخه‌ای از بهترین مدل بنیادین خود را توسعه داده تا مقداری از هوش را با سرعت و مقرون‌به‌صرفه شدن عوض ‌کند. چنین مبادله‌ای می‌تواند به توسعه‌دهندگان بیشتری امکان دهد تا برنامه‌های خود را با هوش مصنوعی تقویت کنند و شاید در آینده روزنه‌های جدیدی را برای برنامه‌های پیچیده‌تر باز کند.

بزرگ‌ترین مدل‌های زبانی بزرگ از میلیاردها یا تریلیون‌ها پارامتر استفاده می‌کنند تا طیف گسترده‌ای را از استدلال و وظایف مرتبط با پرس‌وجو انجام دهند. آنها با حجم بزرگی از داده‌ها آموزش دیده‌اند که موضوعات گوناگونی را پوشش می‌دهند. از سوی دیگر، مدل‌های زبانی کوچک فقط از میلیون‌ها یا ده‌ها میلیون پارامتر برای انجام دادن وظایف کمی استفاده می‌کنند و به قدرت محاسباتی کمتر و مجموعه کوچک‌تری از داده‌های آموزشی متمرکز نیاز دارند.

برای توسعه‌دهندگانی که برنامه‌های ساده‌تری دارند، مدل‌های زبانی کوچک ممکن است تنها گزینه قابل اجرا باشند. اوپن‌ای‌آی می‌گویدGPT-4o mini تا ۶۰ درصد ارزان‌تر از GPT-3.5 Turbo است که پیش از این مقرون‌به‌صرفه‌ترین مدل این شرکت برای توسعه‌دهندگان بود.

یک مورد دیگر، بحث سرعت است. بسیاری از کاربردهای هوش مصنوعی به دانش عمومی گسترده یک مدل زبانی بزرگ نیاز ندارند. آنها ممکن است به پاسخ‌های سریع‌تری برای پرسش‌های ساده‌تر نیاز داشته باشند. «مایک اینتراتور»(Mike Intrator)

مدیرعامل «کورویو»(CoreWeave) که میزبان مدل‌های هوش مصنوعی در فضای ابری است، گفت: منظور از تأخیر، زمان مورد نیاز برای یک برنامه هوش مصنوعی به منظور دریافت پاسخ از یک مدل در فضای ابری است. اگر فرزند من مقاله ترم خود را با کمک هوش مصنوعی بنویسد، تأخیر مشکل بزرگی نیست اما اگر بخواهد از آن برای جراحی یا رانندگی خودران استفاده کند، تأخیر با تأثیر بسیار بیشتری همراه می‌شود.

اینتراتور خاطرنشان کرد: مدل‌های مورد استفاده در خودروهای خودران باید به اندازه‌ای کوچک باشند که روی یک تراشه رایانه‌ای اجرا شوند، نه در یک سرور فضای ابری.

مدل GPT-4o mini کوچک‌تر از مدل‌های دیگر است اما هنوز آن قدر کوچک نیست که روی دستگاهی مانند تلفن همراه یا کنسول بازی اجرا شود. بنابراین، باید مانند سایر مدل‌های شرکت اوپن‌ای‌آی روی یک سرور در فضای ابری اجرا شود.

کلید نسل بعدی برنامه‌های هوش مصنوعی

«رابرت نیشیهارا»(Robert Nishihara) یکی از بنیان‌گذاران و مدیرعامل شرکت «انی‌اسکیل» (Anyscale) گفت: امروزه بیشتر برنامه‌های کاربردی مبتنی بر هوش مصنوعی شامل یک پرس‌وجو یا چند پرس‌وجو برای مدلی هستند که در فضای ابری اجرا می‌شود اما برنامه‌های پیشرفته به پرس‌وجوهای زیادی برای مدل‌های گوناگون نیاز دارند. به عنوان مثال، برنامه‌ای که به شما کمک می‌کند یک اقامت‌گاه اجاره‌ای را انتخاب کنید، ممکن است از یک مدل برای ایجاد معیارهای انتخاب، یک مدل دیگر برای انتخاب گزینه‌های اجاره و یک مدل دیگر برای امتیاز دادن به هر یک از آن گزینه‌ها استفاده کند. کارگردانی و سازمان‌دهی همه این پرسش‌ها یک تجارت پیچیده است.

عملکرد مدل‌ها مهم است اما سرعت و هزینه آنها نیز به یک اندازه اهمیت دارد. اوپن‌ای‌آی این موضوع را می‌داند؛ همان طور که شرکت‌هایی مانند متا و گوگل می‌دانند.

نیشیهارا ادامه داد: تلاش‌های این شرکت‌ها به منظور کوچک‌سازی مدل‌های هوش مصنوعی برای برنامه‌های پیچیده‌تر مانند دستیارهای شخصی بسیار مهم هستند.

اوپن‌ای‌آی اندازه پارامتر مدل‌های خود را فاش نمی‌کند اما مدل جدید آن احتمالا به اندازه Claude 3 Haiku شرکت «آنتروپیک»(Anthropic) و Gemini ۱.۵ Flash گوگل است.

اوپن‌ای‌آی گفت: GPT-4o mini عملکرد بهتری نسبت به مدل‌های مشابه در آزمایش‌ها دارد.

اوپن‌ای‌آی خاطرنشان کرد که توسعه‌دهندگان اپلیکیشن می‌توانند از طریق یک واسط برنامه‌نویسی کاربردی به GPT-4o mini دسترسی داشته باشند و مدل‌های جدید نیز از برنامه ChatGPT پشتیبانی می‌کنند.

از سراسر وب

دانلود عکس/ زیباترین لوکیشن‌های عکاسی در جهان

گزارش خطا

آخرین اخبار

شرکت‌های فناور به دنبال مدل‌های کوچک‌تر هوش مصنوعی هستند

سمعک کاج سعادت‌آباد؛ مرکز تخصصی شنوایی‌سنجی و سمعک در غرب تهران

چرا کیفیت افزودنی‌های PVC روی قیمت تمام‌شده و دوام محصول اثر مستقیم دارد؟

بررسی پراپ لینک PropLynq وقتی یک پراپ فرم بین‌المللی برای تریدر فارسی‌زبان ساخته می‌شود

مالکیت کامل ملک در دبی فقط در مناطق مشخصی به خریدار خارجی می‌رسد

بهترین پنل 60 در 60 برای سقف کاذب | الکترو هشت

از درآمد ریالی تا درآمد دلاری؛ چگونه فریلنسرهای ایرانی با مهارت‌آموزی جهانی شدند؟

مزایای استفاده از VPS فرانسه برای استارتاپ‌ها

ضرورت جلوگیری از ایجاد نارضایتی مردم در شرایط جنگی

ریزش ۴۵ درصدی مشتری اغذیه‌فروشی‌ها/ رئیس اتحادیه: منوی ثابت حذف شد

روزنامه اصولگرا: صداوسیما تریبون در اختیار کسانی می گذارد که منتقدان داخلی را خائن می خوانند

مذاکرات واشنگتن و تهران در راه است

صفحه اول روزنامه های چهارشنبه 31تیر 1405

تعطیلی ادارات هفته ی اینده برای حفظ پایداری شبکه انرژی

شناسایی نخستین سرنخ‌های ژنتیکی اختلال شخصیت مرزی

این رژیم غذایی می‌تواند به حفظ سلامت روان پس از ۵۰ سالگی کمک کند

پاسخ سازمان غذا و دارو به تذکر دیوان محاسبات

پیام محسن رضایی درباره تذکر و تاکید اخیر رهبر انقلاب

بازار فروش سوالات جعلی آزمون دستیاری

از مانجارو تا اوزمپیک؛ نسل تازه داروهای مدیریت وزن

قصور پزشکی؛ علت ۴۳ درصد پرونده‌های کمیسیون‌های پزشکی قانونی