چهارشنبه ۲۱ آذر ۱۴۰۳ - 2024 December 11 - ۸ جمادی الثانی ۱۴۴۶
۲۱ اسفند ۱۴۰۲ - ۱۰:۳۹

رونمایی از کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه

کلان پیکره زبان فارسی، بزرگ‌ترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی رونمایی شد.
رونمایی از کلان پیکره زبان فارسی با ۳۵ میلیارد کلمه
کد خبر: ۶۸۲۵۸۸

به گزارش گروه علم و آموزش ایران اکونومیست از معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، همایش الزامات توسعه مدل زبانی بزرگ فارسی با عنوان هوش مصنوعی مولد قدرت حکومت ها به همت ستاد توسعه فناوری های هوش مصنوعی و رباتیک در پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.

در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری های هوش مصنوعی و رباتیک و توسعه داده شده معاونت علمی ریاست جمهوری توسط شرکت ترگمان رونمایی شد.

این کلان پیکره با آزاد رسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار می گیرد.

«مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می‌کند.

هوش مصنوعی مولد در یک سال اخیر بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدل‌های زبانی بزرگ(LLM ها) بوده است.

 

بیشتر بخوانید

 

مدل‌های زبان بزرگ یک نوع از مدل‌های هوش مصنوعی است که توانایی پردازش اطلاعات چندجانبه را دارند. این مدل‌ها از قدرت بی‌نظیر خود در پردازش زبان برای ایجاد پاسخ‌های بهینه تر و بهتر به سوالات مختلف کاربران استفاده می‌کنند. در حال حاضر، طراحی و مهندسی دستورالعمل‌های بهینه برای این مدل‌ها از اهمیت زیادی برخوردار است و تیم‌های پژوهشی در دانشگاه‌ها و مراکز تحقیقاتی مختلف به این موضوع توجه ویژه‌ای دارند.

 

 

آخرین اخبار