به گزارش ایران اکونومیست، در ماده الحاقی ۴۱ لایحه برنامه هفتم توسعه کشور (۱۴۰۳ تا ۱۴۰۷)، سه بند به زبان فارسی اختصاص دارد؛ بند نخست: فرهنگستان زبان و ادب فارسی مکلف است با همکاری وزارت فرهنگ و ارشاد اسلامی و دیگر نهادهای ذیربط بهمنظور اهدای «جایزه ملی پاسداشت زبان فارسی» نسبت به تدوین آییننامه جایزه مذکور و تصویب آن در شورایعالی انقلابفرهنگی ظرف سهماه سال اول اجرای برنامه اقدام کند.
این در حالی است که سال ۱۴۰۱، نخستین دوره جایزه «قند پارسی» توسط وزارت فرهنگ و ارشاد اسلامی بهمنظور پاسداشت زبان فارسی برگزار شده است؛ در واقع جایزهای برای پاسداشت زبان فارسی داشتهایم. یاسر احمدوند، معاون فرهنگی وزارت فرهنگ و ارشاد اسلامی و دبیر شورای هماهنگی پاسداشت زبان فارسی، با اشاره به اینکه این لایحه هنوز مصوب نشده و امکان دارد از دستور کار خارج شود و بعد از تصویب و ابلاغ میتوان درباره آن گفتوگو کرد، به ایران اکونومیست گفت: اصل اینکه جایزهای برای زبان فارسی داشته باشیم، برای زبان فارسی خوب است. جایزه «قند پارسی» بهصورت محدود بود و اینکه جایزهای در برنامه کلان هفتم و توسط فرهنگستان و وزارت ارشاد نوشته شود، خب جایزهای معتبر و با پشتوانه قوی میشود. به نظرم کارهای ترویجی کمککننده هستند. نبود کارهای ترویجی در این زمینه از ضعفهایی بود که در طی سالها داشتهایم؛ بنابراین وجود جایزه از کارهای لازم است.
بند سوم این لایحه نیز موضوع جدیدی نیست بلکه بازنگری بر قانونی است که در دهه ۷۰ و در مجلس پنجم به تصویب رسیده؛ اما تاکنون به لحاظ اجرایی کاستیهایی داشته است؛ «قانون ممنوعیت بهکارگیری اسامی، عناوین، و اصطلاحات بیگانه» اما عملاً در سطح شهر حتی نمانامها (برندها)ی کالاهایی ایرانی شاهد این اسامی هستیم. در این بند پیشنهادی فرهنگستان زبان و ادب فارسی مکلف شده نسبت به بازنگری، روزآمدسازی و اصلاح قانون و آییننامههای اجرایی آن، ظرف سهماه از تاریخ لازمالاجرا شدن این قانون اقدام کند.
در این لینک میتوانید گزارش مرکز پژوهشهای مجلس شورای اسلامی درباره این قانون و اقدامات و بایدها و نبایدها و پیشنهادهایی را که در حوزه پاسداشت زبان فارسی شده است، بخوانید.
اما بند دوم موضوع نسبتاً جدیدی است و در این بند «معاونت علمی، فناوری و اقتصاد دانشبنیان رئیسجمهور مکلف است با همکاری فرهنگستان زبان و ادب فارسی و وزارتخانههای فرهنگ و ارشاد اسلامی، ارتباطات و فناوری اطلاعات و علوم، تحقیقات و فناوری با نظارت مرکز ملی فضای مجازی در طی اجرای برنامه، اقدامات لازم را در خصوص تأمین و تقویت زیرساختهای فناورانه توسعه خط و زبان فارسی در فضای مجازی (از قبیل پیکرهبندی داده، پردازش زبان طبیعی، واژهسازی، واژهپردازی، خط و قلم، مترجمها، مبدلها، تشخیص صدا و دستیار صوتی) انجام دهد.»
مسعود قیومی، مدیرگروه زبان و رایانه فرهنگستان زبان و ادب فارسی در گفتوگو با ایران اکونومیست، در توضیح و تشریح بند دوم و اینکه چقدر در این حوزه توانمند هستیم، به ایران اکونومیست گفت: این بند چند مسئله را در حوزه زبان مطرح میکند؛ یکی تهیه دادههایی که بتواند چه به لحاظ نظری و چه به لحاظ کاربردی در حوزه زبانشناسی، زبانشناسی رایانشی و هوش مصنوعی مورداستفاده قرار بگیرد. اما مواردی که در این بند مطرح شدهاند، بهنوعی موارد محدودی هستند که اگر جنبه کاربردی را در نظر بگیریم، فراتر از مواردی است که در اینجا ذکر شده است.
او با بیان اینکه در بحثهای زبانی، دادههای اولیهای که در حوزه زبانشناسی و زبانشناسی رایانشی مورداستفاده قرار میگیرند، پله اول هر کار هستند، گفت: اهمیت تهیه پیکره زبانی ازاینجهت است که حجم زیادی از اطلاعات، محتوا و دانش در این دادهها نهفته است. دادههای متنی، تصویری، صوتی و عددی، انواع دادههای ما هستند. دادههای متنی، بهواسطه اینکه با خط ثبت میشوند، این قابلیت را دارند که به لحاظ زمانی به متنهای گذشته و حال دسترسی داشته باشیم. همچنین داده متنی توسط افراد مختلف تولید میشود. مثلاً میتوان گفت در شبکههای اجتماعی، تمام افراد جامعه نویسندهاند؛ افراد مختلف با سطح سواد، سطح فرهنگ و سطح اجتماعی متفاوت مشغول خلق محتوا هستند و مینویسند ولو اینکه در نوشتههایشان غلط داشته باشند یا نه. این از موضوعاتی است که در فرهنگستان زبان و ادب فارسی دارد پیگیری میشود. ما میخواهیم در فضای مجازی سروسامانی به خط بدهیم و بتوانیم قواعدی برای آن استخراج کنیم تا اگر احیاناً سامانه خاصی تهیه شود بتواند از این اطلاعات استفاده کند.
قیومی در ادامه با تأکید بر اهمیت دادهها، و تهیه دادهها در سازمانهای مختلف از قوه قضاییه و پروندههای حقوقی گرفته تا متون حقوقی مجلس، گفت: همه آنها بهنوعی محتوا هستند و حالا که حکمرانی داده برای یک کشور در سطح بالای تصمیمگیری اهمیت پیدا کرده، میتواند از هر سازمان بخواهد بهنوعی این دادهها را جمعآوری و سازماندهی کنند تا در کارها استفاده شود. یکی از مواردی که در این بند بهصورت کلی اشاره شده، تهیه پیکرههاست که این پیکرهها میتواند بهصورت عمومی باشد و یا میتواند تخصصی و در ژانر خاص باشد؛ مثلاً متون علمی و حقوقی. حتی مقالات علمی نیز میتواند بهعنوان پیکره در نظر گرفته شود. اگر حجم عظیمی از دادهها را باتوجهبه تنوعشان در نظر بگیریم و اگر بتوانیم محتواها را جمعآوری و با استفاده از الگوریتمهای هوش مصنوعی آنها را پردازش کنیم، میتوانیم به واقعیتهای جامعه برسیم و با کمک هوش مصنوعی ویژگیهای جامعه را مشخص کنیم.
به گفته این عضو هیأت علمی پژوهشگاه علومانسانی و مطالعات فرهنگی تا زمانی که داده در حجم زیاد نداشته باشیم، نمیتوانیم چشماندازی موضوعی داشته باشیم. حجم زیاده داده به ما کمک میکند تا نسبت به مسئله درک عمیقتری به دست بیاوریم و به دانش (در هر موضوعی) دست پیدا کنیم.
او سپس با توضیحی درباره نحوه کاربرد این پیکرهها، خاطرنشان کرد: زبان فارسی جزء زبانهایی است که با محدودیت داده مواجه است و دلیل این امر دو مسئله است؛ یکی اساس پژوهشهایی است که در ایران انجام میشود. پژوهشها در ایران انفرادی است و برنامه مشخصی در این زمینه نداریم که به کدام سمتوسو حرکت کنیم، بر مسئلهای متمرکز شده و آن را از ابعاد مختلف ببینیم. این پژوهشها در راستای حل مسئله نیستند. مسئله دیگر در سطح بالای حاکمیتی است که مباحث اینچنینی مطرح نمیشوند. ما چیزی به اسم برنامهریزی زبانی در کشورمان نداریم، اینکه قرار است برای زبان فارسی چه کاری انجام شود. خب فرهنگستان زبان و ادب فارسی، متولی پاسداشت زبان فارسی است. در واقع از نظر حقوقی جایگاه را درست کردهایم؛ اما متأسفانه حمایت مالی صورت نمیگیرد.
قیومی با اشاره به برگزاری رویدادی در حوزه خط فارسی در فضای مجازی در پژوهشگاه فناوری ارتباطات و اطلاعات، گفت: این رویداد را میبایست فرهنگستان برگزار کند و یا حداقل اگر آنها برگزار کنند با اطلاع فرهنگستان باشد؛ اما متأسفانه این اتفاق نیفتاده و بهنوعی فرهنگستان کنار گذاشته شده است. گاه در تصمیمگیریها تشتتی وجود دارد و سازمانها همسو نیستند و هرکسی کار خود را میکند. پاسداشت زبان فارسی به وزارت ارتباطات، فرهنگستان و وزارت ارشاد و وزارت علوم محول شده است تا آنها در کنار هم و با همفکری کار کنند؛ اما متأسفانه همفکری وجود ندارد. برنامهریزی زبان ابعاد گستردهای دارد؛ از بحث زبان فارسی بهصورت عمومی گرفته تا گویشها. این مباحث بارها مطرح میشود؛ اما هیچگونه تصمیمگیری بهصورت مدون که بخواهد نقشه راهی را ایجاد کند، انجام نپذیرفته است.
او البته یادآور شد گاه برنامهریزی برای حل مسئله انجام میشود و کارها پیش میرود؛ اما با تغییر مدیر و یا مسئولی همه برنامهریزیها از بین میرود؛ مانند طرح تکفا در حوزه خط فارسی.
قیومی با بیان اینکه مباحث مطرحشده، مشکلات پس پرده بوده که منتج به روساختها میشود، به این موضوع که منابع محدودی در حوزه دادهها داریم اشاره کرد و گفت: این موضوع کاری است که باید حکومت به دست بگیرد نه فرد پژوهشگر یا هیئتعلمی که دسترسی به بودجه ندارد. یک پژوهشگر میتواند ایده داشته باشد اما نمیتواند به ثمر برساند مگر اینکه به منابع مالی دسترسی داشته باشد و یا سازمانی با داشتن منابع مالی، این مسئله را حل کند و این چرخ را به حرکت درآورد و فاصله را کمتر کند.
مدیرگروه زبان و رایانه فرهنگستان با اشاره به بند یادشده، اظهار کرد: این بند در ردیف ۲۷ صفحه ۱۰ ابلاغ سازمان ملی فضای مجازی به سازمانهای متولی است که چه کارهایی باید انجام شود؛ اما درباره مباحث مالی سکوت کرده است. قرار است چه کسی منابع مالی را تأمین کند تا این سازمانها کارها را انجام دهند. موضوع دوم اینکه کدام کارها را کدام سازمان انجام دهد، برنامهریزی در این حد (تقسیم وظیفه) هم صورت نگرفته تا سازمانها در کار یکدیگر دخالت نکنند و برنامهریزی انجام دهند. ابلاغیه برای شهریور سال گذشته است و طبق این ابلاغیه تا سال ۱۴۰۴ نتیجه عملکرد مشخص میشود. اما تا زمانی که پولی وجود نداشته اگر بهترین برنامهریزی هم صورت بگیرد عملاً اتفاقی نمیافتد.
مسعود قیومی سپس در توضیح مبدلها و دستیار صوتی به بعد کاربردی پیکرهها اشاره کرد و درباره کاربرد پیکرهها در چت جیبیتی، موتورهای جستوجوگر، ماشین ترجمه (ترنسلیت)، غلطیابهای خودکار در ورد، تبدیل صوت به متن و متن به گفتار، چتباتها و.. توضیح داد.