از سوی پژوهشگران دانشگاه صنعتی شریف نرمافزار تایپ گفتاری زبان فارسی بر اساس فناوری تشخیص گفتار از گوینده فارسی عرضه شد که قادر به تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرمافزار است.
کد خبر: ۱۶۰۱۶۴
به گزارش ایران اکونومیست؛ حسین صامتی، عضو هیات علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف و مجری طرح ایجاد ارتباط بین انسان و ماشین را از اهداف پیاده سازی نرمافزار «نویسا» ذکر کرد و گفت: این نرم افزار در زمینه هوش مصنوعی و پردازش سیگنال گفتار است و علاوه بر بازشناسی گفتار پیوسته و طبیعی فارسی و نوشتن متن معادل آن، بر اساس شناختی که از مدل زبانی دارد، پیشبینی ادامه متن را انجام میدهد و از این طریق دقت تایپ را افزایش میدهد.
صامتی، این نرمافزار را شامل دو بخش اصلی پردازش گفتار و زبان دانست و افزود: در پردازش گفتار به بررسی سیگنال گفتار پرداخته میشود و در بخش زبانی کلمات ادا شده ازلحاظ فراوانی، گرامر و معناشناسی مورد بررسی قرار میگیرد که در نهایت متن معادل گفتار به درستی تهیه میشود.
وی با اشاره به اینکه این نرمافزار در سال ۸۶ توسط محققان داخلی طراحی شده است، گفت: شرکت ما پیشرو در طراحی نرمافزار تبدیل گفتار به متن فارسی در جهان است؛ ولی در حال حاضر شرکتهایی چون گوگل و چندین شرکت داخلی برای زبان فارسی این سامانه را ارائه کردهاند که هیچ یک امکان بازشناسی متون تخصصی را ندارند.
مجری طرح تشخیص لهجه و لحن و ایجاد پروفایل شخصی برای تمامی کاربران نرمافزار را از قابلیتهای این نرمافزار ذکر کرد و ادامه داد: از مهمترین ویژگیهای نسخه جدید نرمافزار نویسا تولید آن در نسخههای مختلف برای کاربریهای مختلف است که از این کاربریها، میتوان به کاربری بیمارستانی، حقوقی، سازمانی و مدارس و نیز برای نویسندگان اعم از فیلمنامهنویس و نویسنده کتاب اشاره کرد که در هر یک از نسخهها با توجه به نیازهای کاربر، تطبیق با واژگان و مدل زبانی آن گروه کاربران صورت گرفته است.
صامتی پردازش خودکار زبان فارسی این نرمافزار را راهگشای انجام پروژههای متعدد کاربردی در زمینه خط و زبان فارسی در محیط رایانه عنوان کرد و یادآور شد: در نرمافزار نویسا از فرمانهای صوتی میتوان برای افزایش قابلیتهای جدید به نرمافزارهای مختلف مانند بازیها و نرمافزارهای آموزشی استفاده کرد. گفتاری کردن نرمافزارها، علاوه بر افزودن امکانات جدید به آنها، باعث جذابتر شدن آنها نیز خواهد شد. بهعنوان نمونههایی از این کاربرد، میتوان به نرمافزارهایی که در آنها نیاز به سؤال و جواب وجود دارد، مانند آموزش زبان انگلیسی و آموزش قرآن، نرمافزارهایی با سؤالات چهار جوابی اشاره کرد.
به گفته وی این قابلیت کاربران را قادر میکند تا بتوانند با استفاده از گفتار، کارهای کامپیوتری را انجام داده و یا نرمافزارها را کنترل کنند.
صامتی اضافه کرد: بهعنوان مثال کاربر میتواند با گفتن «به اینترنت وصل شو» یا «اینترنت» مرورگر اینترنت را باز کند و به اینترنت وصل شود و یا با گفتن «اندازه نوشته را بزرگتر کن» یا «بزرگتر» اندازه متن نوشته شده در ویرایشگر Word بزرگتر خواهد شد.