امکان تشخیص کلمات کلیدی در فایل‌های صوتی محقق شد

نرم افزار تبدیل بلادرنگ صوت به متن

محققان یکی از شرکت‌های دانش‌بنیان با ایجاد بزرگترین لغت‌نامه فارسی موفق به ارائه نرم‌افزار تبدیل متن به گفتار در زبان فارسی شدند و بنا بر گفته این پژوهشگران این محصول امکان پشتیبانی از گفتار و صوت در محیط‌های نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.

به گزارش آردی نیوز و به نقل از ایسنا، موسی مأموری، از محققان این طرح تمرکز تحقیقاتی این شرکت دانش‌بنیان را توسعه سیستم‌های هوش مصنوعی دانست و گفت: تبدیل گفتار به متن فارسی با عنوان “فارس آوا” یکی از محصولات این شرکت است. صدا در هوش مصنوعی یکی از مهمترین و ارزشمندترین موضوعات است، به گونه‌ای که کشورهای پیشرفته بیشترین سرمایه گذاری را در این حوزه داشتند، چون راحت‌ترین راه ارتباطی کلامی میان انسان و کامپیوتر به شمار می‌رود.

وی ارتباط کلامی را راحت‌ترین، ساده‌ترین و سریع‌ترین راه ارتباطی توصیف کرد و افزود: دز نرم‌افزار “فارس‌آوا” از آخرین الگوریتم‌های یادگیری عمیق استفاده شده و بر خلاف محصولات مشابه نیازی به آموزش اولیه صدای کاربر ندارد و انواع صداها برایش قابل فهم است، ضمن آنکه امکان اضافه کردن فهم صوتی به انواع نرم افزارها وجود دارد.

مأموری با بیان اینکه در حال حاضر این محصول ۱۵ درصد در زبان فارسی از گوگل بهتر عمل می‌کند، خاطر نشان کرد: در گذشته شرکت‌های ایرانی از گوگل سرویس‌های لازم برای پردازش گفتار دریافت می‌کردند، ولی به دلیل تحریم‌ شرکت‌های خارجی و افزایش قیمت ارز، مجبور به همکاری با شرکت‌های ایرانی در این زمینه هستند.

مأموری با اشاره به فعال شدن شرکت‌ها در زمینه پردازش گفتار، خاطر نشان کرد: در این زمینه شرکت‌های متعددی فعال شدند، ولی یکی از مهمترین مزیت ما نسبت به رقبا، دارا بودن دیتا صدا است، به گونه‌ای که بیش از ۷ هزار ساعت به سیستم آموزش دادیم که در این زمینه رقیب دوم ما ۳ هزار ساعت است.

مجری طرح با تاکید بر اینکه اگر پردازش گفتار قوی باشد، می‌توان سامانه‌ها و محصولات مختلفی بر روی آن پیاده سازی کرد تا به صورت هوش مصنوعی کار کند، ادامه داد: تبدیل گفتار فارسی به متن با دقت و سرعت بالا و به صورت بلادرنگ، توسعه و تولید به صورت کامل در داخل کشور، پشتیبانی از انواع فرمت‌های صوتی و ویدئویی با حجم بالا و امکان گرفتن صوت از میکروفن و تبدیل آن به متن به صورت آنلاین از قابلیت‌های این نرم افزار است.

این محقق، دارا بودن فرهنگ لغت بسیار بزرگ و وسیع را از دیگر مزایای نرم‌افزار تبدیل گفتار فارسی به متن عنوان کرد و یادآور شد: این نرم‌افزار همچنین امکان پشتیبانی از گفتار و صوت در محیط‌های نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.

وی دستیار هوشمند فارسی را از دیگر دستاورهای هوش مصنوعی این شرکت نام برد و یادآور شد: این نرم‌افزار که در آن از موتور “فارس آوا” استفاده شده است، همانند نرم‌افزارهایی چون سیری اپل و الکسا و گوگل اسیستنت کار می‌کند، به این ترتیب که دستور صوتی به کامپیوتر ارائه می‌شود و کامپیوتر صدا را تبدیل به متن می‌کند و بر اساس بانک داده‌ای که در اختیار دارد، صوت را مجددا به صورت گفتار تحویل می‌دهد.

مأموری دستیار هوشمند سازمانی را نوعی “چت‌بات” معرفی کرد که در کامل‌ترین حالت خود توانایی گفت‌وگو کردن با انسان را دارد و ادامه داد: این نرم‌افزار می‌تواند صحبت‌های انسان را متوجه شود، سوال‌های آنها را بفهمد و پاسخ متناسب با آن را ارائه دهد و هرگز پاسخ‌های نادرست نمی‌دهد.

وی با اشاره به کاربردهای این نرم‌افزار توضیح داد: به عنوان مثال با استفاده از این نرم‌افزار می‌توان درباره آب و هوا، ترافیک شهری و دریافت خدمات اسنپ سوال کرد و یا زمانی که به کسی زنگ بزنید و یا می‌خواهید پیامک ارسال کنید، از آن پرسیده می‌شود و اقدام به جست‌وجو می‌کند و در کسری از ثانیه پاسخ می‌دهد.

مأموری با بیان اینکه  این خدمات به زبان فارسی است و تفاوت این نرم‌افزار با “سیری” در نوع انتخاب زبان است، یادآور شد: در حال حاضر در ایران شرکتی به توانمندی “سیری” نداریم و ما جزو اولین‌های این حوزه‌ هستیم.

وی، مشاهده وضعیت آب و هوا، قیمت ارز و سکه، دیکشنری آنلاین، مشاهده نزدیکترین رستوران‌ها، پمپ بنزین‌ها، بیمارستان‌ها و غیره، برقراری تماس و ارسال پیامک و تنظیم آلارم، جست‌وجو و تحقیق، مکان‌یابی و ارتباط با تاکسی‌های آنلاین و امکان جستجوی کالاهای مورد نیاز از وب سایت‌ها را از جمله کاربردهای این نرم افزار نام برد.

این محقق، دستیار هوشمند فوتبالی را از دیگر محصولات نرم‌افزاری فارس آوا دانست و گفت: این نرم‌افزار می‌تواند اطلاعات حوزه فوتبال را به کاربر ارائه دهد.

مطالب مرتبط