برامج التعرف على الصوت تثبت أنها أسرع بثلاث مرات من الطباعة باستخدام لوحة المفاتيح

في دراسة حديثة قام بها باحثون من جامعة ستانفورد وجامعة واشنطن بالتعاون مع الشركة الصينية “باديو” لخدمات الانترنيت وجدوا أن برامج التعرف على الصوت (Voice Recognition Software) أكثر سرعة وأكثر دقة من الطباعة اليدوية باستخدام لوحة المفاتيح في جهاز الهاتف المحمول.

وقد نشرت نتائج الدراسة في اللغة الإنجليزية واللغة الصينية.

يقول كبير العلماء في شركة بايدو الصينية (Andrew Ng) هذا الامر لا ينبغي أن يشعرنا كبشر بالهزيمة حيث قال “أن الطبيعة البشرية لم تصمم قط للتواصل عبر الطباعة باستخدام الاصابع على لوحة المفاتيح الصغيرة أو على الهواتف المحمولة. الكلام لطالما كان الوسيلة الاقرب للطبيعة البشرية للتواصل مع بعضهم البعض”.

استندت نتائج هذه الدراسة على مسابقة بين 32 شخص تتراوح أعمارهم بين 19 الى 32 سنة، للمشاركة في برنامج باديو (للكلام العميق 2). تعتمد فكرة المسابقة على المقارنة بين سرعة الهواتف المحمولة على الكتابة بعد سماع التسجيل الصوتي للمتسابق، وبين الطباعة اليدوية للمتسابق باستخدام لوحة المفاتيح في جهاز الايفون. وقد استخدم المتسابقون عبارات قصيرة مثل “ربط حزام الأمان للسلامة” و “ارتداء التاج مع العديد من الجواهر “و” هذا الشخص كارثة “. بينت نتائج المسابقة أن برنامج التعرف على الصوت (Voice Recognition Software) أسرع ثلاث مرات من الطباعة باستخدام لوحة المفاتيح.

وقد عبر عالم الحاسوب في جامعة ستانفورد “جيمس انداي” عن استغرابه من نتائج المسابقة حيث قال انه لم يتوقع هذا الامر” كانت مفاجأة بالنسبة لي أنه كان أفضل بكثير: ثلاث مرات أسرع! يمكنك أن تفكر أن الجميع سوف يسرع لاستخدامه عندما يعلمون كيف أنها أفضل بكثير في الواقع.”

كما وقام الباحثون من جامعة ستانفورد، جامعة فريق واشنطن وفريق من شركة بايدو باختبار بين قدرة برنامج التعرف على الصوت وكتابة الكلمات المنطوقة في اللغة الإنجليزية، وجدوا أن معدل الخطأ في البرنامج حوالي 20.4 في المئة اقل من كتابة البشر على لوحة المفاتيح. وفي لغة الماندرين الصينية، يصل الى 63.4 في المئة اقل.

يأمل انداي ان هذه النتائج تشجيع الناس على إعادة النظر في فكرة التحدث مع هواتفهم.

وقال “الناس ربما تلعب مع Siri وتجد أنه لم يقدم لهم الإجابة الصحيحة، لذلك فهم لا يفكرون في استخدام الكلام كوسيلة للقيام بارسال الرسائل النصية أو البريد الإلكتروني، وما شابه”، كما يقول. “استخدام الكلام لتلك الأشياء يعمل الآن بشكل جيد.”

بالعودة الى 1990، وجد الباحثون ان أدوات التعرف على الصوت (voice recognition tools) أقل دقة من الكتابة باستخدام لوحة المفاتيح. حيث ان التكلم باللغة العامية والضوضاء المحيطة في الغرفة تعيق عمل البرنامج.

لكن في السنوات القليلة الماضية تغيرت لعدة أسباب: تماما مثل كاميرات الهواتف الذكية مع المزيد من الميغا بكسل يمكن أن يرانا أفضل ، الدمج في مكبرات الصوت يمكنه من سماعنا أفضل. أجهزة الكمبيوتر العملاقة تتعامل مع البيانات بشكل أكثر فعالية في عملية تسمى “التعلم العميق” “deep learning”.

في العام الماضي، 65٪ من أصحاب الهواتف الذكية في الولايات المتحدة استخدموا المساعد الصوتي في هواتفهم، حسب تقرير لشبكة الإنترنت عام 2016، الاستطلاع السنوي للمستثمرالفني ماري ميكر.

كما وان العديد من شركات التكنولوجيا يعملون على توظيف الخبراء بأتجاه مجال “معالجة اللغات الطبيعية” حيث يراهنون على انه سيكون نقطة الانعطاف بأتجاه تطوير برامج التعريف على الصوت حتى مع استخدام اللهجة العامية.

وقد دعت غوغل و أمازون المطورين للعمل على منتجات تعريف الصوت.

من السهل أن ترى كيف ان التحدث مع جهازك سيكون أفضل بكثير من الكتابة، خصوصا عندما تقود السيارة.

هذا و يتصور العالم Andrew Ng سيناريو آخر. قال ان ليس لديه أطفال لحد الان. ولكن، وكما يقول، إنه يتطلع إلى اليوم الذي يأتي حفيده المستقبلي المنزل ويتساءل “هل حقا يا جدي أنه عندما كنت انت صغيرا، إذا عدت إلى البيت وقلت شيئا للفرن الميكروويف الخاص بك – هل في الحقيقة انه يجلس فقط هناك ويتجاهل طلبك ؟ هذا فض جداً من الميكروويف”.

ترجمة: غادة الكعبي

تدقيق لغوي: حسام عبدالله

المصادر: 1