كيف تستخدم أنظمة الذكاء الاصطناعي لعبة Mad Libs اللغوية لتعلم القواعد النحوية

تخيّل أنك تدرب حاسوبًا على معرفة أقسام الكلام باستخدام مفردات حقيقة وقواعد أساسية، فكيف سيتعامل هذا الحاسوب مع هذه الجملة: «الطاهي أسرع الى المتجر الذي نفذ منه الطعام».

هل نفذ الطعام من الطاهي أم من المتجر؟ وهل قام الطاهي بإدارة المتجر الذي نفد الطعام منه؟

سيتوصّل معظم البشر المتحدثين باللغة الإنجليزية للإجابة الصحيحة على الفور، ولكن أنظمة الذكاء الاصطناعي المتقدمة قد تخطئ في الإجابة، وذلك لأن جزءاً من الجملة يقول حرفيًا «المتجر الذي نفذ منه الطعام» مما سبب للحاسوب هذا الارتباك.

أحرزت نماذج متطورة لتعلُّم الحاسوب تقدمًا كبيرًا في التعامل مع هذه الأخطاء، وذلك من خلال التدرب على أعداد ضخمة من البيانات أو الاعرابات المحوسبة (البنوك الشجرية النحوية treebanks)، وهي مجموعة نصوص صنّفها الانسان لتعلم القواعد النحوية وبناء الجمل وغير ذلك من المبادئ اللغوية.

إن البنوك الشجرية النحوية مُكلِفَة وتتطلب العديد من الموظفين، ولا تزال الحواسيب تكافح لفهم الكثير من القواعد الغامضة، إذ يمكن أن يكون لنفس الكلمة عدة معانٍ مختلفة، وذلك حسب بنية الجملة وسياقها.

ولكن توصلت دراستان جديدتان أجراهما باحثون في مجال الذكاء الاصطناعي في جامعة ستانفورد، إلى أن أنظمة الذكاء الاصطناعي المتقدمة يمكنها فهم المبادئ اللغوية بنفسها، وبدون تدريب مُسبق على جملٍ معينة صنّفها لهم البشر. وأن هذا يشابه كيفية تعلم الأطفال للغتهم الأم قبل أن يعلمهم الكبار القواعد اللغوية أو بناء الجمل بمدة طويلة.

يعتقد الباحثون أن الأمر الأكثر إثارة للدهشة هو اكتشاف أن الذكاء الاصطناعي يستطيع الاستدلال على قواعد نحوية «عالمية» تنطبق على العديد من اللغات المختلفة. وهذه القدرة لها تطبيقات كثيرة على عملية معالجة اللغات الطبيعية، التي أصبحت مركزية بشكل متزايد بالنسبة لأنظمة الذكاء الاصطناعي التي تجيب على الأسئلة وتترجم اللغات وتساعد العملاء بل وتستعرض السير الذاتية. ويمكنها كذلك تسهيل أنظمة تعلم اللغات التي يتحدث بها عدد ضئيل جدًا من الناس فقط.

كيف تمكنت الحواسيب من فعل ذلك؟ يبدو أن الحواسيب تتعلم الكثير عن اللغة من خلال لعب المليارات من ألعاب الكلمات مثل لعبة مادلبس Mad Libs (وهي لعبة تُلعب من قبل لاعب واحد يطالب الآخرين بأن يحزروا الكلمات المناسبة التي يُمكن أن تحل محل الفراغات المتكررة في القصة. تُلعب هذه اللعبة بشكل متكرر في الحفلات من أجل التسلية، وظهرت لأول مرة في الولايات المتحدة).

من أجل الحصول على قدرة أفضل على التنبؤ بالكلمات المفقودة، تقوم الأنظمة بشكل تدريجي بإنشاء نماذجها الخاصة حول كيفية ارتباط الكلمات ببعضها البعض.

صرح كريستوفر مانينج Christopher Manning، الأستاذ في مركز توماس سيبل Thomas M. Siebel لعلوم الآلة وأستاذ علم اللسانيات وعلوم الكمبيوتر في ستانفورد، والمدير المعاون في معهد ستانفورد للذكاء الاصطناعي المتمحور حول الإنسان (HAI): «إن ما تفعله الحواسيب يشابه ما يفعله الطفل البشري، ومع تزايد حجم هذه النماذج وزيادة مرونتها، اتضح أنها تنظم نفسها بنفسها لاكتشاف وتعلم بنية اللغة البشرية».

تعلُّم بنية الجملة

ذكرت إحدى الدراسات عن هذا الموضوع عدة تجارب قام بها ثلاثة طلاب يدرسون الدكتوراه في علم الكمبيوتر في جامعة ستانفورد، وهم كيفن كلارك Clark Kevin وجون هيويت John Hewiit واورفاشي خاندلوال Urvashi Khandelwal، الذين عملوا مع مانينج وعمر ليفي Omar Levy، وهو باحث في شركة فيس بوك للأبحاث المتعلقة بالذكاء الاصطناعي.

بدأ الباحثون باستخدام أحدث نموذج لمعالجة اللغات طورته جوجل والذي يطلق عليه اسم بيرتBERT اختصارًا ل: «تمثيلات التشفيرات ثنائية الاتجاه من المحولات Bidirectional Encoder Representations from Transformers»، ويستخدم بيرت لعبة الكلمات مادلبس لتدريب نفسه. ولكن افترض الباحثون في البداية أن بيرت كان يقوم ببساطة بصنع روابط بين الكلمات المتقاربة. على سبيل المثال، تدفع الجمل التي تحتوي على كلماتٍ مثل «كرة السلة» و«قفزة من أجل التسديد» إلى حث النموذج على البحث عن كلمات مرتبطة بكرة السلة.

ولكن وجد فريق ستانفورد أن النظام كان يفعل شيئًا آخر أكثر تعقيدًا من ذلك، فقد كان يتعلمُ بنية الجمل من أجل تحديد الأسماء والأفعال وكذلك تحديد الفاعل والمفعول به والمفعول به الثاني. وهذا بدوره أدى إلى تحسين قدرته على تفسير المعنى الحقيقي للجمل التي قد تسبب الارباك قليلًا.

يقول مانينج: «إن كان بإمكان الآلة تحديد الفاعل أو المفعول به للفعل المقدّر (الفعل غير الموجود في الجملة)، فإن ذلك يساعده على التنبؤ بنوع الفعل بطريقة أفضل من مجرد معرفة الكلمات التي تظهر أمامه». فمثلًا، إذا كان الحاسوب يعرف أن الضمير «هي» يشير إلى المغنية ليدي غاغا Lady Gaga، فسيكون لديه فكرة أفضل عن الوظيفة اللغوية لكلمة «هي».

كما أصبح النظام جيدًا أيضًا في تحديد الكلمات التي تشير إلى بعضها البعض، ففي إحدى النصوص التي تناقش موضوع الاجتماعات التي تجري بين الفلسطينيين والإسرائيليين، اكتشف النظام بأن كلمة «المحادثات» المذكورة في إحدى الجمل تملك نفس المعنى الذي تحويه كلمة «المفاوضات» في الجملة التالية.

يقول مانينج: «إنها معجزة بلا شك. فكل ما نقوم به نحن الباحثون هو جعل هذه الشبكات الكبيرة جدًا تلعب لعبة الكلمات مادلبس، وهذا وحده كافٍ لتمكين النظام من البدء في تعلم القواعد النحوية».

اكتشاف مبادئ اللغة العالمية

وفي بحثٍ آخر منفصل، وجد إثان تشي Ethan Cho ومانينج وزملاءه دليلًا يُشير إلى أن بيرت يُعلِّم نفسه مبادئ عالمية يمكن أن تنطبق على لغات مختلفة مثل الإنجليزية والفرنسية والصينية.

وفي الوقت نفسه، تعلِّمَ النظام عن الاختلافات الموجودة بين اللغات. ففي اللغة الإنجليزية، عادة ما تسبق الصفة الموصوف، ولكن في اللغة الفرنسية وعدة لغات أخرى كثيرة تُوضع الصفة بعد الموصوف.

خلاصة القول: إن تحديد أنماط اللغات سيجعل من السهل على النظام الذي يتعلم لغة واحدة أن يتعلم المزيد منها، حتى ولو كانت هذه اللغات لا تملك سوى القليل من القواسم المشتركة.

أردف مانينغ: «إن هذا التمثيل النحوي المشترك بين اللغات يكشف لنا أن تدريب الحاسوب على 10 لغات يسهِّل عليه كثيرًا تعلُّم اللغة الحادية عشرة أو الثانية عشرة».

المصادر: 1