السرُّ خلف نجاح شبكات التعلُّم العميق

اكتشافات جديدة تطرح رؤية نظرية عن سبب نجاح شبكات التعلُّم العميق

تثيرُ شبكات التعلّم العميق ثورةً في التكنولوجيا من حولنا، بدءًا من تمييز الصوت الذي يقرِن كلّ شخص بهاتفه وليس انتهاءً بالمَركبات ذاتية القيادة القادرة بشكل متزايد على رؤية وتمييز العوائق التي تعترض مسارها. لكن، يتطلّب الكثير من هذا النجاح تجربة مصحوبة مع أخطاء عندما يعود الأمر لشبكات التعلّم العميق بعينها. أعاد باحثون من معهد ماساتشوستس للتكنولوجيا MIT مؤخراً النظر في مساهماتهم بغية تحقيق فهم نظري أفضل لشبكات التعلم العميق، مقدّمين بذلك إرشادات من شأنها المضي قدمًا في هذا المجال.

يصرّح تومي بوجيو Tommy Boggio وهو باحث في معهد McGovern لأبحاث الدماغ، ومدير مركز أبحاث الأدمغة والعقول والآلات (CBMM)، وبروفيسور الدماغ والعلوم الإدراكية في مركز Eugene McDermotte: «كان اكتشاف التعلّم العميق أمرًا عرضيًا بطريقة ما». ويضيف: «ما زلنا لا ندرك سبب فاعليّتها. يجري تكوين إطار نظري، وأعتقد أننا قريبون الآن من وضع نظرية مُرضية، كما حان الوقت لإفساح المجال واستعراض الرؤى الحديثة».

تسلُّق جبال البيانات

يتميّز عصرنا الراهن بوفرةٍ كبيرة في البيانات، والتي هي بيانات مصدرها أجهزة استشعار غير مكلفة ومن جميع الأنواع والنصوص والإنترنت وكميات كبيرة من بيانات جينومية يتم إنتاجها باستمرار في علوم الحياة.

تستوعب الحواسيب هذه الأيام حزمات من البيانات متعددة الأبعاد هذه، محدثةً بذلك مجموعةً من معضلاتٍ أطلق عليها الرياضياتي الراحل ريتشارد بيلمان Richard Bellman (لعنة الأبعاد).

إحدى هذه المعضلات هي أن تمثيلَ وظيفة يسيرة ذات أبعاد قياسية يتطلّب عددًا هائلًا من المتغيرات. نعلم أن الشبكات العصبية العميقة تفيد على نحو خاص في تعلم آلية تمثيل أو تقريب مثل هذه البيانات المعقّدة لكن السؤال هنا لماذا؟ لربما يساعد فهم السبب في تطوير تطبيقات التعلّم العميق.

يوضح بوجيو، وهو المستشار العلمي المؤسس لشركة The Core ولقسم التنقيب عن الذكاء في معهد ماساتشوستس للتكنولوجيا MIT Quest for Intelligence والباحث في مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) في معهد ماساتشوستس: «يشبه التعلّم العميق حالة الكهرباء بعد اكتشاف العالم فولتا للبطارية، لكن بحلّتها تلك قبل بروز العالم ماكسويل». ويضيف: «كانت التطبيقات المفيدة ممكنةً بالتأكيد بعد فولتا، لكنها ما كانت إلا نتاجًا لنظرية ماكسويل الكهرومغناطيسية، ذلك الفهم الأعمق الذي فتح الباب بعدها لاكتشاف الراديو والتلفاز والرادار والترانزستورات والحواسيب والإنترنت».

تُشير المعالجة النظرية التي أجراها كل من بوجيو وأندريه بانبورسكي Andrzej Banburski وكيانلي لياو Qianli Liao إلى السبب المحتمل لقدرة التعلم العميق على قهر مشكلات البيانات كمشكلة لعنة الأبعاد. يبدأ نهجهم عند استنتاج هرمية العديد من البنى الطبيعية. إن نمذجة نمو وتطور شجرة لا يتطلب منا تحديد موقع كل غصن. بالمقابل، بمقدور النموذج استخدام قوانين مكانية لتوجيه الفروع هرميًا.

يبدو أن النظام البصري الرئيسي يقوم بشيء مماثل عند معالجة بيانات معقّدة. فعندما ننظر إلى صور طبيعية فيها أشجار وقطط ووجوه، يقوم الدماغ بدمج أجزاءٍ من الصورة المكانية بنجاح، ثم يدمج مجموعات صغيرة من الأجزاء، وأخيرًا يراكب مجموعات من المجموعات الجزئية.

يوضح مؤلف الدراسة كيانلي لياو، وهو خريج قسم الهندسة الإلكترونية وعلم الكومبيوتر وعضوٌ في CMBB: «إن العالم الماديّ هو عالم متراكب، بكلمات أخرى هو مركّبٌ من العديد من التفاعلات الفيزيائية الموضعية. لا يقتصر هذا على الصور فحسب، فاللغة والأفكار متراكبة وحتى جهازنا العصبي متراكب إذا ما تكلمنا عن كيفية تواصل الأعصاب مع بعضعها البعض، تفسر مراجعاتنا بشكل نظري سبب جودة الشبكات العميقة في تمثيل مثل هذا التعقيد».

من البديهي أن تكون الشبكة العصبية الهرمية أفضل في تقريب الوظيفة المتراكبة مقارنةً بطبقة واحدة من الأعصاب. حتى وإن كان العدد الإجمالي للأعصاب هو ذاته. يحدد القسم التقني في عملهم الطريقة المثلى في التقريب، والتي من شأنها أن تدل على صحّة هذا الحدس وتبرهنه.

لغز التعميم

يوجد لغز آخر حول ما يسمّى أحيانًا بالكفاءة غير المعقولة لشبكات التعلم العميق. غالبًا ما تتضمن نماذج الشبكة العميقة عددًا من المتغيرات التي تحتاج للملاءمة أكبرَ بكثيرٍ من عدد البيانات، رغم الكميات الهائلة من البيانات التي ننتجها هذه الأيام.

ينبغي لتلك الحالة أن تقود إلى ما يُدعى ب(الفائض في الملاءمة)، ومعناها عندما تقوم بياناتك بملائمة النموذج على نحوٍ حسن، لكن أي بيانات إضافية يغدو عندها ملاءمة البيانات أمرًا مريعًا.

يندرج ذلك تحت عنوان التعميم الضعيف في النماذج التقليدية، حيث وُضع الحل التقليدي لتقييد بعض جوانب عملية إجراء الملاءمة. يبدو على أي حال أن الشبكات العميقة لا تتطلب هذه القيود، حيث أثبت بوجيو وزملاؤه ذلك، إلا أنه في العديد من الحالات تؤدي عملية ترويض الشبكة العميقة إلى ضبط الحل بشكل مطلق محدثةً بذلك قيود.

ينطوي العمل هذه الأيام على عدد من المقتضيات المتصاعدة، لذا يُطبّق التعلم العميق بفاعلية في العالم، حدث هذا إلى حد بعيد بدون وضع نظرية ضمنية شاملة، نظرية تعلم عميق تفسر سبب وآلية عمل الشبكات العميقة، وماهي حدودها، لربما أن إحداث ذلك من شأنه إفساح المجال أمام تطوير حتى المزيد من أساليب التعلم الجبّارة.

يوضح بوجيو: «على المدى البعيد، فإن القدرة على تطوير وبناء آلات ذكية أفضل سيكون أمرًا أساسيًا لأي اقتصاد قائم على التكنولوجيا». ويضيف: «أخيرًا، ورغم أن التعلم العميق يبقى منقوصًا بشدة في حلّته الحالية، فإنه يؤثر أو على وشك التأثير في كل جانب تقريبًا من مجتمعنا وحياتنا».

المصادر: 1