أداة ذكاء اصطناعي تثير القلق بإنتاجها وجوهًا بشرية من صور مشوّشة تمامًا

تعلمت شبكات الذكاء الاصطناعي حِيلةً جَديدة: القدرة على إنشاء وجوه واقعية من الصور المشوشة من خلال بعض النقاط من هذه الصور، وإضافة ميزات مثل الرموش والتجاعيد التي لا يمكن العثور عليها في الأصل.

قبل أن تهلع، يجدر الإشارة إلى أن هذه الأداة ليست نوعًا مريبًا من الأدوات التي تعكس الصور المشوشة، لأن الوجوه التي تنتجها الأداة هي وجوه اصطناعية – وليست وجوه أشخاص حقيقيين. لكنها خطوة تكنولوجية رائعة إلى الأمام مما تمكنت هذه الشبكات من القيام به سابقًا.

يمكن لنظام PULSE (photo upsampling via latent space exploration) إنتاج صور بدقة تصل إلى 64 مرة أكثر من الصور الأصلية، وهو أكثر تفصيلًا 8 مرات من الأنظمة السابقة.

تقول عالمة الكومبيوتر سينثيا رودين من جامعة ديوك: “لم يتم أبدًا إنشاء صور فائقة الدقة بهذا القدر من التفاصيل من قبل”.

pixel move

ما يقوم به نظام PULSE هو عملٌ عكسي، مما يؤدي إلى إنشاء صور عالية الدقة للوجوه التي وكأنها غير واضحة عند تشويشها، بدلًا من البدء بالصورة غير الواضحة ومحاولة إضافة التفصيل عليها للعثور على تطابق. يمكن تحويل شبكة من 16×16 بكسل إلى صورة 1024×1024 بكسل في ثوانٍ، مع إضافة أكثر من مليون بيكسل.

يستخدم النظام شبكة الخصومة التوليدية GAN، والتي تضع بشكل أساسي شبكتين عصبيتين (محركات تعلم الذكاء الاصطناعي المعقدة المصممة لمحاكاة الدماغ البشري) في مواجهة بعضها بعضًا، ثم تدريب كلاهما على نفس المجموعة من الصور. واحد منها يُولِّد الوجوه والآخر يقرر ما إذا كان الوجه واقعيًا بما فيه الكفاية.

ومن خلال اتخاذه هذه الوِجهة، يتمكن الباحثون من الحصول على صور لا تحمل تشويشًا أو مناطق غير واضحة التي تظهر أحيانًا في المنتج النهائي عندم استخدام تقنيات أخرى.

يعود جُزء من نجاح هذا النظام إلى الطريقة التي يبحث بها عن أي صورة سيتم تصغيرها إلى الصورة الأصلية، بدلًا من محاولة العثور على الصورة الحقيقية التي تناسب المصدر. يختبر بسرعة مجموعة كاملة من الخيارات –يعمل من خلال المساحة الكامنة في اسمه- حتى يجد تطابقًا.

يستمر GAN في النمو ليزداد تعقيدًا: قد تتذكر أن عملاق التكنولوجيا Nvidia قد عرض شبكة خصومة مولِّدة قادرة على إنتاج صورة واقعية مُريبة لأشخاصٍ غير موجودين بالفعل.

في هذه الحالة، يتم إنشاء الصور عن طريق خلط الوجوه الموجودة ف شيءٍ جديد. في نظام PULSE الذي أظهره الباحثون هُنا، يتم استخدام كتل الصورة المشوشة كمصدر بدلًا من ذلك.

يمكن إنتاج عدة وجوه من نفس الصورة المصدر، ويمكن تطبيق نفس الفكرة لإنشاء صور لأي شيء خارج من صورة ممتلئة، كما يقول الباحثون – القطط، وغروب الشمس، والأشجار، والبالونات وأي شيءٍ آخر.

هذا الجانب يمكن أن يجعله مناسبًا للاستخدام في جميع أنواع المجالات الأخرى، بما في ذلك الطب والفحص المجهري والفلك وصور الأقمار الصناعية.

يمكنك العثور على المزيد من التفاصيل على موقع PULSE، وحتى تجربتها على صورك الخاصة.

تم تقديم البحث في مؤتمر 2020 حول رؤية الكمبيوتر والتعرف على الأنماط (CVPR)، وورقة البحث متاحة على خادم موقع arXiv.org للطباعة.

المصادر: 1