Top

كيف تمكن باحثو «كاوست» من تحويل "لعنة الأبعاد" إلى نعمة

"أصبح بالإماكن تحقيق تحسُّن واضح في التنبؤ بالمسارات المستقبلية، من خلال دمج معلومات التبعية".

أبتكر الباحثون مخططا للتغلب على مشكلة الأبعاد للقياسات المستمرة، بهدف الوصول إلى تنبؤات مستقبلية أكثر دقة

هل سبق لك أن كنت في منتصف سرد قصة لشخص ما أو كنت تحاول جاهدا شرح موضوع معقد، وفجأة ينظر إليك الشخص الآخر ويسأل: "ما الهدف؟" يمكننا هنا ان نرى أن هذا الشخص ربما يكون مشغولا، ويريد فقط اجابة سريعة ودقيقة. وهذا هو جوهر مفهوم تقليل أو تقليص الأبعاد عند مواجهة الكثير من البيانات، من أجل الوصول الى الهدف أو المعلومة الدقيقة.

في عالم البيانات الضخمة اليوم ، يشير مصطلح "لعنة الابعاد" الى مجموعة من المشكلات التي تنشأ عند التعامل مع البيانات عالية الأبعاد(أي تلك التي تحتوي على عدد كبير من السمات أو الملاحظات). والصعوبات التي تأتي مع البيانات عالية الأبعاد عادة ما تظهر أثناء تحليل البيانات أو تصورها لتحديد الأنماط، وأيضا تظهر أثناء تدريب نماذج التعلم الآلي، التحليل العددي، أخذ العينات، التوافقية، استخراج البيانات وقواعد البيانات. ولقد صاغ هذا المصطلح عالم الرياضيات التطبيقي الأمريكي ريتشارد بيلمان (1984-1920) لوصف المشكلة الناجمة عن الزيادة الأسية في الحجم المرتبط بدوره بإضافة "أبعاد إضافية" إلى الفضاء الرياضي.

التنبؤات الموثوقة

يعد التنبؤ لما سيحدث غداً من مشكلات وما يستجد من مخاطر ومهددات، ركنا أساسيا من أركان التخطيط السليم للمستقبل، وفي هذا الاتجاه طوَّر فريق بحثي بقيادة جامعة الملك عبد الله للعلوم والتقنية (كاوست) مخططًا للتنبؤ، يمكن أن يتنبأ بالمسار المستقبلي للمَعلمات البيئية (خاصية متغيرة وقابلة للقياس تعتبر قيمتها عاملاً محددًا لخصائص نظام بيئي) بشكل أكثر موثوقية. ساعدهم على ذلك مسح البيانات السابقة لكل من التطابقات الجزئية والكاملة مع الاستعانة بالملاحظات الحالية.

وتعد عملية جمع البيانات على فترات منتظمة بمرور الوقت أمراً شائعاً في عديد من المجالات، ولكنها واسعة الانتشار بشكل خاص في مجالات: البيئة والنقل والبحوث البيولوجية؛ إذ تنبع أهمية هذه البيانات من استخدامها لمراقبة الحالة الراهنة وتسجيلها، وكذلك للمساعدة في التنبؤ بما قد يأتي في المستقبل.

لا مطابقات كاملة

تتمثل الطريقة الحالية لاستخدام هذه البيانات في البحث عن الأنماط أو المسارات السابقة في البيانات التي تتطابق مع المسار الحالي. ولكن، بشكل عملي، لا توجد أي مطابقات كاملة على الإطلاق، وبالتالي يتعين على المتنبئ العثور على إطارات زمنية أصغر فأصغر في البيانات السابقة التي توفر تطابقاً جزئياً. وهو ما ينتج عنه فقدان السياق، وفقدان أي اتجاهات أكثر اتساعاً كانت لتعطي تنبؤاً أفضل، اضافة الى احتمالية استقطاب ضجيج أو تشوش عشوائي.

يقول البروفيسور هيرناندو أومباو، أستاذ الرياضيات التطبيقية والعلوم الحاسوبية بجامعة الملك عبد الله للعلوم والتقنية (كاوست): "إن التنبؤ بمسارات السلاسل الزمنية المستقبلية هو التحدي بعينه، نظرًا لأن المسارات تتكون من العديد من الملاحظات المتسلسلة أو "الأبعاد"؛ مما يقلل من نجاح مناهج التنبؤ متعدد المتغيرات، وتُعرف هذه المشكلة بـ (لعنة الأبعاد) ".

التغلب على المشكلة

في سبيل التغلب على هذا التحدي، طوَّر الدكتور شيوهاو جياو ،باحث ما بعد الدكتوراة في «كاوست»، طريقة تسمى التنبؤ الوظيفي الجزئي (PFP)، تقوم على دمج المعلومات من جميع المسارات السابقة الكاملة والجزئية. يستخدم هذا النهج المُحسَّن جميع البيانات المتاحة، حيث يلتقط كلاً من الاتجاهات طويلة المدى والمسارات الجزئية المتطابقة جيدا.

يوضح جياو: "من خلال تسوية المسارات، يمكننا تحويل (لعنة الأبعاد) إلى نعمة عن طريق التقاط الصورة الكبيرة للمعلومات الديناميكية للمسارات". ويردف قائلًا: "تتضمن طريقتنا نهجًا لم تحققه الطرق السابقة، حيث يقوم بدمج كلاً من معلومات الاعتماد عبر وداخل المسارات".

علاوةً على ذلك، يتضمن النهج إجراءً يتم بشكل تدريجي حيث يتم تحليل البيانات أولاً لمسارات كاملة أطول، ومن ثَمّ يتم استخراج المكونات الجزئية "المتبقية"، واعتبارها أجزاءً مستقلة عن الاتجاهات السابقة، وأي شيء متبقي يتم تركه للضجيج العشوائي. وبعدها يتم تطبيق الخطوات الثلاثة على نافذة التنبؤ.

تعاون فريق البحث، مع البروفيسور ألكسندر أوي، من جامعة كاليفورنيا، حيث تم تطبيق طريقتهم في التنبؤ بالجسيمات الدقيقة في الهواء وتدفق حركة المرور، وبيّنوا أن طريقة التنبؤ الوظيفي الجزئي (PFP) أعطت تنبؤات أكثر دقة بكثير من الطرق الحالية، خاصةً على التبؤات طويلة المدى. يقول أومباو: "تشير طريقتنا إلى إمكانية تحقيق تحسُّن واضح في التنبؤ بالمسارات المستقبلية، من خلال دمج معلومات التبعية داخل وعبر المسارات".