Top

معالجة البيانات الضخمة

يدعم حاسوب شاهين ٢ الخارق في جامعة الملك عبدالله للعلوم والتقنية (كاوست) مفهوم التعاون عبر توفير تطبيقات حوسبة عالية الأداء واستشارة ودعماً استراتيجيين.

غالباً ما تتسم مجموعات البيانات، التي تحوي قراءات بيئية ومناخية كدرجة الحرارة وسرعات الرياح ورطوبة التربة، بالضخامة نظراً للوضوح المكاني المرتفع للبيانات. وتزداد كلفة تحليل مجموعات البيانات هذه بحدة مع زيادة حجمها: فعلى سبيل المثال، زيادة حجم مجموعة البيانات بعشرة أضعاف ترفع كلفة الحوسبة بمقدار ألف ضعف، ومتطلبات الذاكرة بمقدار مئة ضعف، مما يؤدي إلى إجهاد حسابي على البرمجيات الإحصائية القياسية.

وقد شجع هذا الباحث سامح عبدالله، زميل ما بعد الدكتوراه في كاوست  على تطوير إطار برمجيات قائم بذاته من خلال تعاون بين مركز أبحاث الحوسبة الفائقة من جهة، وإحصائيين متخصصين في الديناميكيات المكانية الزمنية والبيئة من جهة اخرى. 

يعالج الإطار الجديد الذي يدعى (Exascale GeoStatistics) أو (ExaGeoStat) البيانات الجغرافية المكانية البيئية والمناخية الضخمة باستخدام هياكل حوسبة فائقة الأداء، بدقة عالية لا توفرها البرمجيات الإحصائية المستخدمة عالمياً.

ويقول عبدالله: "أطر البرمجيات الإحصائية الحالية غير قادرة على الاستفادة من مجموعات البيانات الضخمة فائدة تامة. وعلى سبيل المثال، فالعملية الحسابية التي يستغرق إجراؤها عادة دقيقة واحدة تحتاج إلى 17 ساعة تقريباً إذا كانت مجموعة البيانات أكبر بعشر مرات فقط. ويؤدي هذا إلى تسويات بسبب محدودية الطاقة الحسابية، مما يضطر الباحثين للجوء إلى طرائق التقريب التي تضعف من دقة تفسيرهم للنتائج".

ويؤمن استخدام برمجيات الجبر الخطي (ExaGeoStat)، التي طورها مركز أبحاث الحوسبة الفائقة، إطار عمل لحساب وظيفة الإمكان الأعظم لمجموعات البيانات المناخية والبيئية الجغرافية المكانية الضخمة. ويتنبأ هذا الإطار أيضاً بالبيانات المجهولة أو المفقودة فضلاً عن تخفيض أثر أخطاء القياسات الفردية، مما يتيح تحليل البيانات وعرضها بسهولة في نموذج إحصائي مستخدم لإجراء التوقعات.

وتمكن الباحثون من تطبيق (ExaGeoStat) بنجاح على مجموعة بيانات واقعية ضخمة لقياسات رطوبة التربة في حوض الميسيسبي في الولايات المتحدة الأمريكية. ومن شأن هذا أن يوفر التحليل الروتيني لمجموعات البيانات الأضخم للمختصين بالإحصاءات الجغرافية المكانية، وأن يستخدم في مجموعة واسعة من التطبيقات كالتنبؤ بالأحوال الجوية وتوقع إنتاج المحاصيل وأنظمة الإنذار المبكر بحدوث الفيضانات أو حالات الجفاف.

ويخطط ديفيد كيز، مدير مركز أبحاث الحوسبة الفائقة الذي يستضيف المشروع، لمزيد من التحسينات الهامة، متابعاً تقنية سريعة التطور في الجبر الخطي: "نعمل حالياً على تطوير (ExaGeoStat) من الجانب الجبري، وذلك عن طريق طرح نوع جديد من التقريب يدعى التقريب الهرمي منخفض المرتبة الذي يخفض متطلبات الذاكرة والعمليات عن طريق التسامح بأخطاء صغيرة يمكن فهمها والتحكم بها بسهولة."

لقراءة الموضوع على موقعنا باللغة الإنجليزية، الرجاء الضغط هنا