Top

"الدقة المختلطة".. النهج الذي يعمل على تُسّريع العمليات الحسابية

حاسوب «كاوست» العملاق «شاهين»

استخدمه علماء «كاوست» لنمذجة مجموعات البيانات الجغرافية المكانية الكبيرة والمعقدة وحقق دقة معيارية مع جزء صغير من وقت التشغيل الحسابي

من خلال نهج "الحسابات المختلطة الدقة" الذي استخدمه علماء جامعة الملك عبدالله للعلوم والتقنية (كاوست)، سيصبح بمقدورنا تحليل مجموعات كبيرة ومعقدة من البيانات الجغرافية المكانية في وقتٍ قياسي. ويواكب هذا النهج تصاعد أهمية البيانات الجغرافية المكانية في الانشطة الاحصائية. اذ تقول الامم المتحدة ان تلك البيانات أصبح لا غنى عنها لفهم موقع الامكنة التي يعيش ويعمل الناس فيها وسياقها، ولفهم الاشخاص المنوط بالحكومات خدمتهم وصلتهم بمجتمعاتهم، وهو ما يسمح بتحديد جذور المشاكل.

ومع ثورة البيانات وظهور التقنيات المبتكرة اليوم، تمكَّن فريق بحثي دولي تقوده «كاوست» من تسريع نمذجة مجموعات بيانات جغرافية مكانية كبيرة بشكل كبير، دون فقدان الدقة بشكل كليّ، وذلك من خلال تطبيق حسابات عالية الدقة فقط عندما تشتد إليها الحاجة. وتشير كلمة "الدقة" Precision الى المستوى التفصيلي في القياس، وترتبط بعملية موازنة جهاز القياس و تقويمه، مثل جهاز قياس كمية المطر، وأيضا في العمليات الحسابية. ففي بعض الحسابات اليدوية التي تختلف في درجة الدقة بعدد الأرقام العشرية، كلما ازداد عدد هذه الأرقام ارتفعت نسبة الدقة. وتكون الدقة مطلوبة في الكثير من الطرائق الإحصائية عند حساب القيمة الحرجة لمقارنتها مع القيمة الجدولية.

وسيسمح هذا النهج بتحليل مجموعات بيانات أكبر في وقت أقصر، الذي يتم تنفيذه على نظام حوسبة عالي الأداء يعتمد على وحدات معالجة الرسوميات المتوازية بشكل كبير (GPU).

وفي الوقت الذي تمتلك فيه أجهزة الكمبيوتر القدرة على إجراء عمليات حسابية كبيرة جداً وبسرعة ملحوظة، فإن النتيجة في بعض الأحيان قد تكون أقل دقة من الحسابات اليدوية بسبب محدودية الكيفية التي يتم بها تخزين الأرقام في الأنظمة الرقمية. كما تضم "أرقام الدقة القياسية أو الفردية" من 6 إلى 9 أرقام عشرية من الدقة؛ مما يعني أنه سيتم اقتطاع أية عملية حسابية ينتج عنها تسلسل أطول للأرقام، وبالتالي سيتم فقدان المعلومات.

في حين أن إمكانية استخدام "أرقام الدقة المزدوجة" ما زالت مطروحة، إلا أنها تُضاعِف من كثافة الذاكرة والعمليات الحسابية. أمّا عن استعمالها في مجموعات البيانات الجغرافية المكانية فسيكبّلها حجم مجموعات البيانات التي يمكن حسابها بدقة، حيث يمكن أن يؤدي تراكم مثل هذه الأخطاء في الدقة إلى نتائج نمذجة خاطئة.

وفي هذا الشأن؛ قام الدكتور سامح عبد الله رفقة زملائه في«كاوست»: الدكتور حاتم لطيف، والبروفيسور مارك جنتون، والدكتورة يينغ صن، والبروفيسور ديفيد كيز، بالتعاون مع باحثين من جامعة تينيسي، الواقعة في ناشفيل (UTK) في الولايات المتحدة الأمريكية، بتطوير حل لهذه المشكلة عن طريق نهج "الدقة المختلطة" حسب الحاجة. يذكر ان الاستخدام الشائع "للحسابات المختلطة الدقة" - أحد أشكال حساب الفاصلة العائمة الذي يستخدم أرقامًا ذات عروض مختلفة في عملية واحدة-، هو العمل على أرقام غير دقيقة بعرض صغير وتوسيعها لتمثيل أكبر وأكثر دقة.

يقول عبد الله: "لطالما اعتمدَت نمذجة البيانات البيئية على مدى عقود من الزمن على العمليات الحسابية ذات الدقة المزدوجة للتنبؤ بالبيانات المفقودة". ويردف قائلاً: "لكن اليوم، هناك أجهزة حوسبة ذات أداء عالي يمكنها إجراء عمليات حسابية تتميز بدقة أحادية نصفية مع تسريع يقدر بنحو 16 و32 مرة مقارنة بالحسابات ذات الدقة المزدوجة. ولتحقيق أقصى استفادة من ذلك، نطرح "إطاراً ثلاثي الدقة"، يمكنه استغلال عملية تسريع الدقة المنخفضة مع الحفاظ على الدقة باستخدام عمليات الحساب ذات الدقة المزدوجة للمعلومات الأساسية".

علاوةً على ذلك، استخدم الباحثون نظام وقت التشغيل لنظام "بارسيك" PaRSEC الذي طوّرته جامعة تينيسي (UTK)، والذي يسمح بالدقة عند الطلب، وتنسيق المهام وحركة البيانات عبر وحدات معالجة الرسوميات المتوازية المتعددة. وعن طريق هذا النظام استغل الباحثون العلاقات الإحصائية في البيانات لتقليل الدقة للمواقع المكانية ضعيفة الارتباط إلى دقة أحادية نصفية على أساس المسافة. ويرجع السبب في ذلك إلى أن "حسابات الدقة المزدوجة" يتم تطبيقها فقط على المواقع شديدة الارتباط والتي لها التأثير الأكبر على دقة النموذج.

يقول عبد الله: "إن الهدف الرئيسي من هذا المشروع يكمن في الاستفادة من خوارزميات الجبر الخطي المتوازي الحديثة التي طورها مركز أبحاث الحوسبة الفائقة في «كاوست» لتوسيع نطاق تطبيقات الإحصاء الجغرافي المكاني على البنى الموازية الرائدة."

ويكمل: "لقد أظهرنا أنه بمقدورنا تحقيق تسريع كبير مقارنة بالنمذجة الحسابية التي لديها دقة مزدوجة بشكل كامل مع الحفاظ على تقديرات المعلمات ودقة التنبؤ لتلبية متطلبات التطبيق".

ويوضح قائلاً: "تتمثل الخطوة التالية في دمج التقريبات مع الدقة المختلطة لتقليل أثر الذاكرة بشكل أكبر وتقصير وقت العملية الحسابية".