Abstract:
عند تحليل البيانات الثنائية Binary data - وهي البيانات التي يأخذ فيها المتغير التابع Y إحدى القيمتين صفر أو واحد – فانه يفضل استخدام أسلوب تحليل الانحدار اللوجستي والذي من خلاله يمكن توفيق واختبار العلاقة بين المتغير التابع ومجموعة المتغيرات المستقلة لهذا النوع من البيانات.
ومع التطور الكبير في تقنية الحاسب الآلي، وظهور برامج التطبيقات الإحصائية المتخصصة في الآونة الأخيرة، أصبح هناك مدرستين لتقدير معلمات نماذج الانحدار هما المدرسة التقليدية ومدرسة بيز، استندت المدرسة الأولى على افتراض أن معلمات النموذج المراد تقديرها ثابتة، أما المدرسة الثانية فقد اعتمدت على افتراض أساسي مفادهُ أن المعلمات المراد تقديرها عبارة عن متغيرات عشوائية. وحيث تعتبر طريقة دالة الإمكان الأعظم، وطريقة بيز من أهم الطرق التي تستخدم عند تقدير معلمات نماذج الانحدار اللوجستي. فان المشكلة الحقيقية تنحصر في الحصول على طريقة مثلى لتوفيق واختبار العلاقة بين المتغير التابع ومجموعة المتغيرات المستقلة لهذا النوع من البيانات باستخدام الانحدار اللوجستي، ويكون من الضروري مقارنة طريقة دالة الإمكان الأعظم مع طريقة بيز.
لقد استهدف هذا البحث التركيز على معالجة ثلاث مشاكل. تتعلق الأولى بتوفيق نموذج الانحدار اللوجستي باستخدام المنهج التقليدي للعلاقة بين المتغير التابع النوعي ( الثنائي) والمتغيرات المستقلة التي قد تكون كمية ونوعية. وتتعلق الثانية بتوفيق نموذج الانحدار اللوجستي باستخدام المنهج الحديث بطريقة بيز. أما الثالثة فهي محل المناقشة في هذا البحث وتتعلق بالمقارنة بين طريقة دالة الإمكان الأعظم وطريقة بيز.
في هذا البحث تم الحصول على مجموعة من البيانات تتعلق بمحاولة التنبؤ بالرضا الوظيفي على أساس عدد من المتغيرات المستقلة، وقد تم توفيق نموذج باستخدام الانحدار اللوجستي بطريقة دالة الإمكان الأعظم، وأخر بطريقة بيز. وتم المقارنة بين النماذج المتحصل عليها، اعتمدت على تقدير معلمات النموذج واستخدام اختبارات جودة التوفيق والقدرة التنبؤية للنموذج بالاعتماد على احتمالية الخطأ أو ما يعرف بخطأ التقسيم Error Probabilities or Miss- Classification ومن خلال التنبؤ حسب احتمال الخطأ باستخدام نقطة قطع ثابتة Fixed Cut-off point هي (0.5) لتقدير احتمال وقوع إحدى المشاهدات في إحدى المجموعتين، ثم باستخدام نقطة القطع التي تعطي احتمال خطأ تقسيم أقل ما يمكن. أيضا تم استخدام ما يسمى بتحليل خاصية التشغيل النسبي Relative Operation Characteristic (ROC) لاختبار القدرة التنبؤية للنماذج على مدى جميع نقاط القطع، وهذه الطريقة تمكننا من مقارنة النماذج مباشرة.
ومن أبرز الاستنتاجات التي توصل إليها البحث ما يلي:
1- طريقة دالة الإمكان الأعظم تكون حالة خاصة من طريقة بيز عندما تكون معلوماتنا القبلية المتوفرة حول المعلمة قليلة جداً وأن معلوماتنا أساسا يكون مصدرها بيانات العينة.
2- الطريقة الوحيدة للحصول على فترة احتمالية للمعلمة محل الاهتمام هو النظر إلى المعلمة على أنها متغير عشوائي وبالتالي استخدام طريقة بيز.
3- على الرغم من عدم وجود فروق مهمة بين طريقة بيز وطريقة دالة الإمكان الأعظم، عندما يكون التوزيع القبلي المستخدم غير مُعلم، إلا أن طريقة بيز تسمح بتفسيرات احتمالية للمعلمات بينما طريقة دالة الإمكان الأعظم لا تسمح بذلك.
وأوصى البحث بما يلي:
1- استخدام نموذج الانحدار اللوجستي في تحليل البيانات ذات المتغير التابع ثنائي القيمة، حيث أنه لا يشترط أي افتراضات حول نوعية المتغيرات المفسرة. بالإضافة بتميزه بقدرة تفسيرية عالية.
2- النظر إلى معلمات النموذج على أنها متغيرات عشوائية وليست قيم ثابتة، وبالتالي استخدام طريقة بيز لتقدير هذه المعلمات.
3 - استخدام معاينة Gibbs في توفيق نماذج الانحدار اللوجستي بطريقة بيز لما لها من مزايا عن طرق التقدير الأخرى