Abstract:
علم التنقيب فى البيانات هو العلم الذى يبحث فى عملية الكشف عن معلومات ذات فائدة فى قواعد البيانات الكبيرة او أى بيانات كثيرة محفوظة بإى شكل .و من أهم عمليات التنقيب طريقة تحليل العنقدة وهى طريقة تهدف الى تقسيم البيانات الى تجمعات من البيانات وايجاد معلومات لم تكن معروفة من قبل او لم يهتم بها الخبراء فى الحقل.والعنقده هى تقسيم البيانات الى مجموعة من الاصناف اعتمادا على اشتراكها بالخواص المتشابهة . وتم تطبيق هذا البحث على بيانات مرضى السرطان حيث يعتبر المرض من الأمراض المنتشرة فى السودان , اما عن هذه البيانات التى تم التحصل عليها فكانت بيانات جيدة ولكنها تحتوى على قيم مفقودة وبعض القيم الغير منظقية فعمل البحث على تنظيف هذه البيانات حتى يتم الحصول على نتائج منطقية ومفيدة وجديدة فكانت النتائج منطقية من حيث التقسيم الى مجموعات فكانت هنالك عدد من التجارب فى عملية التقسيم , حيث تم التقسيم الى عشرة عناقيد وتسعة وثمانية الى ان حصلنا على مجموعتين ولكن هذه التقسيمات لم تظهر نتائج جديدة.وخرج البحث بعدد من التوصيات يمكن ان تظهر معلومات جديدة فيمكن إضافة هذه البيانات بزيادتها او استخدام خوارزمية عنقدة غير خوارزمية الخطوتين(Tow-Steps).