Abstract:
إسترجاع المعلومات إحدى المجالات المهمة في علوم الحاسوب و الذي إرتبط حديثا بمجال الأنترنت، و الذي يهتم بعمليات الفهرسة و البحث و إسترجاع المعلومات و المستندات التي يطلبها المستخدم، من أمثلة نظم إسترجاع المعلومات: محركات البحث ، المكتبات الألكترونية و أنظمة الرد الآلي على السؤال . نظم إسترجاع المعلومات تواجه مجموعة من التحديات في بعض اللغات خصوصا اللغة العربية لأنها لغة إشتقاقية . نظم إسترجاع المعلومات تفشل في التعرف على بعض الكلمات؛ إذا قام المستخدم بكتابة هذا الإستعلام " من هو المسلم " و لكن في المستندات الموجودة لا توجد كلمة "المسلم" بعينها و لكن توجد مسلمين، مسلمات، مسلمون، مسلم ، بما أن عملية البحث تكون بمطابقة الأنماط فكلمة "المسلم" تختلف عن (مسلمين ، مسلمات،...) و هكذا سيقوم النظام بإسترجاع كل المستندات التي يحتوي على كلمة "المسلم" إن وجدت أو لا توجد نتائج، بينما يتم فقد المستندات التي تحتوي على مسلمين، مسلمون، مسلم، مسلمات... و التي ينبغي إسترجاعها.
توسعة الإستعلام بزيادة الأنماط للكلمة الواحدة "من هو المسلم " بعد
التوسعة تصبح "من هو المسلم مسلم المسلمون مسلمون المسلمات
مسلمات..." لضمان إسترجاع كل الملفات ذات الصلة، عمل هذه المعالجات الآلية لتوسعة الإستعلام واحد من التحديات التي تواجه نظم إسترجاع المعلومات العربية.
علم قواعد الصرف في اللغة العربية علم يهتم بالكلمة و ما يترتب عليها من إعلال أو إبدال أو تغييير في أبنية الكلمة و هو العلم الذي يعطينا أنماط متعددة للكلمة الواحدة، مثال: قال على وزن "فعل" و منها قائل على وزن "فاعل".
هذه الدراسة تهدف لتوضيح كيف أن معالجة الإستعلام و توسعته يمثل تحدي يواجه نظم إسترجاع المعلومات العربية و اقترحت طريقة لتحسين الإسترجاع.
تكونت هذه الدراسة من جزئين: الجزء الأول بناء و برمجة الأنماط حيث تمت معالجة إثنين و ثلاثين نمطاً آلياً وهذه الأنماط هي: اسم الفاعل "فاعل" ، اسما الزمان و المكان "مفعل" ، أفعل التفضيل "افعل"، اسم المرة"فعلة"، اسم الهيئة "فعلة"، صيغ اسم الآلة (" مفعل" " مفعال " "مفعلة " "فعالة" " فعال" "فاعلة" " فاعول")، صيغ و أوزان الصفة المشبهة( " فعل" "فعلة" "افعل" "فعلاء" "فعلان" "فعيل" " فعيلة " "فعال" "فعالة" "فاعل" " فيعل " " فعول " " فعلون " " فعلى" "فاعلة") و صيغ المبالغة (" فعل" "مفعال" " فعال" " فعيل" "فعول") وكذلك بالإضافة إلى الإثنين و الثلاثين نمطاً تمت معالجة إضافة حروف التعريف للكلمة و حروف التعريف هي خمسة حروف(ال بال، كال، فال، وال) توجد في بداية الكلمة ، كما أن هنالك آلية لحذف حروف التعريف. إضافة للمعالجات تمت معالجة إضافة الحروف السابقة واللاحقة الي جذع الكلمة (Stemmer) العربية. الجزء الثاني من الدراسة هو بناء نظام رد آلي تفاعلي للقرآن الكريم
تطبيق و إختبار تلك المعالجات على النظام، تمت المقارنة بين النتائج قبل المعالجة الآلية للإستعلام(أي من غير معالجة) و بعد عملية المعالجة. بناءً على النتائج هذه الدراسة نجحت في إسترجاع المعلومات و التي هي الآية أو الآيات من القرآن الكريم ذات الصلة بسؤال المستخدم و في حين فشل النظام في استرجاعها من غير معالجات . وبالتالي الطريقة المقترحة قادت إلي تحسين الإسترجاع من حيث الدقة و العدد في النتائج.