Abstract:
مع تزايد الإهتمام بمعالجة اللغة العربية الطبيعية –أي تصميم برامج تجعل الحاسوب قادراً على فهم نصوصها المكتوبة والمنطوقة والتعامل معها- برزت الحاجة لأنظمة التشكيل الآلي كمكونات أساسية في أنظمة معالجة اللغة العربية كالترجمة الآلية وتوليد الكلام من النصوص المكتوبة والتلخيص الآلي وغيرها، وتخلو غالبية النصوص العربية المعاصرة من علامات التشكيل ولكي تتمكن أنظمة معالجة اللغة العربية من إتمام مهامها بصورة جيدة فهذا يقتضي أن تكون مدخلاتها من النصوص مُشَكَّلة بالكامل وبصورة صحيحة لأنها لاتستطيع لوحدها اكتشاف التشكيل الصحيح على العكس من الإنسان الذي يعتمد في النطق الصحيح للكلمات على ذخيرته اللغوية التي اكتسبها في سنين حياته بل تعتمد في ذلك على أنظمة التشكيل الآلي والتي تستخدم عدة خوارزميات لاختيار الكلمة ذات التشكيل الأنسب. ومع بداية ثمانينيات القرن الماضي ظهرت العديد من أنظمة التشكيل الآلي التي طورتها شركات عربية وعالمية كصخر، RDI وجوجل واستُخدِمَ بعضها كبنيةٍ تحتية لعددٍ من أنظمة معالجة اللغة العربية.
على الرغم من الدقه العالية لهذه الأنظمة فإنها تخطئ في تشكيل بعض الكلمات مما يستدعي وجود نظام مكمل لها لتصحيح هذه الأخطاء.
يساعد النظام المقترح في تشكيل الكلمات غير المُشَكَّلة أو التي شكلت بصورة خاطئة وهو بذلك يتميز على بقية الأنظمة والتي يتم فيها مراجعة وتصحيح أخطاء التشكيل فيها يدوياً.
ويعتمد النظام المقترح على تقنية ربط الجافا بقواعد البيانات وهو نظام مكمل لأنظمة التشكيل الآلي حيث تمثل مخرجاتها مدخلات له فيقوم بتحديد الكلمات التي يشتبه في أن تكون قد شُكِّلَت بصورة خاطئة –إعتمادا على قاعدة بياناته أو مايسمى بالذخيرة اللغوية- ويقدم للمستخدم عدة خيارات للتشكيل ليختار إحداها.
وقد أثبتت الإختبار ات التي أجريت على النظام قدرته على تقليل نسبة الخطأ في تشكيل الكلمات والتي تحصل عند استخدام الانظمة الموجودة بمفردها.