Please use this identifier to cite or link to this item: https://repository.sustech.edu/handle/123456789/7399
Title: تصميم نظام لتجزئة الكلمة العربية المكتوبة بخط اليد باستخدام السمات الشكلية
Other Titles: Designing Arabic Handwritten Words Segmentation System Using Morphological Features
Authors: بشير ساتي, بدور علي
مشرف .- محمد الحافظ مصطفى
Keywords: السمات الشكلية
تجزئة الكلمة العربية المكتوبة بخط اليد
أنظمة التعرف على الكتابة
(Optical Character Recognition) (OCR)
Issue Date: Sep-2008
Publisher: جامعه السودان للعلوم والتكنولوجيا
Citation: بشير ساتي، بدور علي. تصميم نظام لتجزئة الكلمة العربية المكتوبة بخط اليد باستخدام السمات الشكلية/ بدور علي بشير ساتي؛ محمدالحافظ مصطفى.-الخرطوم:جامعة السودان للعلوم والتكنولوجيا،علوم الحاسوب،2008.-56ص:ايض؛28سم.-ماجستير.
Abstract: تعتمد أنظمة التعرف على الكتابة (Optical Character Recognition) (OCR) التي تستخدم الطريقة التحليلية (Analytical Approach) على تجزئة (Segmentation) الكلمة إلى حروف و من ثم تحاول التعرف على كل حرف بمفرده. و من أكثر الصعوبات التي تواجه أنظمة التعرف على الكتابة العربية هى التجزئة (Segmentation)، حيث تتميز الكتابة العربية باتصال حروفها (Cursive) بصورة معقدة و متعددة الاشكال. ومن هنا جاءت الحوجه إلى وجود جهود بحثية كبيرة للوصول لنظام تجزئة فعّال للغة العربية. هذه الدراسة تقدم نظام لتجزئة الكلمة العربية المكتوبة بخط اليد إلى مكوناتها الحرفية. يقوم نظام تجزئة الكلمات المقترح بتجزئة الكلمات التي يظهر اتصال حروفها بشكل أفقي وعمودي (Overlapped Characters) مثال الكلمات: "حسن" و "محمد" على الترتيب. ويعتمد نظام تجزئة الكلمات المقترح على استخدام السمات الشكلية (Morphological Features) للحرف العربي. ويعتبر هذا النظام جزء من نظام التعرف على الكلمات العربية المكتوبة بخط اليد باستخدام الطريقة الشمولية (Holistic Approach) بحيث يلجأ نظام التعرف إلى نظام تجزئة الكلمات المقترح في حالة عدم التعرف على الكلمة. مجموعة البيانات المستخدمة هي عبارة عن مجموعة بيانات جديدة للأسماء العربية المكتوبة بخط اليد وتسمى بمجموعة بيانات جامعة السودان للأسماء (SUST-ARG – names) Sudan University of Science and Technology - names-Arabic Recognition Group. وجُهزت مجموعة البيانات (SUST-ARG – names) من قِبل مجموعة التعرف على الأنماط البحثية بجامعة السودان للعلوم والتكنولوجيا. اُختبر نظام تجزئة الكلمات المقترح على 287 كلمة تشمل كلمات تحتوي على حروف متداخلة (Overlapped Characters) وغير متداخلة وتم التوصل إلى نسبة تجزئة عامه 67.64% و نسبة %64.41 خاصة للكلمات التي تحتوي على حروف متداخلة (Overlapped Characters). ولأن الكتابة كانت بشكل حر بدون أي قيود ظهرت مشكلتان في النظام المقترح تحتاجان لمواصلة البحث والتطوير وهما: التجزئة الزائدة (Over Segmentation) والتجزئة الناقصة (Under Segmentation).
Description: بحث
URI: http://repository.sustech.edu/handle/123456789/7399
Appears in Collections:Masters Dissertations : Computer Science and Information Technology

Files in This Item:
File Description SizeFormat 
تصميم نظام لتجزئة....pdfعنوان39.46 kBAdobe PDFView/Open
المستخلص.pdfمستخلص166.13 kBAdobe PDFView/Open
المراجع.pdfمراجع9.69 kBAdobe PDFView/Open
فواصل الأبواب.pdf
  Restricted Access
فواصل 71.04 kBAdobe PDFView/Open Request a copy
الباب الأول.pdf
  Restricted Access
باب110.26 kBAdobe PDFView/Open Request a copy
الباب الثاني.pdf
  Restricted Access
باب151.77 kBAdobe PDFView/Open Request a copy
الباب الثالث.pdf
  Restricted Access
باب148.54 kBAdobe PDFView/Open Request a copy
الباب الرابع.pdf
  Restricted Access
باب156.91 kBAdobe PDFView/Open Request a copy
الباب الخامس.pdf
  Restricted Access
باب236.89 kBAdobe PDFView/Open Request a copy
الباب السادس.pdf
  Restricted Access
باب159.14 kBAdobe PDFView/Open Request a copy
الباب السابع.pdf
  Restricted Access
باب83.47 kBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.