fso
nlp-oujda
ump
Home / برامج / توسيمات معيارية للّغة العربية

تقديم:

لم تحظ عملية تحديد الوسم المناسب لكلمات الجمل العربية آليا بالقدر الكافي من الدراسة. وترجع صعوبة العملية في المقام الأول إلى غياب علامات التّشكيل في معظم النصوص العربية المعاصرة، بالإضافة إلى كون تمييز الفرق بين المشتقات العربية عملية معقدة. ونتيجة لذلك، تحتمل الكلمة الواحدة أكثر من معنى حسب السّياق، ممّا يتطلب إنجاز برامج معقدة واعتماد موارد لغوية مهمة قصد تحديد الوسم الصحيح.
تهدف هذه الدّراسة إلى تصميم مستويات هرمية وتفصيلية للتوسيمات العربية مُوضحة العلاقة التي تجمع فيما بينها، حيث تيسر هذه المستويات الهرمية إضافة وسوم جديدة عند الحاجة بغية تحصيل نتائج أكثر دقة. ولقد اعتمدنا في هذا المشروع على دراسة مقارنة ومراجع مهمة في قواعد اللغة العربية، وتمّ تدقيق نتائج الدّراسة من قبل خبراء في المجال اللّغوي. كما تمت تجربة التوسيمات المقترحة في عملية تجزيئ الكلام وتقييم فاعليتها عبر تجارب مختلفة. ونطمح أن تشكل هذه الدراسة مساهمة في مجال تجزيئ الكلام تتمثل في اقتراح توسيمات معيارية وغنية للغة العربية.

تحميل التوسيمات في ملف XML

لمزيد من التفاصيل المرجو الإطلاع على الأوراق التالية :

Imad Zeroual, Abdelhak Lakhouaja, and Rachid Belahbib “Towards a standard part of speech tagset for the Arabic language”, Journal of King Saud University – Computer and Information Sciences, 2017, (DOI) 10.1016/j.jksuci.2017.01.006.

الأشكال المبيانية الهرمية لتوسيمات كل من الاسم و الفعل والحرف :

Nouns

Verb

Particle

Leave a Reply

Your email address will not be published. Required fields are marked *

*

ăn dặm kiểu NhậtResponsive WordPress Themenhà cấp 4 nông thônthời trang trẻ emgiày cao gótshop giày nữdownload wordpress pluginsmẫu biệt thự đẹpepichouseáo sơ mi nữhouse beautiful