fso
nlp-oujda
ump
الرئيسية / ذخائر لغوية / ذخيرة نملار

ذخيرة نملار

تحميل

تقديم:

تم إنتاج النسخة الأولى لذخيرة نملار ضمن مشروع نملار. تمثل هذه الذخيرة مجموعة من النصوص العربية المعنونة التي تنتمي إلى 13 مجال موضوعاتي مختلف وتحتوي على حوالي 500000 كلمة.

قام فريق اللغة العربية التابع لجامعة محمد الأول بالمغرب بإثراء هذه المجموعة بإضافة الفرع إلى لائحة عناوين كلمات الذخيرة. كما قام بتصحيح بعض الأخطاء الواردة في الإصدار الأول.

تم إصدار هذه النسخة الجديدة بصيغة إكس-إم-إل (XML)، حيث أن جميع الكلمات مصحوبة بالمعلومات التالية:

  • الكلمة مشكولة شكلا تاما
  • فرع الكلمة
  • نوع الكلمة
  • اللواصق
  • جذر الكلمة
  • وزن الكلمة

لمزيد من التفاصيل المرجو الإطلاع على الأوراق التالية:

  • Boudchiche, M.; Mazroui, A.; 2015“Enrichment of the Nemlar corpus by the lemma tag”. Workshop Language Resources of Arabic NLP: Construction, Standardization, Management and Exploitation. Rabat, Morocco. November 26, 2015.

Leave a Reply

Your email address will not be published. Required fields are marked *

*

This site uses Akismet to reduce spam. Learn how your comment data is processed.