fso
nlp-oujda
ump
Home / ذخائر لغوية / ذخيرة نملار
تحميل

تقديم:

تم إنتاج النسخة الأولى لذخيرة نملار ضمن مشروع نملار. تمثل هذه الذخيرة مجموعة من النصوص العربية المعنونة التي تنتمي إلى 13 مجال موضوعاتي مختلف وتحتوي على حوالي 500000 كلمة.

قام فريق اللغة العربية التابع لجامعة محمد الأول بالمغرب بإثراء هذه المجموعة بإضافة الفرع إلى لائحة عناوين كلمات الذخيرة. كما قام بتصحيح بعض الأخطاء الواردة في الإصدار الأول.

تم إصدار هذه النسخة الجديدة بصيغة إكس-إم-إل (XML)، حيث أن جميع الكلمات مصحوبة بالمعلومات التالية:

  • الكلمة مشكولة شكلا تاما
  • فرع الكلمة
  • نوع الكلمة
  • اللواصق
  • جذر الكلمة
  • وزن الكلمة

لمزيد من التفاصيل المرجو الإطلاع على الأوراق التالية:

  • Boudchiche, M.; Mazroui, A.; 2015“Enrichment of the Nemlar corpus by the lemma tag”. Workshop Language Resources of Arabic NLP: Construction, Standardization, Management and Exploitation. Rabat, Morocco. November 26, 2015.

Leave a Reply

Your email address will not be published. Required fields are marked *

*

ăn dặm kiểu NhậtResponsive WordPress Themenhà cấp 4 nông thônthời trang trẻ emgiày cao gótshop giày nữdownload wordpress pluginsmẫu biệt thự đẹpepichouseáo sơ mi nữhouse beautiful