SMIASMIA
اتصل بنا
العودة إلى البيانات المفتوحة
معالجة اللغات واللغات

OMCD — Offensive Moroccan Comments Dataset

نبذة

OMCD: 8024 تعليق على يوتيوب بالدارجة المغربية، موسومة يدوياً للكشف عن اللغة المسيئة. نُشر 2023 في Springer Language Resources & Evaluation. مفيد لأنظمة مراقبة المحتوى بالدارجة.

https://github.com/kabilessefar/OMCD-Offensive-Moroccan-Comments-Dataset
زيارة الموقع

في نفس الفئة

Goud-sum (HuggingFace) — Darija Summarization Dataset

158 ألف مقالة + عناوين من موقع Goud.ma — مجموعة بيانات تلخيص نصوص بالدارجة/العربية الفصحى

Darija Open Dataset (DODa)

أكثر من 100 ألف مدخل للترجمة من الدارجة إلى الإنجليزية — أكبر مجموعة بيانات مفتوحة المصدر للدارجة

MA_Open_Datasets — Goud.ma

مقالات Goud الإخبارية بصيغة CSV — توزيع بديل لبيانات Goud

MA_Open_Datasets — LeMatin

مقالات جريدة Le Matin مصنفة حسب الفئة — وطن، اقتصاد، ثقافة، رياضة

SMIA

الجمعية المغربية للذكاء الاصطناعي

سميا هي المنظمة المغربية الرائدة غير الربحية المكرسة لتطوير أبحاث الذكاء الاصطناعي، وتعليم الذكاء الاصطناعي، والابتكار، والعلوم المفتوحة، والتعاون بين الباحثين والجامعات والشركات والشركات الناشئة والمؤسسات العامة في جميع أنحاء النظام البيئي المغربي للذكاء الاصطناعي.

مبادرة من XAI TECH

smia@xai.ma

روابط سريعة

  • الرئيسية
  • من نحن
  • الفعاليات
  • AI Cities
  • الفروع
  • AI Diaspora
  • المدونة
  • اتصل بنا

الموارد

  • البيانات المفتوحة
  • رادار الذكاء الاصطناعي
  • خارطة طريق الذكاء الاصطناعي
  • حالة الذكاء الاصطناعي
  • الإرشاد
  • باحثو الذكاء الاصطناعي المغاربة
  • العضوية

قانوني

  • الإشعار القانوني
  • سياسة الخصوصية

© 2026 SMIA. جميع الحقوق محفوظة.