SMIASMIA
اتصل بنا
العودة إلى البيانات المفتوحة
معالجة اللغات واللغات

DVoice — Moroccan Darija ASR Dataset

نبذة

DVoice مجموعة بيانات مفتوحة المصدر للتعرف التلقائي على الكلام (ASR) بالدارجة المغربية. تحتوي على تسجيلات صوتية مع نصوص مكتوبة مقابلة. 2392 ملف تدريب و600 ملف اختبار. أصدرتها AIOXLABS، Zenodo 2021.

https://github.com/AIOXLABS/DVoice
زيارة الموقع

في نفس الفئة

Goud-sum (HuggingFace) — Darija Summarization Dataset

158 ألف مقالة + عناوين من موقع Goud.ma — مجموعة بيانات تلخيص نصوص بالدارجة/العربية الفصحى

Darija Open Dataset (DODa)

أكثر من 100 ألف مدخل للترجمة من الدارجة إلى الإنجليزية — أكبر مجموعة بيانات مفتوحة المصدر للدارجة

MA_Open_Datasets — Goud.ma

مقالات Goud الإخبارية بصيغة CSV — توزيع بديل لبيانات Goud

MA_Open_Datasets — LeMatin

مقالات جريدة Le Matin مصنفة حسب الفئة — وطن، اقتصاد، ثقافة، رياضة

SMIA

الجمعية المغربية للذكاء الاصطناعي

سميا هي المنظمة المغربية الرائدة غير الربحية المكرسة لتطوير أبحاث الذكاء الاصطناعي، وتعليم الذكاء الاصطناعي، والابتكار، والعلوم المفتوحة، والتعاون بين الباحثين والجامعات والشركات والشركات الناشئة والمؤسسات العامة في جميع أنحاء النظام البيئي المغربي للذكاء الاصطناعي.

مبادرة من XAI TECH

smia@xai.ma

روابط سريعة

  • الرئيسية
  • من نحن
  • الفعاليات
  • AI Cities
  • الفروع
  • AI Diaspora
  • المدونة
  • اتصل بنا

الموارد

  • البيانات المفتوحة
  • رادار الذكاء الاصطناعي
  • خارطة طريق الذكاء الاصطناعي
  • حالة الذكاء الاصطناعي
  • الإرشاد
  • باحثو الذكاء الاصطناعي المغاربة
  • العضوية

قانوني

  • الإشعار القانوني
  • سياسة الخصوصية

© 2026 SMIA. جميع الحقوق محفوظة.