العودة إلى البيانات المفتوحة
معالجة اللغات واللغات
MA_Open_Datasets — LeMatin
نبذة
مقالات مأخوذة من جريدة Le Matin du Sahara et du Maghreb. مصنفة حسب الفئة: ثقافة، اقتصاد، عالم، وطن، أنشطة ملكية، مجتمع.
https://github.com/OumaimaHourrane/MA_Open_Datasets/tree/main/LeMatin
زيارة الموقعفي نفس الفئة
Goud-sum (HuggingFace) — Darija Summarization Dataset
158 ألف مقالة + عناوين من موقع Goud.ma — مجموعة بيانات تلخيص نصوص بالدارجة/العربية الفصحى
Darija Open Dataset (DODa)
أكثر من 100 ألف مدخل للترجمة من الدارجة إلى الإنجليزية — أكبر مجموعة بيانات مفتوحة المصدر للدارجة
MA_Open_Datasets — Goud.ma
مقالات Goud الإخبارية بصيغة CSV — توزيع بديل لبيانات Goud
MA_Open_Datasets — MoroccoWorldNews
مجموعة بيانات مقالات إخبارية من MoroccoWorldNews