Retour aux données ouvertes
Dépôts Communautaires
Moroccan-Darija-Datasets — nainiayoub
À Propos
Collection complète de datasets en Darija marocaine catégorisés par nom, source, région et taille. Contient 13 datasets couvrant divers aspects du NLP en Darija : analyse de sentiment, identification de dialecte, traduction, résumé automatique, reconnaissance vocale, NER, détection de contenu offensant et plus.
https://github.com/nainiayoub/moroccan-darija-datasets
Visiter le siteDans la même catégorie
MA_Open_Datasets — Moroccan NLP Corpora
Collection complète de datasets NLP marocains — 6 sous-datasets
Darija-NLP-Resources — MoroccoAI
Collection organisée de ressources et dépôts pour les tâches NLP en Darija
Darija-Dataset-Builder — IlyasFardaouix
Pipeline évolutif pour créer des datasets NLP en Darija marocaine pour l'entraînement de LLM
Offensive-Darija-Detection — a-ibrahimi
Dataset de détection de langage offensant en Darija marocaine — annoté manuellement