Retour aux données ouvertes
NLP & Langues

OMCD — Offensive Moroccan Comments Dataset

À Propos

OMCD (Offensive Moroccan Comments Dataset) : 8024 commentaires YouTube en dialecte marocain (Darija), annotés manuellement pour la détection de langage offensant. Publié en 2023 dans Springer Language Resources & Evaluation. Utile pour les systèmes de modération de contenu en Darija.

https://github.com/kabilessefar/OMCD-Offensive-Moroccan-Comments-Dataset
Visiter le site