Retour aux données ouvertes
NLP & Langues

Darija-Dataset-Builder — IlyasFardaouix

À Propos

Pipeline évolutif pour construire des datasets NLP en Darija marocaine pour l'entraînement de grands modèles de langage. Fournit des outils et bibliothèques pour l'extraction, le traitement et l'organisation des données.

https://github.com/IlyasFardaouix/darija-dataset-builder
Visiter le site