العودة إلى البيانات المفتوحة
معالجة اللغات واللغات

IADD — Integrated Arabic Dialect Identification Dataset

نبذة

مجموعة بيانات IADD المتكاملة لتحديد اللهجات العربية: 135,804 نص من تويتر وفيسبوك والنصوص المنقولة يدويًا وتعليقات الصحافة. تغطي المغاربية (منها المغرب) والشامية والمصرية والخليجية. نُشرت 2022 في Data in Brief.

https://github.com/JihadZa/IADD
زيارة الموقع