' ' لم أجد أي كلمة تشير إلى جانب محدد في النص. ' ' no aspect-specific words detected.' '
' 'نموذج CAMeLBERT-mix تدرّب على ٩٥ ألف شكوى عربية حقيقية، معظمها من تطبيقات التوصيل السعودية. مخصّص للّهجة السعودية والخليجية. على مجموعة اختبار مستقلّة من ١٣٬٩٨٦ مراجعة، دقّة الـensemble الكامل (٤ نماذج) ٩٥٫٠٥٪ بفاصل ثقة ٩٥٪ بين ٩٤٫٧٠٪ و ٩٥٫٤١٪. النموذج المنشور هنا هو أفضل نموذج فردي من هذا الـensemble، وكل الفئات الثماني فوق ٨٠٪ F1.
نموذج عربي تدرّب على ٩٥ ألف شكوى حقيقية من تطبيقات التوصيل السعودية، يصنّف أي شكوى إلى واحدة من ٨ فئات.
اكتب شكواك بالعربية، وستظهر أعلى ثلاث فئات مع نسبة الثقة لكل واحدة.
النموذج يتعامل مع الفئات الكبيرة والصغيرة بنفس الجودة. هذه القياسات على مجموعة اختبار مستقلّة، لم تُستخدم أثناء التدريب.
أعلى فئة (جودة الطعام) ٩٦٫٢٪، أدنى فئة (عامة) ٨٤٫٩٪. الفارق ١١٫٣ نقطة فقط.
رحلتنا من TF-IDF إلى BERT، ثم إلى ensemble من ٤ نماذج. وحذفنا فئة "الجو والمكان" بعد تدقيق كشف أن ٩٩٪ من تصنيفاتها كانت خاطئة.