التعريب: محاربة التبسيط المفرط والبيانات المتناثرة
2025-09-21
يتناول هذا المقال مشكلة شائعة في معايرة النماذج: الانحدار المتساوي القياس، نظرًا لأن مجموعة بيانات المعايرة أصغر بكثير من مجموعة البيانات التدريبية الأصلية، مما يبسط توزيع الاحتمالات بشكل مفرط، مما يؤدي إلى فقدان التمييزات الدقيقة للنموذج. يحلل المقال هذه الظاهرة، وهي "التسطيح الناجم عن ندرة البيانات"، ويقترح عدة طرق تشخيصية للتمييز بين التبسيط المبرر بسبب الضوضاء والتبسيط المفرط بسبب قيود البيانات. وأخيرًا، يقدم حزمة Calibre، والتي من خلال تخفيف القيود المتساوية القياس أو استخدام نماذج أحادية اللون سلسة، تحافظ على دقة المعايرة مع الحفاظ على أكبر قدر ممكن من قدرة التمييز للنموذج الأصلي.