تقرير رقم (93) لشهر نوفمبر 2022 : “اختبار القدرات: إلزام بما قد لا يكون له لزوم”

للاطلاع على التقرير وتحميله إضغط هنا

نوفمبر – 2022

 


اختبار القدرات: إلزام بما قد لا يكون له لزوم

(14/11/ 2022 م)

 

  • تمهيد:

يعرض هذا التقرير لقضية مهمة تمَّ طرحها للحوار في ملتقى أسبار خلال شهر نوفمبر 2022م، وناقشها نُخبة متميزة من مفكري المملكة في مختلف المجالات، والذين أثروا الحوار بآرائهم البنَّاءة ومقترحاتهم الهادفة؛ حيث تناولت: اختبار القدرات: إلزام بما قد لا يكون له لزوم، وأعد ورقتها الرئيسة د. ابراهيم الدوسري، وعقب عليها كلاً من د. إقبال درندري، د. عبدالله الدوغان، وأدار الحوار حولها د. فوزية البكر.


المحتويات

  • تمهيد
  • فهرس المحتويات
  • الملخص التنفيذي.
  • الورقة الرئيسة: د. ابراهيم الدوسري
  • التعقيبات:
  • التعقيب الأول: د. إقبال درندري (ضيف الملتقى)[1]
  • التعقيب الثاني: د. عبدالله الدوغان (ضيف الملتقى)[2]
  • إدارة الحوار: د. فوزية البكر
  • المداخلات حول القضية
  • فلسفة وتاريخ نشأة اختبار القدرات.
  • مدى جدوى اختبار القدرات: (الإيجابيات – السلبيات).
  • دور “الصدق المضاف، incremental validity” في الحكم على مدى أهمية أداة الاختيار ”selection”.
  • آليات تحسين القبول والتطوير المستقبلي لمعاييره المتبعة.
  • إعادة صياغة نظام التقييم العلمي لطلاب الثانوية مع نظام المراقبة الدَّقيق.
  • التوصيات
  • المصادر والمراجع
  • المشاركون

 الملخص التنفيذي.

تناولت هذه القضية اختبار القدرات، وأشار د. ابراهيم الدوسري في الورقة الرئيسة إلى أهم المسوغات التي يراها أكثر من كافية لعدم الاستمرار في استخدام الاختبار والاعتماد بدلاً من ذلك على الاختبار التحصيلي. وركزت هذه المسوغات على أبرز أدلة الصدق التي تعد أساسية من حيث الوفاء بغرض الاختبار استخداماً وتفسيراً مقارنةً بالاختبار التحصيلي باعتبار الأداتين تستخدمان معاً في قرارات القبول.

بينما تمحور التعقيب الأول من جانب د. إقبال درندري حول التوجهات الحديثة للصدق وربطها بالانتقادات التي شملتها الورقة الرئيسة، وخلصت إلى أن مسألة الحاجة لاختبارات القبول المقننة ومدى عدالتها أصبحت من القضايا التي تناقش عالميا، حيث استجابت بعض الجامعات لهذا النقد وخففت منها. وتحتاج اختبارات القبول في التعليم العالي (التحصيلي والقدرات) لدراسة شاملة لمدى عدالتها للطلبة من المستويات الاجتماعية والاقتصادية المختلفة، ومن المدارس ذات المستويات البيئية المختلفة، ودراسة الصدق التعليمي والترتبي لكل منهما، ومدى دقتها في التنبؤ بنجاح الطلبة من ذوي القدرات المختلفة، والفاعلية والقيمة المضافة لكل منها وكفاءة الإنفاق لكل منهما، وعلى الأخص اختبار القدرات.

في حين ذهب د. عبدالله الدوغان في التعقيب الثاني إلى أن الاختبار التحصيلي – كما تشير إليه معظم الدراسات المحلية والعالمية – أفضل من اختبار القدرات، وأن الاختبار التحصيلي الذي يتضمن قياس مستويات عقلية عليا كالاستدلال والتحليل والتقويم أجدى في قياس ما يحتاج إليه الطالب في دراسته الجامعية، وأن اختبار القدرات – من الناحية النظرية على الأقل – يقيس مهارات عقلية مهمة يحتاجها الطالب الجامعي أيضاً؛ لكنه في الواقع الحالي يحتاج إلى إعادة نظر من حيث أسسه العلمية وبنائه المنطقي. واستخدامه مع الاختبار التحصيلي ودرجات الثانوية بوضعه الحالي قليل الفائدة.

وتضمنت المداخلات حول القضية المحاور التالية:

  • فلسفة وتاريخ نشأة اختبار القدرات.
  • مدى جدوى اختبار القدرات: (الإيجابيات – السلبيات).
  • دور “الصدق المضاف، incremental validity” في الحكم على مدى أهمية أداة الاختيار ”selection”.
  • آليات تحسين القبول والتطوير المستقبلي لمعاييره المتبعة.
  • إعادة صياغة نظام التقييم العلمي لطلاب الثانوية مع نظام المراقبة الدَّقيق.

ومن أبرز التوصيات التي انتهى إليها المتحاورون في ملتقى أسبار حول القضية ما يلي:

  • تطوير مرصد تعليمي تحت مظلة هيئة تقويم التعليم يضم كافة المؤشرات ذات العلاقة ويتكامل مع المراصد الحضرية والإحصاء وتطور فيه المؤشرات في سياق المتعارف عليه دولياً في بناء المراصد العلمية بدلاً من التشتت واختلاف المعايير.
  • تطوير اختبارات لقياس قدرات الطلاب وتوجهاتهم وتحديد ميولهم (أو استخدام ما هو متوفر لدينا من النسخ المقننة مثل بيركمان ومايرز برجز) لمساعدتهم على الاختيار التخصص المناسب (أكاديمي أو تقني مهني).
  • المحافظة على الاختبارين، حيث إن اختبار القدرات يقيس جوانب غير اختبار التحصيلي.
  • وجود دراسات تتبعية لنفس الطالب لقياس العلاقة بين درجاته ومعدلاته في الثانوي ومعدل تخرجه من الجامعة وقياس إنتاجيته الوظيفية.
  • التوسع في الترغيب في العمل المهني والتقني على المستوى الاجتماعي والأكاديمي بطريقة تجعل الطالب صاحب هذه القدرات يُقبل وهو يشعر بالقوة والثقة لا أنه أقل من غيره.

 

  • الورقة الرئيسة: د. ابراهيم الدوسري

توطئة:

في العرض التالي نقدم مجموعة من أهم المسوغات التي نراها أكثر من كافية لعدم الاستمرار في استخدام الاختبار والاعتماد بدلاً من ذلك على الاختبار التحصيلي. وتركز هذه المسوغات على أبرز أدلة الصدق التي تعد أساسية من حيث الوفاء بغرض الاختبار استخداماً وتفسيراً مقارنةً بالاختبار التحصيلي باعتبار الأداتين تستخدمان معاً في قرارات القبول. ونمهد في البداية بإعطاء نبذة تاريخية عن نشأة الاختبار، بعدها نستعرض في فقرات هذه المسوغات مبتدئين بموضوع الصدق التنبؤي أو مقدرة الاختبار على التنبؤ بالنجاح الأكاديمي، لننتقل بعدها إلى اعتبارات مهمة للصدق في إطار السياق التعليمي تتجاوز الناحية الإحصائية إلى ما هو أكثر أهمية من حيث المضامين والتداعيات المترتبة على اختيار أداة ما للقبول، وعلى الأخص مدى فائدة الأداة في توفير تغذية راجعة مهمة للمعنيين بالعملية التعليمية، وإسهامها في إحداث تأثيرات إيجابية مباشرة وغير مباشرة على التعليم، وقدرتها في التقليل من التداعيات السلبية المصاحبة لاستخدامها، إضافة إلى دورها من حيث تكافؤ الفرص تحقيقاً للعدالة والمساواة. وهناك جوانب فنية أخرى لها تأثير مباشر على هذه الاعتبارات تتصل بالخصائص الفنية للأداة (صدق المحتوى، content validity، وتركيبة البنية الداخلية للاختبار، وأخطاء القياس الثبات وغيرها من أمور فنية) وهي مهمة جداً في تفسير النتائج واستخدامها؛ لكن المجال يضيق عن التطرق إليها. وسيُكتفى بإيرادها مروراً في إطار نقاشنا لما نعتبره من أبرز أدلة الصدق المضاميني، consequential validity للاختبار. وتجدر الإشارة هنا أن هذه المسوغات قد عُرِّضت بالتفصيل ضمن مراجعة شاملة قمنا بها للاختبار بناءً على تكليف مركز قياس وصدر تقريرها ضمن جزأين تضمنا الكثير من التفصيلات التي يمكن الرجوع إليها فيما يخص بعض ما ورد في هذا العرض من مسائل (مركز قياس، 2019).

نبذة تاريخية:

كان الباعث قبل ما يزيد عن 30 عاماً لاقتراح فكرة إدخال اختبار استعداد لأغراض القبول مستنداً إلى فكرة أن استخدام اختبار الثانوية (الذي كان مركزياً) لا يوفر معلومات عن قدرات واستعدادات يُنظر حينها إلى أنها كانت مهمة للنجاح الأكاديمي، وأن اختبار الثانوية وحده غير كافٍ للتعرف على هذه القدرات والاستعدادات، إلى جانب ما يتضمنه هذا الاختبار من أخطاء في القياس تجعل الاعتماد عليه وحده في القبول أمراً غير كافٍ، علاوة على ذلك كانت الجامعات تعاني من نقص شديد في الإمكانات أمام تدفق الأعداد الكبيرة من خريجي الثانوية التي استمرت تزداد عاماً بعد عام، مما أبرز الحاجة إلى وجود أداة تُعزز من سلامة قرارات القبول. وقد بذلت “وزارة المعارف” من خلال اللجنة العليا لسياسة التعليم جهوداً مكثفة لإدخال هذا الاختبار انتهت بعد مواصلتها من قبل مجلس التعليم العالي إلى إقرار بناء اختبار للقدرات في عام 1422هـ وإنشاء مركز متخصص لهذا الغرض تحديداً وللتقويم في التعليم العالي بوجه عام. وقد ظل الاختبار لسنوات قصيرة يوفر معلومات جيدة من حيث هو أداة للتنبؤ بالنجاح الأكاديمي عندما يستخدم معاً ودرجات الثانوية العامة؛ لكن الظروف تغيرت ولم يتغير الاختبار ولا أساليب استخدامه، وتمثلت هذه الظروف في بناء المركز لاختبار آخر جديد هو الاختبار التحصيلي كي يُستخدم جنباً إلى جنب مع اختبار القدرات ودرجات الثانوية العامة، وظهور تداعيات سلبية في الميدان نتيجة لهذا الاختبار (القدرات). ومع أنه مقبول أن يكون لدينا ثلاث أدوات أو معايير للقبول طالما أنها ستزيد في مستوى الدقة والصدق في قرارات القبول، إلا أنه اتضح بعد مرور سنوات من التطبيق أن اختبار القدرات لا يقدم معلومات إضافية أو يزيد في دقة قرارات القبول أو صدقها أكثر مما يمكن الحصول عليه من الاختبار التحصيلي. وبمعنى آخر، لسنا في حاجة إلى أكثر من أداتين – درجات الثانوية العامة + درجات الاختبار التحصيلي- للوصول إلى قرارات سليمة في القبول، وأن اختبار القدرات الذي كان مطلباً في مرحلة ما من مراحل تطور التعليم أصبح بما يحمله من تبعات تعليمية واجتماعية عبئاً، حان الوقت من سنوات بعيدة للتخلص منه. وقد استمررنا نقدم هذا الاختبار إلى جانب الاختبار التحصيلي دون أخذ في الاعتبار لما استجد من نتائج العديد من الأبحاث والدراسات في هذا النوع من الاختبارات أو التحولات التي حدثت في محتواها تجاوباً مع هذه النتائج ومع الانتقادات التي وجهت إليها.

الصدق التنبؤي:

يعتبر دليل الصدق التنبؤي، أي مقدرة الاختبار على التنبؤ بالأداء المستقبلي (النجاح الأكاديمي في حالة اختبار القدرات) أهم الأدلة الإحصائية جميعاً للحكم على مدى وفاء الأداة بغرضها الأساس (التنبؤ). ويُقيَّم الصدق التنبؤي للاختبار من خلال تقدير قيمة معامل ارتباطه بمحك الأداء (النجاح الأكاديمي؛ المعدل التراكمي للسنة الأولى الجامعية غالباً) ومعرفة ما إن كان ذلك يفي بالغرض منه. ولمَّا كان الإجراء المتبع حالياً في القبول يعتمد على ثلاثة معايير (درجات الثانوية العامة، والاختبار التحصيلي، واختبار القدرات)، فإن الحكم على الصدق التنبؤي يتطلب تقييم أثرها على قيمة معامل ارتباط متعدد مع محك الأداء مجتمعة معاً ومنفردة مع درجات الثانوية. ومن الناحية الإحصائية، وكقاعدة عامة[3]، يتم في نماذج التنبؤ غالباً، استبعاد المتغيرات (المستقلة) ذات الارتباط القوي فيما بينها لكون استخدامها معاً لا يسهم في زيادة قيمة معامل الارتباط المتعدد، ويُبقى في هذه الحالة على المتغير(ات) الأقوى علاقة بالمحك أو على الأصح الأكثر تفسيراً للتباين الملاحظ[4] فيه مأخوذاً في الحسبان أدلة أخرى للصدق تتجاوز دليل التنبؤ؛ مثل كفاية الأساس النظري للسمات المقاسة، كلفة أو صعوبة جمع البيانات أو بناء الأداة، إمكانية الاستفادة من النتائج في أغراض أخرى، التداعيات المترتبة على النتائج، وغير ذلك من أدلة الصدق الأخرى. ونركز باختصار شديد هنا على تقييم مقارن للعلاقة بين كل من الاختبارين (القدرات والتحصيلي) وبين المعدل التراكمي عندما يُستخدم أحدهما أو كلاهما – إلى جانب درجات الثانوية- للتنبؤ. هذا ونود التنويه إلى أننا لن نتناول موضوع الصدق التنبؤي لدرجات الثانوية بالنجاح الأكاديمي[5] على افتراض أن هذه الدرجات تشكل معياراً أساسياً للقبول وليس وارداً ألا يكون ضمن الشروط.

وقبل تناول هذا التقييم من المهم الإشارة إلى أن العلاقة القوية دائماً بين اختبارات الاستعداد المبنية على التحصيل وبين المبنية على القدرات تعني أن النوعين من الاختبارات يقيسان عاملاً أو عوامل مشتركة فيما بينها، مما ينتج عنه ضعف إسهامهما عندما يستخدما معاً –وعلى الأخص إلى جانب نسبة الثانوية- في التنبؤ بالنجاح الأكاديمي. أي أن أحدهما يجعل الآخر مكرراً ويمكن الاستغناء عنه دون أن تتأثر قيمة الصدق التنبؤي. ففي هذا الجانب، تشير عدة دراسات حول العلاقة بين اختبارات التحصيل بوجه عام وبين اختبارات الاستعدادات أو القدرات العامة ((Naglieri & Bornstein (2003); Strand, Smith, & Fernandes (2006); Mackintosh (1998); Lynn and Meisenberg (2010); Kaufman et al. (2012); Thorndike & Hagen (1977); Cronbach (1977); Ebel (1975)) إلى اتجاه عام حول هذه العلاقة تُبينه معاملات ارتباط مرتفعة فيما بين هذه القياسات تراوحت ما بين 0.5 و0.9. ومع أنه لا يوجد سوى دراسات قليلة فيما يخص اختبار القدرات، مقتصر أغلبها على العلاقة بينه وبين الاختبار التحصيلي؛ إلا أنها تأتي متسقة ومتقاربة مع هذا الاتجاه. ففي دراسة Dimitrov & Al-Harbi (2014) بلغت قيمة الارتباط بين الاختبارين 0.668. وفي دراسة للقاطعي والحربي (2013) بلغ معامل الارتباط 0.73 (معدلاً لانحصار المدى، range restriction). وقد أوردت دراسة Dimitrov (2013) معامل ارتباط بين درجات الاختبارين لطلبة التخصص العلمي الثانوي قيمته، 0.652 (و0.779 لطلبة التخصص النظري الثانوي). وفي تقرير إحصائي قدمه المركز في ورشة حول المؤشرات التعليمية (الهيئة الوطنية لتقويم التعليم والتدريب، 16 ربيع الأول 1440) أورد معامل ارتباط بين الاختبارين بلغت قيمته 0.81. وهذه القيمة ربما تكون الأقرب للمتوقع[7]، وبخاصة أنها تشمل كامل مجتمع المفحوصين وليس عينة، إضافة إلى كونها غير متأثرة بانحصار المدى الموجود دائماً في دراسات التنبؤ بالمعدل التراكمي من اختبارات القبول.

ويتضح من هذه النتائج أن ارتفاع قيم معامل الارتباط ستجعل قيمة صدق التنبؤ بالمعدل التراكمي باستخدام أي من الاختبارين وحده (إلى جانب استخدام الثانوية العامة) متقاربة إلى الحد الذي يمكن الاستغناء فيه عن أحدهما دون تأثير يذكر على هذه القيمة.

ففي دراسة أجريت على اختبار SAT واختبارات SAT في التحصيل الدراسي بجامعة كاليفورنيا، Geiser & Studley (2002)[8] وُجد أن استخدام اختبار SAT لا يقدم تنبؤاً أفضل بالمعدل التراكمي من الاختبارات التحصيلية، كما أن ما يضيفه إلى قيمة التنبؤ يساوي صفراً أو قريباً من الصفر (مما أدى بناءً على هذه النتيجة إلى استبعاد اختبار SAT من شروط القبول بالجامعة، كما دفع بمؤسسة College Board القائمة على اختبار SAT لتغيير محتواه ليعتمد على قياس التحصيل بدلاً من القدرات العامة). وفي دراسة قام بها كل من Bridgman, Burton, and Cline (2004)  وجد أنه باستخدام أي من الاختبارين، SAT I  أو SAT II، فإن “التأثير المتوقع على الكلية أو الجامعة سيكون محدوداً؛ بمعنى أنه سيتم اختيار90% من الطلاب بأحد هذين الاختبارين، وأنه يمكن اعتبار الطلاب ناجحين بناءً على أي من الاختيارين”. ويرى أن السبب وراء هذا التداخل بين النوعين من الاختبارات “يعود إلى كون التمييز بين اختبارات التحصيل وبين اختبارات الاستدلال (القدرات) متخيلاً أكثر من واقعي”.

وبالنسبة لاختبار القدرات، يوجد عدد محدود من الدراسات غير المنشورة. فقد أجرى المركز دراسة عام 1428هـ عن الصدق التنبؤي للاختبار أوردت معاملات ارتباط بين المعدل التراكمي ودرجات كل من اختبار القدرات والاختبار التحصيلي ودرجات الثانوية للأعوام الدراسية الثلاثة 1424/1425 و1425/1426 و1426/1427 في الكليات الصحية بلغت متوسطاتها مع المعدل التراكمي للسنة الأولى خلال الثلاثة أعوام. 413،. 555 و.467، للقدرات والتحصيلي والثانوية العامة على التوالي. ويتضح من الدراسة أن اختبار القدرات يعطي قيمة معامل ارتباط مع المعدل التراكمي أقل من درجات الثانوية[9] والاختبار التحصيلي.

وفي دراسة للقاطعي والحربي (2013) على بيانات عينتين من طلاب الثانوية العامة في 9 جامعات (قديمة وحديثة نشأة) للعام الدراسي 1429/1430، التخصص العلمي، كانت النتائج بالنسبة للعينة الثانية (الجامعات القديمة) من حيث الارتباط الخام (والمصحح) لاختبار القدرات مع المعدل التراكمي في السنة الأولى (0.53) 0.41 و(0.55) 0.50 بالنسبة للاختبار التحصيلي. (كما كان بالنسبة للاثنين معاً بدون درجات الثانوية العامة (0.58) 0.52. ويتضح هنا ضآلة ما يضيفه اختبار قدرات على التنبؤ بالمعدل التراكمي عند استخدامه مع الاختبار التحصيلي وحتى من دون وجود درجات الثانوية. وباستخدام المعايير الثلاثة معاً (القدرات + التحصيلي + الثانوية العامة) كان معامل الارتباط مع المعدل التراكمي، (مصححاً) والخام 0.57 (0.68).  وعند حذف اختبار القدرات والإبقاء على الاختبار التحصيلي ودرجات الثانوية العامة، بلغت هذه القيمة (0.67) 0.56. أي أن الزيادة المتأتية من وجود اختبار القدرات في معادلة التنبؤ كانت 0.01، وهي قيمة تعد ضئيلة جداً، حيث لا تُفسِّر سوى نسبة 1.35% من التباين في المعدل التراكمي. ويرى الباحثان أن تفوق الاختبار التحصيلي ونسبة الثانوية مقارنة باختبار قدرات ليس مستغرباً “حيث إن المعدل التراكمي يعكس مدى التحصيل العلمي في الجامعة. لذا فالسمة المقاسة بالمعدل التراكمي وتلك المقاسة بالاختبار التحصيلي واختبارات الثانوية العامة متماثلة، وهذا انعكس على مستوى العلاقة بين هذه المتغيرات، كما أن ما يعكسه المعدل التراكمي قد لا يركز كثيراً على القدرات التي يقيسها اختبار القدرات العامة” (الحربي والقاطعي، 2103).

وفي دراسة أجراها Alnahdi (2015) على عينة مكونة من 27420  طالباً من جامعة الأمير سطام للمقارنة بين معايير القبول (نسبة الثانوية العامة، الاختبار التحصيلي، واختبار القدرات) من حيث مستوى الصدق التنبؤي بالمعدل التراكمي للفصل الأول ولعدة فصول، وُجِد أن استخدام اختبار القدرات إضافة إلى معياري القبول الآخرين (درجات الثانوية العامة والاختبار التحصيلي) لا ينتج عنه زيادة في نسبة تفسير تباين المعدل التراكمي للفصل الأول، أي أن النسبة تساوي صفراً (=0)، بينما لا تبعد كثيراً عن الصفر (0.2%) بالنسبة للمعدل التراكمي لعدة فصول. وتتفق نتائج هذه الدراسة مع دراسة القاطعي والحربي (2013)، ومع نتائج الدراسة التي ذكرناها بالنسبة لاختبار SAT.

وأجرى Dimitov & Al Harbi (2014) دراسة مقارنة لاختبار القدرات والاختبار التحصيلي في نتائج عينة (N=184) من أداء طلاب كلية علمية في مواد معينة: حاسب ومعلومات، رياضيات، وفيزياء مقارنةً بأداء عينة (N=8664) واسعة من الطلاب في هذه المقررات بعدد من كليات العلوم. وقد وجدا أن معدل معامل الارتباط مع المعدل التراكمي (خلال 12 فصلاً دراسياً) 0.236 بالنسبة لاختبار القدرات و0.251 بالنسبة للاختبار التحصيلي، ولهما معاً 0.379. وعند وضع كل من الأقسام في نموذج الانحدار المتعدد لم يُظهِر أي من الأقسام (اللفظي أو الكمي) قوة تنبؤية دالة (statistically significant predictive power)، حيث جاء كل منها بأوزان انحدار قريبة من الصفر تقريباً، بل إن وزن الجزء اللفظي أتى بالسالب.

وأجرى Tsaousis (2017) من المركز دراسة على النسخة الخاصة بالتخصص النظري للاختبار لعينة مكونة من 750 طالبة. وقد وُجِد أن معامل الارتباط بين التحصيلي والقدرات في حدود 0.68. وبإضافة الثلاثة معايير إلى معادلة التنبؤ لم يلاحظ أن درجات اختبار القدرات ليس لها أية وزن ذي قيمة تنبؤية دالة إحصائياً.

وقبل نهاية هذا العرض عن نتائج المقارنة لعلاقة اختبار القدرات والاختبار التحصيلي مع المعدل التراكمي وما يمكن أن يضيفه الأول على قيمة الصدق التنبؤي، ينبغي التنويه أن دراسات أخرى قد أجريت على الاختبار لتقصي مستوى الأداء مأخوذاً في الاعتبار بعض المتغيرات[10]، لكن المجال لا يتسع لعرض نتائجها. فإضافة إلى الدراسة التي أجراها Dimitov & Al Harbi (2014)، أجرت درندري (2012) دراسة عن العلاقة بين كل من معدل السنة التحضيرية والمعدل التراكمي للسنة الجامعية الأولى وبين كل من نسبة الثانوية العامة، اختبار القدرات، والاختبار التحصيلي. كما تقصى القاطعي (2012) تأثير توزيع الدرجات التي تُعطى في عدد من مقررات التخصصات العلمية بجامعة الملك سعود على الصدق التنبؤي للمعايير الثلاثة (نسبة الثانوية العامة، التحصيلي، والقدرات)، حسب نوعية التوزيع للدرجات في هذه المقررات (اعتيادية أو ملتوية). وفي نفس الدراسة تم حساب معامل الارتباط بين المعدل التراكمي وبين الدرجة الموزونة (وهي الناتجة عن الأوزان التي تعطيها الجامعة لمعايير القبول (30% نسبة الثانوية + 30% القدرات + 40% تحصيلي). ولم نلحظ أن الدراسة أتت بنتائج تختلف كثيراً عما سبقت الإشارة إليه من دراسات بشأن الصدق التنبؤي للاختبار.

ونستخلص من هذا العدد، وإن كان محدوداً، من الدراسات، أن اختبار القدرات، وإن عُدَّ أداةً مناسبة للتنبؤ منفردة أو عند استخدامها مع درجات الثانوية العامة، لن يضيف قيمةً تُذكر إلى الصدق التنبؤي مع وجود الاختبار التحصيلي. ويقدم Glaser (1992) رأياً حول هذه النتيجة:

“من الخطأ الاعتقاد أن قياسات خارج السياق (المجال) للقدرات العامة ستكون أكثر فعالية في التنبؤ بالنجاح الأكاديمي. ’إن أهم استعداد لغالبية ما يُتَعلم لاحقاً يكمن في المعارف والمهارات ذات الصلة مباشرة بالمجال الذي سوف يحدث فيه التعلم. وعليه فإن قياس التحصيل السابق، مثل المقررات التي تدرس قبل الالتحاق بالكلية ستكون أفضل المتنبئات بدرجات المقررات في بيئة أكاديمية مماثلة (في الكلية)، وبخاصة عندما يكون التعلم الراهن معتمداً بقدر كبير على التعلم السابق. وعليه فإن الاختبارات التحصيلية تؤدي هذه الوظيفة بنفس القدر. وبقدر ما تمثل قياسات الإنجاز الجوانب المفصلية في الخبرات التي سوف تقابل لاحقاً في المجال، بقدر ما تحيط على نحو أفضل بالاستعداد اللازم لذلك المجال.”

وينسجم هذا النص مع ما تؤكده الأبحاث والدراسات بأن أفضل طريقة لتقييم مهارات الاستدلال في مجالات معينة، أكاديمية مثلاً، هي من خلال القياسات التي يكون محتواها مبنياً على المعرفة “خاصة المجال، domain specific knowledge”. وفحوى هذا أن الاختبارات التحصيلية المقننة متى كان مجالها مبنياً على مناهج الثانوية سوف تقدم تنبؤاً أفضل مما تقدمه اختبارات لقياس مهارات استدلالية عامة (domain general knowledge) أو حتى غامضة الماهية[11][12] كما هو الشأن في اختبار القدرات.

والخلاصة أنه ووفقاً للتقييم من منطلق الصدق التنبؤي الذي تعد أدلته أهم معيار للحكم على مدى صلاحية الأداة التي غرضها الاختيار (selection)، يمكن القول إن اختبار القدرات في ضوء التطبيق القائم له ردفاً مع الاختبار التحصيلي يكاد يكون معدوم القيمة لا من حيث القوة التنبؤية مقارنة بالاختبار التحصيلي، ولا من حيث ما يضيفه إلى الصدق التنبؤي عند استخدام الاختبارين معاً ودرجات الثانوية. وعليه فإننا نرى من ناحية إحصائية بحتة عدم وجود أي مبرر للاستمرار في تطبيق اختبار القدرات وجعله إلى جانب الاختبار التحصيلي ودرجات الثانوية العامة شرطاً للقبول. فوق ذلك، ومن ناحية عملية، فإن ما تقوم به أغلب، إن لم يكن كل، الجامعات من استخدام لما يسمى “الدرجة الموزونة” والتي لا يعتمد اختيارها على أوزان مثالية (optimal weights) للمتغيرات وفق معادلات للتنبؤ محسوبة من بيانات فعلية سيعني إضعاف أهمية كل من هذه الاختبارات في تعزيز الصدق التنبؤي بالاستناد إلى أسس غير موضوعية.

الدور المنشود لاختبارات القبول في التحسين من العملية التعليمية:

حيث أوضحت المراجعة السابقة لأدلة الصدق التنبؤي والذي يعد الأهم بالنسبة لأدوات القياس التي غرضها الاختيار، selection، أن الاختبار التحصيلي يتفوق وإن بقيم ليست كبيرة على اختبار القدرات، يأتي السؤال التالي عن أهمية مردود كل من الاختبارين من حيث المعلومات التي تتوفر من خلال نتائجهما للعملية التعليمية. وفي الأساس، تدور الإجابة عن السؤال حول مدى صلة محتوى كل اختبار بالقرارات التي ستُبنى على النتائج في ضوء هذا المحتوى. وهنا ربما يحسن التوقف قليلاً للتعرف على طبيعة هذا المحتوى بالنسبة لكل من الاختبارين.

من ناحية عامة، يركز اختبار القدرات على قياس مهارات استدلال عامة (لفظية وكمية) ليست مرتبطة بالضرورة بصف دراسي أو مادة دراسية معينة، بينما يركز الاختبار التحصيلي على قياس التحصيل في عدد من المواد الدراسية التي تُقدَّم في نهاية المرحلة الثانوية. ويكمن الاختلاف بين الاختبارين في طريقة اختيار المهام (البنود) الموجودة لمحتوى كل منهما. ففي اختبار القدرات يُبذَل جهد كبير لبناء مهام اختبارية لا يكون الأداء عليها معتمداً قدر الإمكان على الإتقان لمنهج مادة دراسية معينة، والحصول في النهاية على اختبار ضعيف الصلة قدر الإمكان بالاختبارات التي تقيس التحصيل. في المقابل، يجري التركيز في الاختبار التحصيلي على اختيار تلك البنود التي تعكس ما تم للطالب تعلمه ضمن مناهج مواد دراسية معينة. ويُنظر في الغالب إلى الاختلاف فيما يقيسه الاختباران أنه اختلاف في مستوى التركيز ضمن متصل طرفيه التحصيل والقدرات، أو بالأحرى مدى خصوصية المحتوى من حيث الصلة بالمعارف والمهارات التي يفترض أنه تم تحصيلها في مادة دراسية معينة خلال فترة زمنية محددة، أو عموميته بافتراض أن هذه المعارف والمهارات تمت تنميتها تراكمياً عبر سنوات من الخبرة وتعلم العديد من المواد الدراسية؛ لكن هذا الاختلاف يحمل الكثير من المضامين المهمة بالنسبة لنوعية المعلومات المتأتية من هذا الاختبارات من زاوية مدى إفادتها في خدمة القرارات التعليمية. فبالنسبة لاختبار القدرات وباعتباره يقوم على قياس مهارات استدلالية عامة ليست مستندة بالضرورة على منهج مادة دراسية معينة، من الطبيعي ألا تقدم نتائج الاختبار معلومات محددة أو بالأحرى تفصيلية بخصوص منهج هذه المادة، أو أية مادة أخرى ربما تساعد في تكييف منهجها أو تعديل طرق تدريسها وتقديمها. ومع أنه لا يمكن التقليل بأية حال من أهمية المهارات الاستدلالية العامة في التعلم اللاحق- وهو ما أوضحته نتائج دراسات الصدق التنبؤي، وكان الأصل في الأساس لجعل اختبار القدرات أحد شروط القبول، إلا أن الإشكالية تنشأ من محدودية قيمة المعلومات التي يوفرها في قرارات تعليمية أخرى تتجاوز قرارات القبول ولا تقل عنه أهمية. وقد كانت هذه الإشكالية هي الدافع الأساس في تحول اختبار SAT -وهو الاختبار الذي اعتمدت نسخته القديمة (1995) لتكون النموذج لمحتوى اختبار القدرات- ليكون تقويماً للتحصيل بدلاً من التقويم لمهارات استدلالية عامة. فحول هذه النسخة والتغييرات الطفيفة التي أُدخلت عليها قبل أن يتحول محتوى الاختبار ليكون تحصيلياً، سيقت انتقادات عدة، نجد أنها وهي تنطبق على اختبار القدرات تؤكد في الوقت نفسه أهمية الاختبارات التحصيلية المقننة. وتركز أغلب هذه الانتقادات في نقص القيمة التشخيصية والتقييمية للاختبار سواء من حيث المعلومات التي يوفرها للطالب أو للمعلم أو للمدرسة أو للمنهج، إذ ليس واضحاً كيف من النتائج يمكن تكييف المناهج أو أساليب التدريس والتعلم في المدارس أو الكليات بحيث تُنمي تعلم مهارات وقدرات غير مضمنة بنودها في المناهج أو في نشاطات التدريس. وباعتبار الاختبار يقيس قدرات كامنة و/أو نامية قد يترسخ الشعور لدى الطالب بأنه ما مِن جدٍّ أو اجتهاد في التعلم أو التحصيل -خلاف التمرن على الاختبار- سيكون له تأثير على تحسين درجاته. إضافة إلى انتقادات أخرى لا يتسع المجال لإيرادها.

وبالمقارنة فإن اختباراً مقنناً للقبول جيد التصميم ينبني محتواه على ما يُقدَّم من مناهج في المرحلة الثانوية وينسجم مع ما يُسعى إلى بلوغه من أهداف سيوفر الكثير من المعلومات ذات الأهمية للتحسين من العملية التعليمية. وحالياً تتوجه الجهود في تصميم اختباري SAT وACT وهما الأكثر استخداماً في القبول نحو التركيز على تقييم التحصيل في مناهج المرحلة الثانوية، سعياً إلى أن تساعد المعلومات المتأتية من نتائج هذه الاختبارات في:

  • توجيه النشاطات والجهود التي تُبذَل في هذه المرحلة نحو التركيز على الأهداف والنواتج الأكثر أهمية.
  • القيام بدور فاعل ومؤثر في قيادة العملية التدريسية والتعليمية وتوجيهها نحو المهم والأبرز في هذه المرحلة. وهو دور يعد من أبرز الأدوار في وظيفة التقويم.
  • توفير دافعية قوية لتحفيز الطالب نحو بذل المزيد من الجد والاجتهاد والتركيز على ما تقدمه المدرسة من مناهج باعتبار ذلك الوسيلة الأجدى والأسلم لتعزيز فرص في القبول.
  • توفير معلومات للقائمين على العملية التعليمية والمهتمين بها ذات صلة مباشرة بما يمكن القيام به من جهود لتعزيز فرص التعلم، سواء على مستوى الجامعات أو التعليم العام؛ من معلمين ومشرفين وطلاب وأولياء أمور.
  • توفير معلومات تقويمية يمكن أن تتكامل مع الجهود التي تقوم بها الوزارة والهيئة الوطنية لتقويم التعليم والتدريب في مجال التقييمات الوطنية والدولية لرصد مستوى التقدم والإنجاز التعليمي.

وإذ يؤكد هذا العرض المختصر، القناعة بأفضلية الاختبارات التحصيلية المقننة على اختبارات القدرات العامة من حيث المردود التعليمي، وتحسن الإشارة إلى أن الأخيرة يمكن –وبسهولة- أن تُصمَّم لتقيس مختلف المستويات المعرفية من المعارف والمهارات والقدرات (بما في ذلك مهارات التفكير العليا) على نحو لا يقل دقةً وصدقاً عما يمكن أن يقاس من خلال الأولى.

تقليل آثار التداعيات السلبية:

لا تخلو الاختبارات، وبخاصة تلك التي يترتب على نتائجها قرارات حاسمة من تداعيات غير مقصودة تتبدى في ممارسات أو مضامين ترتبط بالاستخدام والتفسير. ففي جانب الممارسات تكفي الإشارة إلى ما يُنفذ على مستوى المدارس ومكاتب التعليم بهدف مساعدة الطلبة في رفع درجاتهم على اختبارات القبول، تجاوباً مع رغبة الوزارة في تقليص “الفجوة” بين نتائج هذه الاختبارات ونسبة الثانوية العامة. ومع أن هذه النشاطات والفعاليات، متى أحسن توجيهها بحيث تؤدي في النهاية إلى تحسين للعملية التعليمية في مجملها، وليس الاقتصار فقط على التحسين من الدرجات، ستكون مهمة بل ومطلوبة من أجل استثمار ما قد توفره نتائج الاختبارات من معلومات مهمة، إلا أن الخشية قائمة بشأن ما قد تحمله هذه النشاطات والفعاليات من آثار قد لا تكون إيجابية. فمن جهة يُخشى أن تتركز الجهود على تنمية مهارات أخذ الاختبارات بدلاً من تنمية مهارات التعلم التي يؤكد عليها المنهج، أو أن يأخذ المحتوى المحدد فقط في الاختبار أولوية في ممارسات التدريس. ومن جهة أخرى، هناك الكثير من الجهد والكلفة والوقت الذي قد يخصص على التدريب للتحسين من فرص الحصول على درجات عالية في هذه الاختبارات بدلاً من أن يصرف لتقوية المنهج أو تقوية العملية التدريسية. وباعتبار اختبار القدرات يأخذ نصيبه من هذه النشاطات والفعاليات، بما في ذلك التدريب، فإن جعله غير متطلب للقبول يخفف كثيراً من الأعباء التي تتحملها المدرسة والطالب. علاوة على ذلك، فإنه بينما يمكن اعتبار النشاطات والفعاليات التي تتم فيما يخص الاختبار التحصيلي مقبولة-في حدود- باعتبار أن محتوى الاختبار وثيق الصلة بالمنهج وما يتم تدريسه، إلا أنها ليست مقبولة بالقدر نفسه لاختبار القدرات. فبخلاف الاختبار التحصيلي، لا تعد المهارات الاستدلالية التي يقيسها الاختبار مرتبطة مباشرة بالمنهج أو بما يُدرس فعلياً. بل إن الغموض الذي يكتنف معناها وصعوبة تفسير الأداء عليها ونقص المعلومات المتوفرة لمساعدة الطالب وللمعلم لفهم ما يعنيه الأداء عليها يجعل من الصعوبة بمكان تعرف الكيفية التي يمكن من خلالها تنمية تلك المهارات بصورة مباشرة.

وفي جانب المضامين، قد يتولد شعور لدى العديد من الطلاب بأن الجد والاجتهاد فيما تقدمه المدرسة لن يكون نافعاً في الحصول على درجة عالية في الاختبار. إلى جانب ذلك، هناك مضامين سلبية لتفسير الأداء على هذه الاختبارات نظراً لارتباطها بمفهوم الذكاء والقدرات الكامنة، وما ينجم عن هذا من تكوين انطباعات عن الحدود القصوى لقدرات الأشخاص بناءً على الدرجات في هذه الاختبارات والتعامل معهم على هذا الأساس، وما قد يعنيه ذلك ضمناً للممارسات والمواقف التعليمية.

تكافؤ الفرص واختبارات القبول:

يترتب على نتائج اختبارات القبول آثار مصيرية حاسمة تشكل المسارات المهنية والحياتية للعديد من الطلاب والأسر، بالرغم من وجود العوامل والمتغيرات المؤثرة في هذه النتائج والتي لا يملكون وسيلة لتغييرها[13]. ومن هذه العوامل يشار إلى المستوى الاقتصادي-الاجتماعي للأسر والاختلافات القائمة فيما بينها من حيث الإمكانات والمصادر المتاحة لها لتوفير التدريب والتهيئة المناسبة لهذه الاختبارات والحصول على درجات توسع من خيارات القبول أمام أبنائها. وتلعب الظروف البيئية للمدرسة وإمكاناتها من معلمين وإدارة ومرافق وغير ذلك من متغيرات دوراً مهماً في توسيع الفروق بين الدرجات، ليس بسبب الاختلاف أصلاً في مستويات القدرات التي يملكها الطلاب، بل في عدم تساوي تلك الظروف. ومع أن هذه العوامل والمتغيرات التي لا دخل للطلاب بها قائمة في كل الاختبارات وبخاصة واسعة التطبيق، إلا أن بالإمكان التقليل من آثارها من خلال تبني عدد من الوسائل والأدوات. ولا يتسع المجال هنا لمناقشة ما هو ممكن في هذا المجال، إلا أننا نعتبر عدم اشتراط أخذ اختبار القدرات جنباً إلى جنب مع الاختبار التحصيلي خطوة من أبرز وأهم تلك الوسائل والأدوات. وسينجم عن تبني هذه الخطوة ليس فقط حذف أعباء مالية تثقل كاهل العديد من الأسر، بل وفي التقليل من فرص عدم المساواة في واحد من أبرز المتغيرات المهمة لمستقبل العديد من الطلاب. فوق هذا ستعني الخطوة الحد من الأضرار التي ستتعرض لها مصائر العديد من الطلاب بسبب عدم تساوي ظروف أو عوامل لا يملكون الفرص مثل غيرهم لتبديلها.

 

اقتباس ختامي:

لعلنا في سياق دعوتنا إلى عدم الاستمرار في تطبيق اختباري القدرات والتحصيلي معاً شرطاً في القبول، أن ننهي العرض باقتباس بعض الفقرات الواردة في تقرير اللجنة الدائمة الخاصة باستخدامات الاختبارات المقننة في القبول بالكليات، Commission on the Use of Standardized Tests in Undergraduate Admission (NACAC, 2008)، وهي لجنة منبثقة عن الجمعية الوطنية الاستشارية للقبول بالكليات، National Association for College Admission Counseling (NACAC).

“……..تدعو اللجنة أعضاء الجمعية إلى تفهم وفهم التمرن على الاختبارات، والأخذ في الاعتبار الفروق بين الطلاب من حيث المقدرة على الوصول إلى معاهد التدريب ومواده. كما ترى أنه بالقدر الذي تجعل فيه الجامعات والكليات الاختبارات شرطاً للقبول ستنتعش سوق التمرن عليها. كما يتفق أعضاء اللجنة على أن أفضل تدرب ممكن، يجب أن يكون على المعرفة الأساسية والمهارات التي تساعد على تهيئة الطلاب للنجاح.

وترى اللجنة أنه بينما تعد اختبارات القبول مفيدة لعدد من الكليات، إلا أنها ثانوية من حيث قوة صلتها بأداء الطالب في المقررات الدراسية ذات التحدي. ولذا ينبغي ألا تتركز جهود المدارس لتهيئة الطلاب على اختبار للقبول بعينه، بل إلى تقوية المنهج وإلى تقوية أداء الطلاب في المقررات الدراسية باعتبارها مؤشرات للجاهزية.

وتدرك اللجنة أن النقاش بشأن عدالة اختبارات القبول لن يُحسم؛ لكنها تدرك أيضاً أن نوعاً من الاعتبار يجب أن يؤخذ في الحسبان للفروق الموجودة قبلاً، وإن كان هذا الاعتبار يظل متأثراً بالاعتبار المبالغ فيه من قبل المسؤولين في التعليم لهذه الاختبارات. وستظل هذه الفروق الموجودة قائمة لاعتبارات أخرى، ومن المهم ألا تتأثر فرصة الطالب على النجاح في الكلية بنتائج هذه الاختبارات.

إن استخدام اختبارات التحصيل في القبول له نتائج مهمة، فهو يبعث رسالة قوية إلى الطلاب بأن تعلمهم للمواد الدراسية وإتقانها-وليس التدرب على كيفية الحصول على درجة عالية في الاختبارات- هو الطريق الصحيح للقبول وللتعلم. وهذا بدوره يساعد المدارس على التحسين من مناهجها وطرق تدريسها، ويزيد من الشفافية. علاوة على ذلك فإن المواءمة بين اختبارات القبول والمنهج سيؤدي إلى تخفيف نقص المساواة في فرص التدرب. …. وترى اللجنة أنه باستخدام اختبارات التحصيل لن تفقد الجامعات سوى القليل أو لا شيء من المعلومات، لكنها ستسهم بشكل واضح في التأثير على التدريس والمنهج في المدارس. وترى اللجنة أن أحد التوجهات المستقبلية لاختبارات القبول يجب أن يكون نحو التبني الواسع لاختبارات تعكس بالضبط ما يُقدَّم في المرحلة الثانوية من مقررات”.

المراجع

اللغة العربية

درندري، إ. (2012). اختبار القبول بالجامعات السعودية في ضوء التوجهات الحديثة في صدق الاختبار. في كتاب وقائع المؤتمر الدولي الأول للقياس والتقويم: معايير القبول في التعليم العالي. المركز الوطني للقياس والتقويم في التعليم العالي، 18-20/ 1/ 1434 هـ، الرياض، المملكة العربية السعودية.

القاطعي، ع. والحربي، خ. (2013) قدرة معايير القبول الجامعي على التنبؤ بالمعدل التراكمي للسنة الأولى في بعض الجامعات السعودية. المركز الوطني للقياس.

المركز الوطني للقياس والتقويم (يناير 2019). مشروع تطوير اختبار “قدرات”. إعداد مؤسسة سبَّارة للتقويم التربوي والاختبارات التعليمية بالتعاون مع Buros Center for Testing (University of Nebraska-Lincoln).

المركز الوطني للقياس والتقويم في التعليم العالي (2005). تقرير مختصر عن بعض الدراسات التي تمت على اختبارات المركز والاختبارات ذات العلاقة، وحدة البحوث والدراسات.

الهيئة الوطنية لتقويم التعليم والتدريب (2018). نتائج اختبارات قياس. ورشة المؤشرات التعليمية، 16 ديسمبر 2018.

اللغة الانجليزية

Alnahdi G. H. (2015). Aptitude tests and successful college students: The predictive alidity of the General Aptitude Test (GAT) in Saudi Arabia. International Educational Studies, 8(4), 1–6.

Alshumrani, S. A. (2007). Predictive validity of the General Aptitude Test and High chool Percentage for Saudi undergraduate students (Doctoral dissertation, University of Kansas, Ann Arbor, MI).

Beard, J., & Marini, J. P. (2015). Validity of the SAT for predicting first-year grades: 2012 SAT validity sample (Statistical report 2015-2). New York: College Board.

Bridgeman, Pollack, and Burton (2008). Predicting Grades in different types of college courses. College Board Research Report No. 2008-1. Retrieved from: https://www.ets.org/Media/Research/pdf/RR-08-06.pdf

Bridgman, Burton, and Cline (2004). Replacing reasoning tests with achievement tests in university admission: Does it make a difference. In R. Zwick (Ed.), Rethinking the SAT.  New York:  Routledge.

Cronbach, L. J. (1977). Educational Psychology. New York: Harcourt Brace Jovanovich, Inc.

Dimitov, D., & Al Harbi, K. A. (2014). Examining students’ performance on pre-college tests (GAT and SAAT), college GPA, and post-college tests (PGAT and Teacher Test): The case of science colleges at Saudi universities (Report No. TR073-2014). Riyadh, KSA: National Center for Assessment in Higher Education.

Dimitov, D., & Al Harbi, K. A. (2014). Examining students’ performance on pre-college tests (GAT and SAAT), college GPA, and post-college tests (PGAT and Teacher Test): The case of science colleges at Saudi universities (Report No. TR073-2014). Riyadh, KSA: National Center for Assessment in Higher Education.

Dimitrov, D. (2013). High school assessment (lenient, adequate, strict) relative to the NCA assessments SAAT and GAT (TR033-2013). Riyadh, Saudi Arabia: National Center for Assessment in Higher Education.

Ebel, R. L. (1975). Essentials of Educational Measurement. New Jersey: Prentice-Hall, Inc.

Geiser, S. & Studley, R. (2002). UC and the SAT: Predictive validity and differential impact of the SAT I and SAT II at the University of California. Educational Assessment, 8, 1–26.

Geisinger, K. F., & Hawley, L. R., McCormick, C. (2018). The validation of tests in higher education. In Secolsky, C., & Denison, D, B. (Eds.) Handbook of measurement, assessment, and evaluation in higher education (2nd ed., pp. 147-160). New York: Routledge.

Glaser, R. (1992). Expert knowledge and processes of thinking. In D. F. Halpern (Ed.), Enhancing thinking skills in the sciences and mathematics. Hillsdale, NJ: Lawrence Erlbaum.

Kaufman, S. B., Reynolds, M. R., Liu Xin, Kaufman, A. S., McGrew, K. S. (2012).  Are cognitive g and academic achievement g one and the same g? An exploration on the Woodcock–Johnson and Kaufman tests. Intelligence, 40, 123-138.

Lynn, R., Meisenberg, G (2010). National IQs Calculated and Validated for 108 Nations. Intelligence, 38, 353-360

Mackintosh, N. J. (1998). IQ and Human Intelligence.  New York: Oxford University Press

NACAC (2008). Report of the Commission on the Use of Standardized Tests in Undergraduate Admission. Arlington, VA: National Association for College Admission Counseling. Retrieved from: https://files.eric.ed.gov/fulltext/ED502721.pdf

Naglieri, J., & Bornstein, B. (2003). Intelligence and Achievement: Just How Correlated Are They? Journal of Psychoeducational Assessment, 21, 244-260.
http://dx.doi.org/10.1177/073428290302100302

Noble, J. and Sawyer, R. (2002) Predicting different levels of academic success in college using high school GPA and ACT composite score. ACT Research Report Series 2002-2004. www.act.org/research/policymakers/pdf/PredictiveValidity.pdf

Ramist, Lewis and McCamley-Jenkins (1994). Student Group Differences in Predicting College Grades: Sex, Language, and Ethnic Groups. College Board Report No. 93-1. ETS RR No. 94-27

Richardson, M., Abraham, C., Bond, R. (2012). Psychological correlates of university students’ academic performance: A systematic review and meta-analysis. Psychological Bulletin, 138(2), 353-387.

Sawyer, R. (2013). Beyond Correlations: Usefulness of high school GPA and test scores in making college admissions decisions. Applied Measurement in Education, 26(2), 89-112.

Steenman, S. C., Bakker, W. E., & van Tartwijk, J. W. F. (2016). Predicting different grades in different ways for selective admission: disentangling the first-year grade point average. Studies in Higher Education, 41(8), 1408-1423.

Thorndike, R. L., Hagen, E. P. (1977). Measurement and Evaluation in Education and Psychology. New York: Wiley.

Tsaousis, I. (2017). Common characteristics and incremental validity of the constructs underlying General Aptitude Test (GAT) and Standard Achievement Admission Test (SAAT) – Art Major (TR195-2017). Riyadh, Saudi Arabia: National Center for Assessment in Higher Education.

Westrick, P. A., Le, H., Robbins, S. B., Radunzel, J. M. R., Schmidt, F. L. (2015) College performance and retention: A meta-analysis of the predictive validities of ACT scores, high school grades, and SES. Educational Assessment, 20(1), 23-45

 

  • التعقيبات:
  • التعقيب الأول: د. إقبال درندري

ستتمحور النقاط التي سأقدمها حول التوجهات الحديثة للصدق وربطها بالانتقادات التي شملتها الورقة المقدمة والتعقيب على كل منها.

أولاً: التوجهات الحديثة في دراسة الصدق

تعتمد التوجهات الحديثة لدراسة أدلة صدق استخدام وتفسير درجات الاختبار على التعامل معه على أنه عملية تطوير نوعين من الحجة: 1) حجة التفسير interpretive argument،  و2) حجة التحقق  من الصدق  the validation argument، المبنية على أدلة تراكمية لدعم تفسيرات درجات الاختبار المقترحة والاستخدامات لها؛ لذا أصبح هناك تحولات للتركيز على الصدق الفارق (اختلاف معامل الصدق بين المجموعات)، والتنبؤ الفارق (اختلاف التنبؤ بين المجموعات)، وما يترتب على الاختبار، والجوانب الاجتماعية المؤثرة عليه، وتوازي محتوى الاختبار مع المنهج (Kane, 2009; Newton , 2012). وهذا بدوره يشكل الإطار الذي ينبغي أن يؤخذ في الاعتبار عند تناول الاختبارات.

ثانياً: أهمية معايير الاختيار والقبول بالتعليم العالي.

تستند الجامعات في العالم على معايير لاختيار ولقبول الطلبة بالتعليم العالي، ومن أهمها اختبارات الاستعداد المدرسي والتحصيل (مثل    SAT/ (ACT، إضافة إلى نتائج امتحان الثانوية العامة. وكانت مؤسسات التعليم العالي تستوعب معظم المتقدمين معتمدة على معيار نسبة الثانوية العامة، ولكن مع الزيادة في حجم الطلب على التعليم العالي ومحدودية الطاقة الاستيعابية لمؤسسات التعليم العالي، زادت الحاجة للمعايير الأخرى، وبرزت قضايا تكافؤ الفرص والكفاءة.

وتركز اختبارات القدرات العامة على قياس القدرة التحليلية والاستدلالية لدى الطلبة، ومعرفة قابلية الطالب للتعلم بصرف النظر عن براعته الخاصة في موضوع معين.

بينما تركز الاختبارات التحصيلية على ما تعلمه الطالب في المواد التخصصية مثل الأحياء، والكيمياء، والفيزياء، والرياضيات، واللغة الإنجليزية، وغيرها من مقررات الثانوية، وتتفاوت الأسئلة في المستويات المعرفية.

ورغم أهمية هذه المعايير المستخدمة فقد واجهت عددًا من الانتقادات.

ثالثاً: أهم الملاحظات على استخدام اختبار القدرات مع اختبار التحصيل (إلى جانب درجات الثانوية العامة) للتنبؤ بنجاح الطلبة في الجامعة

أ-القيمة المضافة في القدرة على التنبؤ بالمعدل التراكمي للطلبة في التعليم العالي (الصدق التنبؤي):

  • لا ينتج عن إضافة القدرات للتحصيلي زيادة واضحة في التنبؤ بالمعدل التراكمي أو تفسير التباين فيه، مما يمكن الحصول عليه من الاختبار التحصيلي منفردًا.
  • النوعان من الاختبارات يقيسان عوامل مشتركة (القدرة العامة)، مما ينتج عنه ضعف إسهام أحدهما عندما يستخدمان معاً –وعلى الأخص إلى جانب نسبة الثانوية- في التنبؤ بالنجاح الأكاديمي. إضافة إلى أن هناك ارتباطاً خطياً عالياً بينهما (Collinearity)، ولذلك فإن تحليل الانحدار التدريجي يحذف أحدهما عند وجود الآخر بمعادلة التنبؤ أو يشير إلى مقدار ضئيل من التباين المفسر المضاف باستخدام الاختبار الآخر (مثال: الملحق).

ب-الارتباط بالمنهج وتحسين العملية التعليمية (الصدق التعليمي Instructional Validity):

  • يركز الاختبار التحصيلي على ما تم تعلمه ضمن مناهج الدراسة الثانوية ويتواءم معها، وبالتالي يعزز اهتمام الطلبة برفع مستوى التحصيل، خاصة وأن التعلم الراهن معتمد بقدر كبير على التعلم السابق؛ أما اختبار القدرات فيركز على المهارات الاستدلالية العامة التي لا ترتبط بالمنهج، وقد يشجع على التدرب على الاختبار بدلاً من رفع التحصيل.
  • تستخدم نتائج التحصيلي في تشخيص وتقويم وتحسين التعليم والتعلم على مستوى الطالب أو المعلم أو المدرسة أو المنهج.

تعقيب: أشارت كثير من الدراسات لمثل هذه الملاحظات، ومنها الدراسة التي قمت بها (انظر الملحق). وبالتالي فإن هذا الانتقاد في محله. من المهم التركيز على الصدق التعليمي واختبار الطلبة فيما تعلموه بالفعل وهذا يؤيد الاعتماد على التحصيلي، حيث يمثل المنهج الذي درسه الطالب. إضافة إلى أنه يُمكِّننا من تقويم المنهج وتحسينه وعمليات التعلم والتعليم.

لكن هناك جوانب ينبغي التفكير بها أيضاً:

  • ماذا عن الخطأ المعياري في تقديرات معاملات التنبؤ؟ القيمة ليست صغيرة؛ فهل سيزيد استخدام أحد الاختبارين فقط منه؟ خاصة وأن هناك اختلافاً إلى حد ما بين درجات الفرد الواحد على كل من الاختبارين (أشارت بيانات دراستي في 2012 على عينة من طلبة الجامعات إلى أن مدى الفرق من -19 إلى +27 ومتوسط الفرق 5 بين الاختبارين)؛ ودرجات كل اختبار الملاحظة تبعد بشكل واضح عن خط الانحدار خاصة في بعض مستويات المعدل الدراسي (مثال: الملحق). فهل نستطيع الاعتماد على أحدهما فقط؟

ج-المساواة وتكافؤ الفرص (الصدق الفارق Deferential Validity) والتداعيات السلبية (الصدق الترتبي Consequential Validity):

  • يؤدي المستوى الاقتصادي-الاجتماعي للأسر والإمكانات والمصادر والتدريب المتاح لها في توسيع الفجوة بين درجات الطلبة، كما أشار لذلك عدد من الأبحاث.
  • تؤدي بيئة المدرسة وإمكاناتها من معلمين وإدارة ومرافق دوراً مهماً في توسيع الفجوة بين درجات الطلبة بناءً على هذه الظروف، كما أشار لذلك عدد من الأبحاث.
  • هناك فروق بين الطلبة حسب التخصص والكلية والنوع في التنبؤ (الصدق الفارق).
  • يخشى أن تتركز الجهود على تنمية مهارات أخذ الاختبارات بدلاً من تنمية مهارات التعلم التي يؤكد عليها المنهج وتقوية المنهج والعملية التدريسية. إضافة لبذل الكثير من الجهد والتكلفة والوقت المخصص للتدريب لتحسين الدرجات.

 

تعقيب: يحتاج الطلبة لإعداد كافٍ قبل أخذ اختبارات القبول المقننة لتصبح عادلة، وهي تحتاج إلى توفر الصدق التعليمي، بحيث يتم التأكد من دراسة الطلبة بجميع المدارس لجميع الجوانب التي تتناولها هذه الاختبارات وتوفر الفرص التعليمية والتدريب بشكل عادل ومتكافئ، وعدم تأثر الفرص التي تتاح للطلبة بالمستوى الاجتماعي أو الاقتصادي للفرد أو المدرسة التي يدرس بها. كما ينبغي التأكد من “الصدق الترتبي” لهذه الاختبارات حتى لا يترتب على عدم توفر فرص كافية لدراسة متطلبات الاختبار عدم القبول بالجامعة لبعض الطلبة المستحقين الذين لو توفر لهم الإعداد الكافي عبر المنهج والأنشطة الصفية لقُبلوا بالجامعة Popham, 1997)).

إن مسألة مدى الحاجة لاختبارات القبول المقننة ومدى عدالتها أصبحت من القضايا التي تُناقش عالمياً، حيث استجابت بعض الجامعات لهذا النقد وخففت منها. وفي الدراسة التي أجرتها (درندري، 2012) أفاد عدد كبير من الطلبة في استطلاع الرأي بضرورة إعدادهم للاختبار بالشكل المناسب والتأكد من جودة المناهج ومستوى التعليم بالمدارس لتأثيرها على مستوى أدائهم بشكل مباشر في اختبارات القبول المقننة. إضافة إلى أن عدداً من الموهوبين بمجالات معينة قد يتعرضون للرفض بالجامعات بالرغم من تميزهم في مجالات محددة.

بالتالي فإن أهم قضية في نظري هي قضية المساواة وتكافؤ الفرص والتداعيات السلبية لاختبارات القبول وكيف تم معالجتها. وهذا النقد يظهر بشكل أكبر مع اختبار القدرات، الذي لا يعتمد على المنهج؛ بل القدرة العامة ويحتاج للتدريب أكثر من الإعداد بالثانوي، وهو عنصر يتأثر بالوضع الاقتصادي والاجتماعي للطالب، ويترك آثاره السلبية على الطلبة الذين تتأثر ظروفهم بذلك ولا يُقبلون بالجامعة نتيجة ظروفهم الاجتماعية والاقتصادية التي قللت من فرص إعدادهم طوال الدراسة وتدريبهم قبل الاختبار بشكل كافٍ، نظراً لعدم توفرها أو عبئها المالي عليهم.

ومن المهم دراسة ماذا ترتب على الطلبة الذين لم يُقبلوا نتيجة تطبيقها ومدى دقة مثل هذه القرارات.

كما تحتاج فاعلية (effectiveness) وكفاءة الإنفاق (efficiency) على هذه الاختبارات لدراسة للتأكد من عدالة وجدوى التكلفة في المال والوقت لكل منها، ومدى الحاجة لها.

الخلاصة:

إن مسألة الحاجة لاختبارات القبول المقننة ومدى عدالتها أصبحت من القضايا التي تُناقش عالمياً، حيث استجابت بعض الجامعات لهذا النقد وخففت منها. وتحتاج اختبارات القبول في التعليم العالي (التحصيلي والقدرات) لدراسة شاملة لمدى عدالتها للطلبة من المستويات الاجتماعية والاقتصادية المختلفة، ومن المدارس ذات المستويات البيئية المختلفة، ودراسة الصدق التعليمي والترتبي لكل منهما، ومدى دقتها في التنبؤ بنجاح الطلبة من ذوي القدرات المختلفة، والفاعلية والقيمة المضافة لكل منها وكفاءة الإنفاق لكل منهما، وعلى الأخص اختبار القدرات.

المراجع:

درندري، إقبال (2012). اختبارات القبول بالجامعات السعودية في ضوء التوجهات الحديثة في صدق الاختبار. ورقة عمل قدمت للمؤتمر الدولي الأول للقياس والتقويم بالسعودية، الرياض، المملكة العربية السعودية.

Atkinson, R. C., & Geiser, S. (2011). Reflections on a Century of college admissions tests. In J. A. Soares (Ed.), SAT Wars: the case for test-optional College Admissions (pp. 23-49). Teachers College Press.

FairTest. (2007). The ACT: Biased, Inaccurate, and Misused. National Center for Fair and Open Testing. https://fairtest.org/act-biased-inaccurate-and-misused/

Kane, M. (2009). Validating the interpretations and uses of test scores. In R. Lissitz (Ed.), The Concept of Validity: Revisions, New Directions and Applications (pp. 39-64). Charlotte, NC: Information Age Publishing Inc.

Newton P. (2012), Controversy Surrounding Modern Validity Theory. Paper presented at the annual American Educational Research Association, Vancouver, Canada.

Popham, W.J. (1997). Consequential validity: Right concern – wrong concept. Educational Measurement: Issues and Practice, 16(2), 9-13.


ملحق: ملخص وتحليل لبعض نتائج دراسة سابقة

دراسة (درندري، 2012) على قدرة اختبار القدرات والتحصيلي على التنبؤ بالمعدل التراكمي للطلبة بالجامعة

من نتائج طلبة من عدة جامعات بالمملكة العربية السعودية

توزيع درجات اختبارات القدرات والتحصيل والفرق بينهما 

تحليل الانحدار المتعدد (المتدرج) لقدرة اختبار التحصيل واختبار القدرات على التنبؤ بالمعدل التراكمي للطالب بالجامعة

توزيع درجات اختبارات القدرات والتحصيل  والثانوية مع المعدل التراكمي 

توزيع درجات اختبار التحصيل مع المعدل التراكمي حسب المعدل الدراسي (1، 2، 3، 4، 5)

توزيع درجات اختبار القدرات مع المعدل التراكمي حسب المعدل الدراسي (1، 2، 3، 4، 5)

 

  • التعقيب الثاني: د. عبدالله الدوغان

بدأت الورقة بسرد موجز لأهم مسوغات يراها الكاتب مدعاة لإلغاء اختبار القدرات وهي: الصدق التلازمي والصدق التنبؤي والتبعات الاجتماعية والتعليمية والتداعيات السلبية المترتبة على تطبيق اختبار القدرات وصدق المحتوى وتركيبة البنية الداخلية للاختبار والثبات وأخطاء القياس.

وكان أكثر ما تناولته الورقة تفصيلًا هو الناحية الإحصائية من حيث ارتباط اختبار القدرات باختبار التحصيلي، وارتباط الاختبار بالمعدل التراكمي الجامعي، ومدى مساهمته في الصدق التنبؤي المستند إلى الانحدار المتعدد.

بعد ذلك شرع الكاتب بالحديث عن بداية استخدام اختبار القدرات الذي يعده المركز الوطني للتقويم والقياس، حيث كان الاختبار (اختبار القدرات) في بداية تطبيقه مقبولًا، لكن الظروف تغيرت وظهر اختبار جديد آخر، وهو الاختبار التحصيلي الذي أثبت تفوقه على اختبار القدرات في تحقيق الهدف المقصود، بحيث أصبح اختبار القدرات لا يقدم معلومات إضافية عند استخدامه مع الأداتين الاختبار التحصيلي ودرجات الثانوية.

وسأتناول هذه المسوغات ثم أقوم بالتعقيب عليها:

  • أشارت الورقة إلى أن معامل الارتباط بين اختبار القدرات والتحصيلي بلغ. 90 حسب بعض الأبحاث، بل وصلت العلاقة في إحداها إلى ما يقارب . 998 ، وقد استدل الكاتب من هذه العلاقة القوية على أن كلا الاختبارين يقيسان عاملًا أو عوامل مشتركة.

وهذا الاستنتاج محل نظر، حيث إن اختبار القدرات من الناحية النظرية يقيس مهارات عقلية مختلفة عما يقيسه الاختبار التحصيلي حتى وإن تضمن التحصيلي قياس بعض المهارات العقلية.

فاختبار القدرات يُفتَرَض أن يقيس مهارات عقلية مستقلة عن المناهج الدراسية، في حين أن الاختبار التحصيلي يقيس معلومات ومعارف تستند إلى محتوى مناهج دراسية محددة كالرياضيات، والفيزياء، والكيمياء…إلخ، وهذا ظاهر في فقرات اختبار النوعين.

بل إن مقدار المشترك من الناحية النظرية بين التحصيلي واختبارات الثانوية أكبر من القدر المشترك بين اختبار القدرات والتحصيلي، وهذا (أي الاشتراك) ما قام الباحث بنقضه في موضع آخر.

من جهة أخرى فإن ما استندت إليه الورقة من قوة العلاقة بين اختبار القدرات والتحصيلي بناء على القيمتين 99. أو.90  أمر غير منطقي إحصائيًا، فلست تكاد تجد علاقة بين متغيرين (خاصة في العلوم الإنسانية) يقيسان السمة نفسها تزيد معاملات الارتباط بينهما عن. 80، كاختبارات الذكاء (وكسلر وبينيه) على سبيل المثال، بل إن معاملات الثبات التي تقيس ارتباط الاختبار بنفسه أو بصورتين متكافئتين منه أن وصلت الى. 90 أو. 95 فإنها لا تصل إلى. 99 على وجه الحقيقة.

  • أما ما يتعلق بالصدق التنبؤي لاختبار القدرات فقد أوردت الورقة معامل ارتباط بينه وبين المعدل التراكمي (الجامعي) يساوي. 41 حسب عدد من الدراسات وهو وإن كان ارتباطًا ليس بالقوي؛ لكنه متوقع ومقبول بالنسبة لاختبار قبول، وبصدد مقارنة كل من اختبار القدرات والتحصيلي ودرجات الثانوية بالمعدل التراكمي، وبناءً على دراسة أجراها المركز وجدت أن العلاقة بين كل من الثلاثة (القدرات والتحصيلي ودرجات الثانوية) كانت 413. 555. 467. على التوالي، فقد اعتبرت الورقة أن نقص اختبار القدرات عن المعيارين الآخرين التحصيلي والثانوية في ارتباطها بالمعدل التراكمي من بين مسوغات إلغائه، وهذا وإن كان صحيحًا فليس مبررًا لإلغاء الاختبار، علمًا بأن الفرق بينهم قليل جدًا لا يبنى عليه حكم كهذا.

وفي هذا الصدد يورد التقرير تعليل الحربي والقاطعي لانخفاض علاقة القدرات بالمعدل التراكمي مقارنة بالثانوية، أن المعدل التراكمي الجامعي يعتمد على اختبارات لا تأخذ في الاعتبار المهارات العقلية التي يقيسها اختبار القدرات وهذا تفسير محتمل.

  • أما ما يتعلق بالقيمة المضافة لاختبار القدرات والصدق الإضافي (incremental validity) فهو أقوى مسوغ استندت إليه الورقة في مطالبتها بالتخلي عن اختبار القدرات، إذ أظهرت الدراسات المشار إليها في الورقة أن ما يضيفه اختبار القدرات عندما يُستخدم مع التحصيلي ودرجات الثانوية ضئيل جدًا لا يساوي كلفة إعداده وتطبيقه وتبعاته الاجتماعية والتعليمية. وحيث إن ارتباط القدرات أقل من ارتباط التحصيلي والثانوية وقيمته الإضافية التي لا تكاد تذكر، فإن استخدامه مع الأداتين غير مبرر، خاصة إذا اخذنا في الاعتبار ما يشكله هذا الاختبار من أعباء إعداد وتجهيز وتكلفة مالية وتطبيقية.
  • ومن المسوغات التي عدها الكاتب سببًا إضافيًا لإلغاء اختبار القدرات هو التبعات الاجتماعية والتعليمية والممارسات الخاطئة التي تُنفَّذ على مستوى المدارس ومكاتب التعليم لهدف مساعدة الطلاب على رفع درجاتهم في اختبار القدرات الذي لا ينتج عنه رفع حقيقي لمستوى الطلاب في قدراتهم، والتي يكتنف مفهومها نوع من الغموض سواء في مضمون الاختبار أو في فهم المعلمين والمسؤولين لجوانبه وتفسير درجاته، وذلك بخلاف الاختبار التحصيلي الذي يتناول محتوى تعليميًا محددًا، إضافة إلى ما يوحي به اختبار القدرات بأن الاجتهاد والتحصيل الدراسي لا علاقة له بالتفوق في اختبار القدرات. وعلى افتراض أن هذه الممارسات الخاطئة واقعة بالفعل فإنه يمكن معالجتها بالتوعية.

وقد أشار التقرير إلى ممارسة خاطئة تُطبِّقها أغلب الجامعات باستخدام ما تعارفوا عليه بالدرجة الموزونة لاعتمادها في القبول وهي عبارة عن مجموع الدرجات في المعايير الثلاثة أو تحديد نسبة لكل معيار بصورة اجتهادية غير دقيقة، مما يترتب عليه قرارات قبول غير عادلة، ومع أن هذا الكلام صحيح، غير أنه لا علاقة له بمسوغات إلغاء اختبار القدرات.

خلاصة الرأي: وبناءً على ما تقدم فإن الاختبار التحصيلي – كما تشير إليه معظم الدراسات المحلية والعالمية – أفضل من اختبار القدرات، وأن الاختبار التحصيلي الذي يتضمن قياس مستويات عقلية عليا كالاستدلال والتحليل والتقويم أجدى في قياس ما يحتاج إليه الطالب في دراسته الجامعية، وأن اختبار القدرات – من الناحية النظرية على الأقل – يقيس مهارات عقلية مهمة يحتاجها الطالب الجامعي أيضاً؛ لكنه في الواقع الحالي يحتاج إلى إعادة نظر من حيث أسسه العلمية وبنائه المنطقي. واستخدامه مع الاختبار التحصيلي ودرجات الثانوية بوضعه الحالي قليل الفائدة.

إلا أنه يمكن أن يُستخدم مثلًا في تخصصات أو مجالات معينة وليس على سبيل العموم، أو يمكن استخدامه كمرحلة أولى للقبول لتصفية الطلاب الذين تجاوزوه عند درجة معينة، بحيث يكون أخذ الاختبار التحصيلي في مرحلة لاحقة تلي مرحلة التصفية.

 

  • المداخلات حول القضية
  • فلسفة وتاريخ نشأة اختبار القدرات.

بدأ استخدام اختبار القدرات (أو الاستعداد) SAT في الولايات المتحدة عام ١٩٢٦ تقريباً، وكان مفهومه مستنداً إلى اختبارات الذكاء، لكن ليس بمفهوم الذكاء الواسع؛ ولكن بالتركيز على ما يحتاجه الطالب الجامعي من استدلال كمي واستدلال لغوي وتفكير منطقي.

وكان الهدف الصريح من ذلك الاختبار في مراحله الأولى هو انتقاء أعلى الطلبة ذكاءً، بغض النظر عن مستواهم التحصيلي في المرحلة الثانوية، ولم يكن ثمة اختبار تحصيلي بجانبه لمن يستخدم SAT. فيما عدا من أصبح يستخدم اختبار الكليات الأمريكية ACT.

ثم نشأت اعتراضات علىSAT، اشتدت في الربع الأخير من القرن الماضي، وكان من أبرزها ما صدر من جامعة كاليفورنيا وقرار مديرها R. Atkinson -الذي كان عالم نفس بارزاً – بإلغاء SAT. وحيث إن جامعة كاليفورنيا الضخمة العدد وما تبعها من جامعات كان لها وزن كبير وأثر قوي على مؤسسة College Board الراعية لـ SAT فقد اضطرتها تلك التوجهات إلى تعديل اختبار SAT نفسه وإلغاء بعض أقسامه والتركيز على SATII  والذي يقيس جوانب تحصيلية.

الجدل حول استخدام SAT له جذوره الفلسفية النفسية والاجتماعية والتربوية والإحصائية.

ولجأت كثير من الجامعات في معظم دول العالم إلى وضع معايير علمية لقبول وتوزيع طلبتها على الكليات والتخصصات المختلفة (1). وبرزت الحاجة لذلك في ظل تزايد أعداد المتقدمين بدرجة تفوق المقاعد المتاحة في الجامعات (2). ويتم بناء الاختبارات الموحدة للقبول من قبل مراكز مستقلة عن القطاعات الحكومية تجنباً لأي نوع من التحيز؛ حيث تُطبَّق على خريجي المرحلة الثانوية في مختلف دول العالم اختبارات تعمل على قياس القدرات المعرفية، ومن أمثلتها ما يُطبَّق في الولايات المتحدة الأمريكية كاختبار القدرات الدراسية SAT، أما في المملكة العربية السعودية فتعد هيئة تقويم التعليم والتدريب اختبار القدرات العامة واختبار التحصيل الدراسي لخريجي الثانوية العامة (3)، (4). وفي سياق متصل يزداد التوجه يوماً بعد يوم نحو قياس مدى استفادة الطالب من مختلف البرامج الأكاديمية التي ينخرط فيها في تطوير قدراته ومهاراته (5).

وفي المملكة، وحينما برز لوزارة التعليم في عهد وزير التعليم د. محمد الرشيد -يرحمه الله- وجود الحاجة لإلغاء اختبارات الثانوية العامة المركزية واستبدالها باختبارات تقدمها المدرسة نظراً لعدة عوامل أهمها:

  • ضرورة توفير اختبارات مقننة تحقق الصدق والعدالة وتركز على الجوانب الأساسية وليس اختبارات في جميع المواد الدراسية والتي كان يبلغ عددها حوالي عشرين مادة، لدرجة كان يصعب كثيراً على الوزارة في حينها إعدادها وفق مواصفات الاختبار الجيد.
  • تزايد وقوع حوادث التسرب، مما يضطر الوزارة إلى إعداد اختبارات بديلة للدورين الأول والثاني وإعادة الاختبارات على مستوى المملكة، مما يسبب مشكلة تربوية واجتماعية، بل وظهرت حوادث سطو وتهديد لسلامة العاملين.
  • تقليل الرهبة من الاختبارات النهائية والتي شهد تعديل اسمها من الامتحانات إلى الاختبارات…. وغيرها من الأسباب.

وبعد إلغاء الاختبارات المركزية والاكتفاء باختبارات المدارس ظهرت على السطح نتائج توضح التفاوت الكبير بين الدرجات نتيجة لاختلاف واضعي الاختبارات وميل البعض إلى التساهل في رفع الدرجات بشكل يفقدها قيمتها ولا يحقق العدالة في وقت بدأت فيه أعداد المتقدمين للجامعات تتزايد وتفوق قدرتها الاستيعابية. ومن هنا رُفِع الموضوع إلى اللجنة العليا لسياسة التعليم التي كان يرأسها بالنيابة صاحب السمو الملكي الأمير سلطان بن عبد العزيز -يرحمه الله-.

درست اللجنة العليا لسياسة التعليم الأمر في ضوء التوجهات العالمية وكانت جامعة الملك فهد للبترول والمعادن تطبق اختباراً للقبول والاستعداد الأكاديمي يطلق عليهما رام 1 شبيه باختبار سات1 (العام والنظير لاختبار القدرات) ورام 2 الشبيه باختبار سات2 (التخصصي والنظير للتحصيلي) وأوصت اللجنة العليا بأن تقوم وزارة التعليم العالي بوضع اختبارات شبيهة تعتمدها الجامعات كاختبار قبول، ومن هنا أُنشئ مركز قياس الذي بدأ بوضع اختبار القدرات ثم التحصيلي. وأصبحت هذه الاختبارات رغم ما يدور حولها من جدل ذات سمعة ليست محلية فحسب، بل ودولية واستفادت منها دول كثيرة ومنها دول الخليج.

  • مدى جدوى اختبار القدرات: (الإيجابيات – السلبيات).

إن الارتقاء بمستوى التعليم في جميع مناطق المملكة مطلب وطني أساسي، لأنه ينعكس على تقدم البلاد وخططها التنموية، وإن اختبار القدرات العامة والتحصيل الدراسي اللذان يعدهما ويشرف على تنفيذهما المركز الوطني للقياس والتقويم في التعليم العالي مؤشر يوضح مستويات خريجي الثانوية العامة في جميع مناطق المملكة (6).

وترى بعض وجهات النظر أنه وإذا كانت الورقة الرئيسة قد انتهت إلى خلاصة مفادها عدم الاستمرار في تطبيق اختباري القدرات والتحصيلي معًا كشرطين للقبول، ومع التأكيد على ضرورة تطوير معايير القبول والتي يفترض أن تتغير لتكون في حالة تطوير مستمر؛ إلا أنه من المهم الإشارة إلى أن جميع الكليات لا تطلب المعايير الثلاثة كلها؛ فبعضها يكتفي بنتائج الثانوية واختبار القدرات؛ لأنه يساعد في تنشيط العمليات العقلية الضرورية كالفهم والاستنتاج واقتراح بدائل وابتكار طرق جديدة. كما أن هناك جوانب إيجابية لاختبار القدرات بشكل عام وليست متعلقة بعدالة القبول أو صدق تنبؤها، إنما تتعلق بقدرة الطالب على الفهم واستنتاج الإجابة أو الوصول إليها بطرق غير منمذجة، تدل في النهاية على ما يتمتع به الطالب من قدرات عقلية، واختبار القدرات يساعده ويمنح له الفرصة على التدرب للوصل إلى هذه القدرات. أما إذا كان الهدف من الاختبار القيمة التنبؤية فقط، فحسب ما أظهرته النتائج المبينة بالورقة الرئيسة في ورقته فهي ضعيفة الجدوى.

ويرى البعض الآخر أنه ومع تأييد مقترح الاكتفاء بالاختبار التحصيلي، إلا أن معدل نتائج السنوات الدراسية الثلاث في المرحلة الثانوية توضح مدى تحصيل الطلبة أثناء دراستهم في تلك السنوات ويقارن مع ما حصلوا عليه في الاختبار التحصيلي الذي تعده هيئة التقييم. ثم تعمل دراسة مقارنة لمدى تحصيل الطلاب خلال دراستهم في المرحلة الثانوية مع نتائجهم في الاختبار التحصيل، ونتائج هذه الدراسة المقارنة ستسهم بلا شك في الرفع من مستوى التدريس بالمرحلة الثانوية، وتقودنا إلى معرفة الخلل الذي أدى إلى هذه الفروقات في النتائج والإجابة على تساؤل لماذا تكون نتائج معظم الطلبة متدنية في الاختبار التحصيلي الذي تعده هيئة التقييم بينما نتائجهم عالية في الاختبارات التي تعدها المدارس؟

بلا شك ستكون نتائج هذه الدراسة مفيدة جداً لوزارة التعليم لمعالجة أسباب هذه الفروقات للرفع من المستوى التحصيلي لخريجي الثانوية العامة، ومحاسبة المدارس على مستوى نتائج خريجيها المتدنية أينما وُجدت.

ولذلك يمكن الاكتفاء بالاختبار على أن تستفيد المدارس والوزارة من تلك النتائج هذا من جهة، ومن جهة أخرى تقوي الوزارة ضعف قدرات الطلبة في التحليل والاستنتاج ولعل التطوير المستمر في المناهج والمقررات وإدخال مواد جديدة مثل التفكير الناقد والفلسفة وغيرها تسهم في تطوير قدرات خريجي الثانوية وتأهيليهم وقدراتهم في التحليل والاستنتاج للمرحلة الجامعية.

ومن ناحية أخرى أشارت بعض المداخلات إلى أن عدداً كبيراً من الطلاب الذين مروا علي في الجامعة لم يكن التعليم الجامعي مفيداً لهم؛ بل إنه كان من الأفضل لهم عدم الالتحاق بالجامعة، كان الأجدى توجههم نحو التعليم الفني والتقني لمدة سنة أو سنتين؛ لكي يبدعوا ويحصلوا على مؤهل يتوافق مع متطلبات سوق العمل ويضمن لهم فرصاً جيدة تمكنهم من العمل دون عناء. كل ما جرى هو أن هؤلاء الطلاب أهدروا أربع سنوات وربما أكثر في تعليم جامعي لم يقدم لهم الكثير علمياً وعملياً وخاصة طلاب الكليات النظرية. ومن خلال التجربة ربما يتضح أن هناك الكثير ممن اجتازوا هذا الاختبار (القدرات) وربما بدرجات مرتفعة ومع ذلك وجدناهم في مستويات متواضعة بعد دخول الجامعة بل وتسربوا منها. ومن ثم فإن هذا الاختبار وغيره قد لا يكون مقياساً دقيقاً لمستوى الطالب وأهليته للتعليم الجامعي. كان الأولى القيام بإجراءات أخرى لتحديد من يتم قبوله في الجامعة؛ كأن تعقد كل كلية اختبار مهارات يخصها أو مقابلات لتحديد من تود قبولهم ومن تعتذر لهم.

ومن ناحية أخرى وبالنسبة لتركيز الجامعات العالمية (وخاصة أمريكا) على هذه الاختبارات للقبول (القدرات والتحصيلي)، كما نعلم، يختلف من جامعة لأخرى ومن تخصص لآخر. وقد لا تلزم الجامعة أو الكلية الطالب بالاختبارين سوية، وقد يطلب اختبارات تخصصية لدى الكليات التخصصية والمهنية مثلاً SAT/ ACT لطلبة السنة الأولى، وفي مرحلة ما قبل التخصص تطلب اختبارات تخصصية والاعتماد يكون عليها مثل:

MCAT >> medical

PCAT >> Pharmacy

LSAT>> Law

إلخ. فليس هناك قالب موحد.

وأصبح هناك توجه لدى بعض الجامعات، كما ذُكر، أن تكون هذه الاختبارات اختيارية (وتعزز هذا التوجه مع جائحة كورونا) لإتاحة الفرصة للطلبة من البيئات الفقيرة والمحرومة التي قد لا تتاح لها الفرص مثل غيرهم من الطلبة للحصول على درجات مرتفعة على اختبارات القبول من تعليم وتدريب.

وكما نعلم بأن الجامعات العريقة وإن كانت تتشدد في الاختبارات التي تطبقها، فإن لديها محكات متعددة للاختيار؛ كما تتيح فرصاً لبعض الطلبة من الفئات المختلفة للحاق بالبرامج لمعالجة قضية عدالة الاختبارات للفئات. كما تتيح للمتميزين في مجالات معينة الفرصة أيضاً. فضلاً عن أن هناك فرصاً أخرى في جامعات جيدة حولها تستوعب بقية الطلبة الذين لم يسعفهم الحظ بهذه الجامعات.

وتلفت بعض الآراء النظر إلى أن موقف مركز قياس من البداية هي أنه ليس جهة تفرض الاختبار على الجامعات. وإن الجامعات لها حق الاختيار، وقد مالت جميع الجامعات إلى وضعه ضمن شروط القبول في البداية، حيث كان الخيار الأنسب في حينه.

الآن السؤال هو هل الأفضل الاستمرار بنفس النهج أو إلغاء اشتراط الاختبار أو التعديل على أسلوب التعامل معه. ولعل ذلك يعتمد على منظور الجهة التي تستفيد من الاختبار. وتجدر الإشارة هنا إلى أن غالب الدراسات ركزت على ارتباط اختبار القدرات بالمعدل الجامعي، وهذا جزء من المستهدف وليس كله. إن التوجه الحديث في الجامعات هو في تنمية مهارات الطلاب في الاتصال وسرعة الفهم والتحليل وحل المشكلات والعمل ضمن فريق… إلخ. وهي لا تنعكس بالضرورة في المعدل الجامعي؛ ولكنها مهمة جداً في النجاح بعد الجامعة، وربما تعكس مدى صحة قرار الاستثمار للجهة الممولة لتعليم الطالب أياً كان شكلها. وعلى سبيل المثال لا الحصر فإن كلية الطب قد تُفضل قبول طالب معدله في الثانوية أو التحصيلي 94% ويذاكر ساعة في اليوم على طالب معدله 98% ويذاكر بمعدل 5 ساعات أو أكثر في اليوم. والظن أن اختبار القدرات يميل لصالح الطالب الأول.

أيضاً فثمة أثر إيجابي غير مباشر لاختبار القدرات؛ فهو يقلل من الإقبال على المدارس التي تتساهل في الدرجات. كما أنه يلفت نظر المدارس والمعلمين والطلاب لأهمية الجوانب التي يقيسها اختبار القدرات.

وفيما يخص منظور الجهة المستفيدة من الاختبار فتتضمن ما يلي:

  • الكليات التي ترغب في اختيار الأفضل من الطلاب لتحسين بيئتها التعليمية ورفع جودة مخرجاتها وسمعتها.
  • الجهات الممولة للتعليم المنتهي بالتوظيف لديها، مثل الكليات العسكرية أو أرامكو وسابك وغيرها. هذه الجهات قد ترغب في اختبار القدرات لأنه مفيد لها كمؤشر للاختيار عند التوظيف. فهي تستخدمه هنا بشكل استباقي.
  • الجهات الممولة للتعليم، ويمكن في حالتنا افتراض أنها ممثلة بوزارة التعليم بحكم مجانية التعليم. ويفترض أن يكون لديها سياسة في رغبتها في توجيه الطلاب لمختلف التخصصات.

ولذلك يصعب من الناحية العملية التوصية بفرض توجه معين على جميع الجهات التعليمية.  والأفضل هو ترك الأمر لها أسوة بما هو متبع في الجامعات الأمريكية، كما أن ما تحقق من نجاح في مركز قياس هو إنجاز لا ينبغي التراجع عنه.

وثمة إشارة مهمة يراها البعض، وهي أن اختبار القدرات يقيس جوانب لا يقيسها الاختبار التحصيلي. ولذلك فإنهم يرون الإبقاء على الاثنين، ويبقى القرار للجهة المستفيدة تأخذ بها بحسب ما يناسبها.

وفي تصور البعض الآخر، فإن المشكلة أن الجامعات تشير بأصابع الاتهام لنظام التعليم؛ فإذا كانت لا تثق في قياس مخرجاته فإن اختبار قياس التحصيل هو كفيل بأن يبث الثقة في المخرج التعليمي، ثم إن جميع الدراسات التي أُجريت بين العلاقة بين المعدل التراكمي وبين اختبار التحصيل جاءت معدلات الارتباط بينهما عالية. ولم يثبت في المؤشر البحثي نفس الارتباط بين اختبارات القدرات وبين المعدل التراكمي بالقوة نفسها؛ مما يعني أن الدلالة تكون أقوى للتحصيل، وبالتالي فإن هذا الارتباط لاختبار التحصيل يزيح أو يقلل من ارتباط القدرات بالمعدل التراكمي.

  • دور “الصدق المضاف، incremental validity” في الحكم على مدى أهمية أداة الاختيار ”selection”.
  • يمثل التنبؤ بالأداء المستقبلي على محك معين (المعدل التراكمي، مثلاً) الغرض الرئيس من تطبيق أدوات القياس والاختبارات. ولأن هذا الغرض أساس، فإنه يحكم على مدى أهمية أية أداة من أدوات الاختيار من خلال ما تضيفه من أجل تحقيق هذا الغرض؛ التنبؤ بالأداء على المحك. هذا الحكم متيسر تقييمه، من خلال تطبيق الإجراء الإحصائي: تحليل الانحدار المتعدد. يمكن في ضوء هذا التحليل تقدير القيمة التي تضيفها أداة ما من أدوات الاختيار إلى الصدق التنبؤي، عندما تُستخدم مع غيرها، وبالتالي اتخاذ قرار بشأن الإبقاء عليها أو حذفها. وتعد هذه النتيجة كافية جداً للقول بعدم الحاجة إلى تطبيق اختبار القدرات جنباً إلى جنب مع التحصيلي. هناك بالطبع مسوغات أخرى، تعليمية، واجتماعية، مشار لها بالورقة الرئيسة، للتخلي عن تطبيق الاختبار، لكن في الواقع ربما لا نحتاج إلى أكثر من هذا المسوغ الإحصائي للوصول إلى هذا الحكم.
  • لا يوجد غرض آخر يفوق الغرض الأساس من تطبيق أدوات الاختيار (أي التنبؤ بالأداء على محك)، وبالتالي لا أهمية، من الناحية الإحصائية، لأغراض أو اعتبارات أخرى، كالقول مثلاً أن اختبار القدرات يحمل “جوانب إيجابية… تتعلق بقدرة الطالب على الفهم والاستنتاج والوصول للإجابات بطرق غير تقليدية”. وفي الواقع فإنه من هذه الزاوية تحديداً، فإن قيمة الاختبار التحصيلي من الناحية التعليمية تفوق قيمة اختبار القدرات، بل لهذا السبب تحديداً، تحول منذ ما يزيد عن 10 سنوات محتوى اختبار “SAT”إلى اختبار في التحصيل بعد أن كان اختباراً للاستعداد.
  • ما يجري حالياً في جامعاتنا من تطبيق اختبارين للقبول إلى جانب الثانوية العامة، ممارسة تختص بها جامعاتنا فقط من دون بقية جامعات العالم. معظم الجامعات تطبق اختبارات تحصيلية عامة، إلى جانب نتائج الثانوية، وقلة جداً تستخدم اختبارات “الاستعداد”؛ لكن لا توجد جامعات تجمع بين هذين النوعين من الاختبارات وتعتبرهما شرطاً للقبول، وإن كان عدد محدود منها يشترط اختبارات في مقررات دراسية معينة (SAT II)، مثلاً – ليست تحصيلية عامة.-
  • تبقى اختبارات القبول في الاختيار الجامعي مهمة وستظل مهمة في ترشيد قرارات القبول، والمطلوب فقط الاكتفاء باختبار واحد إلى جانب نتائج الثانوية العامة.

 

  • آليات تحسين القبول والتطوير المستقبلي لمعاييره المتبعة.

في ضوء تقييم مدى جدوى اختبارات القدرات والإيجابيات والسلبيات ذات الصلة به، تبرز الحاجة إلى ما يلي:

  • دراسة الآثار المترتبة على تطبيق اختبارات الاختيار والقبول بأنواعها للفئات المختلفة وبطرق مختلفة تهتم بالجوانب البيئية والاجتماعية. فأغلب الدراسات تركز على القضايا الإحصائية ومنظور المدرسة الوضعية positivism أكثر من جوانب منظور المدرسة البنائية constructivism وتوفير البيئة والممكنات لجميع الطلبة بما يؤهلهم لتحقيق أهدافهم.
  • تناول القضايا الأوسع والأكبر الخاصة بالعدالة الاجتماعية من منظور الأسرة والطالب وليس فقط الجامعة ومراكز الاختبارات.
  • إعادة دراسة أنظمة قبول الطلبة في المراحل المختلفة بكافة جوانبها عالمياً ومقارنتها بما هو موجود لدينا ليس فقط من حيث الاختبارات؛ بل الفرص التي تُوفَّر للطلبة ومصير الطلبة غير المقبولين.
  • معالجة جذور المشكلة التي أدت للمزيد من الاختبارات لتقنين القبول في التعليم العالي نظراً لتضخم درجات الثانوية وانخفاض مصداقية بعضها.
  • إن كان ولا بد من تطبيق أكثر من اختبار للاختيار والقبول؛ فيُفضل استخدام نماذج تنبؤ متقدمة ودقيقة تعتمد على وضع معادلات ونماذج احتمالية تأخذ في الحسبان جميع المتغيرات التي تؤثر على درجات الطالب وتقوم بالتعديل بناءً عليها لمعالجة المشكلات أعلاه.

وفي سياق متصل ترى بعض وجهات النظر أنه يفترض أن لا نعول كثيراً على اختبار القدرات ونعتقد أنه متغير حاسم في تحديد مستوى الطالب وأن هذا الاختبار ضروري، لأن مشكلة تدني مستوى الطلاب عموماً قد تكون في مكان آخر ربما في المنهج التعليمي، وفي محتوى المواد التي درسوا في مراحل التعليم العام، وفي طريقة التعليم، ومتغيرات أخرى.

ويمكن في هذا الصدد اعتماد معدل نتائج السنوات الدراسية الثلاث في المرحلة الثانوية وليس نتيجة الطالب في آخر سنة في الثانوية وهو ما سيوضح فعلاً مستوى تحصيل الطلبة أثناء دراستهم ثم يُطبق الاختبار التحصيلي الخاص بالهيئة.

مسألة أخرى في غاية الأهمية وهي أنه ليس من الضروري أن يتوجه جميع خريجي الثانوية للجامعات لأن في ذلك هدر، بل أن يتوجه قسم كبير منهم للتعليم التقني الذي يؤهلهم بالفعل للعمل وليس البطالة.

هناك جانب نفسي- اجتماعي في كلمة “بكالوريوس” فهي تؤطر الكثيرين في إطار معين تجعلهم ينصرفون عن عدد كبير من المهن المدرة للدخل والتي يقوم بها الوافدون الذين لدينا منهم نحو ١٤ مليون وافد لم يفدوا بالطبع للسياحة بل للعمل والكسب، ولدينا في ذات الوقت آلاف الخريجين من حملة البكالوريوس الذين لا يعملون رغم توفر فرص الكسب فيما لو تخلوا عن كبرياء “البكالوريوس” وما تعنيه لهم على المستوى النفسي.

خريج البكالوريوس لا يستطيع الانخراط في أي عمل؛ بل إنه يتردد كثيراً في قبول الكثير من المهن انتظاراً للوظيفة الحكومية التي قد تأتي وقد لا تأتي.

وعندما نمعن النظر في السياسة التي بموجبها تم تبني تعرض خريجي الثانوية العامة لاختبار القدرات والاختبار التحصيلي نجد الكثير من المبررات والأسباب والمنطق والأهمية لتبني تلك الاختبارات؛ لكننا يجب أن نتوقف قليلاً عند الممارسة لننظر بشكل علمي ودقيق في كل ذلك.

والأمر الآخر أننا لا نعرف العوامل المؤثرة على تحديد نتيجة الطالب التي يجب التحكم فيها واستبعاد التي لا تحقق العدالة بين الطلاب في النتائج، لأن هناك عوامل يجب أن يعرفها القائمون على هذه الاختبارات.

تعلمنا من البحث العلمي أنه لا بد من التحكم في كل تلك العوامل التي قد تكون في صالح فئة ضد فئة. من تلك العوامل نوع المدرسة التي يدرس بها الطالب، وعدد طلاب الفصل في المدرسة، والمكتسب الاقتصادي للطالب، ومكان وزمان الاختبار ومدى تعرض الطلاب لاختبارات تجريبية لكلا الاختبارين (القدرات والتحصيلي).. وغيرها عدد من العوامل المؤثرة في نتيجة الاختبارات خارج نطاق مستوى الطالب الحقيقي.

ويجب أن يستفاد من اختبار القدرات والاختبار التحصيلي بعد التحكم في كل العوامل المؤثرة في نتيجة هذه الاختبارات لعلاجها، وذلك بأن تستثمر نتائج الاختبارات في تصنيف الطلاب حسب قدراتهم، فيُوجهون إلى ما يناسبهم من المجالات الإدارية والمهنية والتخصصية المناسبة، بحيث تتم مساعدة الطلاب وأولياء أمورهم، بل وإقناعهم بناءً على بيانات ونتائج علمية بأن هذا المجال يناسب هذا الطالب.

بينما يرى البعض أن يتم التعامل مع طلاب السنة الأولى الجامعية بالدرجة الأولى لأنها (عتبة القبول) breakthrough  التي يترتب عليها كثير من المعطيات الأخرى سواء الأكاديمية أو حتى المالية – المقارنة مع السنوات التالية قد تكون غير مقنعة كثيراً؛ لأن الطالب الذي اجتاز عقبة (السنة التحضيرية) هو من فئة الربع الأعلى أو النصف الأعلى من المقبولين وهي مقارنة بين مجموعتين مختلفتين من الأفراد المدروسين.

ومع أنه قد تختلف وجهات النظر بخصوص وضع معايير القبول اعتماداً على نتائج الثانوية – القدرات – التحصيلي وغيرها من المعايير مع الأخذ بالاعتبار اختلاف المناهج وطريقة التعليم والفرص الوظيفية المستقبلية في كل مجتمع. وأحياناً كثير قد تعطي هذه المعايير نتائج غير دقيقة وتقود إلى استنتاجات خاطئة يُبنى عليها سياسات عامة. ولعل التركيز الأهم يكون على الشطر الآخر من المعادلة المتعلق بالمهارات التي يجب على الخريج تعلمها خارج إطار التعليم التقليدي والتي تجعله أكثر نضجاً واستعداداً لمواجهة تنافسية سوق العمل.

ومن الضروري إجراء دراسات مقارنة لما تقوم به الدول الأخرى من حيث اختبارات القبول ومعالجة جذور المشكلة التي أدت إلى تضخم درجات الطلاب في مدارسهم، فضلاً عن الحاجة إلى إعداد دراسات تأخذ الجوانب الاجتماعية والاقتصادية والجغرافية وتأثيرها في نتائج الطلاب.

ولعل هناك أيضاً أهمية لإجراء دراسات طولية تتبعية ليس على مستوى السنة التحضيرية أو الجامعية، بل وحتى الدراسات العليا والنجاح الوظيفي اللاحق؛ لكي نتأكد من قدرة الاختبارات التنبؤية بشكل مطمئن.

أما تحديد الوزن النسبي للمعدل التراكمي (لثلاث سنوات في الثانوية للبرنامج الوطني وأربع سنوات لبعض البرامج الدولية) والمعدل النسبي لاختباري القدرات والتحصيلي، فهذا يعود للجامعات التي تملك الآن سلطة أكبر في اتخاذ القرار وربما يكون لديها من البيانات التي تساعدها في اتخاذ قرارات القبول المختلفة حتى على مستوى الكليات.

ولمعالجة بعض الجوانب المرتبطة بالتحضير لاختبار القدرات يجري العمل لإطلاق اختبار قدرات في المراحل الدراسية الابتدائية والمتوسطة وهو اختبار يساعد في تقليص الفجوة المرتبطة بتعرض الطالب للمهارات التحليلية والكمية واللغوية في سنوات دراسته، كما أن نشوء الجامعات الحكومية في معظم مدن ومحافظات المملكة الطرفية ساعد في تحقيق شيء من العدالة والتقليل من تأثير العوامل الثقافية والاجتماعية التي ستظل موجودة على المستوى التعليمي أو المهني.

وفي ظل التطورات الواضحة في التعليم في المملكة العربية السعودية ربما أصبح من الضروري “أن يكون هناك نوع من التوازن بين التوسع الكمي والكيفي؛ بمعنى أن تكون هناك أدوات وعمليات تفرز وتنقي الطلاب المتقدمين للتعليم العالي”(7). بجانب الحاجة إلى إجراء مزيد من الدراسات التي تستهدف تطوير اختبارات القدرات ذوي الفئات الخاصة والموهوبين في الجامعة وتقنينها (8).

 

  • إعادة صياغة نظام التقييم العلمي لطلاب الثانوية مع نظام المراقبة الدَّقيق.

من المتفق عليه أنه لا بد على الدوام من وضع معايير أكثر دقة لقبول الأفضل من بين المتقدمين للقبول بالجامعات وإلى التمييز بين الطلاب، كل حسب قدرته العلمية والعقلية، ومن هنا ظهرت اختبارات القبول المعدة من قبل المركز الوطني للقياس والتقويم بالمملكة العربية السعودية (9).

لا شك في أن إعادة صياغة نظام التقييم العلمي لطلاب الثانوية بهذه الاختبارات الشاملة مع نظام المراقبة الدَّقيق هو في مصلحة العمليَّة التعليميَّةِ، وينطوي على مستوى أعلى من العدالة، ولكن يبقى هناك تساؤل جوهري طرحته الورقة الرئيسة ومفاده إن كان المبرِّر الأساسي لإجراء هذه الاختبارات هو ضعْفَ نظام التقييم في المدارس وضعْفَ ثقتنا به، فكيف نضع ثقتنا في الأصل في مخرجات التعليم لهذه المدارس؟ لأنَّ جلَّ ما نفعله هو إعادة اختبارهم بنفس ما لديهم من حصيلة علميَّة اكتسبوها في المدارس ذاتها، دون إضافات تُذكَر سوى بعض التدريبات الإضافيَّة التي تقوم على نماذج اختبارات سابقة أو مراجعات من مذكرات وكتب خارجيَّة، وهنا يبرز السؤال: هل يشكِّل هذا إضافة نوعيَّة لحصيلة الطلبة العلمية؟

أليس من الأجدر أن تنصبَّ الجهود على رفع مستوى التعليم والتقييم في المدارس، وتحسين كفاءة المدرِّسين عمومًا، في المرحلة الثانوية خصوصًا؛ ليَحصل الطالب بعدلٍ على ما يستحقُّه فعلًا من درجاتٍ، تعكس أداءَه الحقيقي لثلاث سنوات من التعليم الثَّانوي، يكون كافيًا لتحديد قبوله أو رفضه في تخصُّصٍ جامعيٍّ معين، فإن لم يتحقَّق هذا الهدف لشروط يصعُب تلبيَتُها من قِبَل المدارس – خصوصًا في نزاهة تقييم طلبتها – فلا أقلَّ من أن تكون النسبة المحتسبة للمدارس ضمن المعدل العام – مهما تضاءلَت – ذات مصداقيَّة.

ما يجري حاليًّا للأسف من احتِساب كامل الدرجة المدرسيَّة كنسبة مئوية لا تتعدى وزن أحد الاختبارات – إنما هو تقزيمٌ وتهميش لدور المدارس، وتَشجيع لها على المزيد من التمادي بمنح الطَّلبةِ جميعهم أكثرَ ممَّا يستحقُّونه؛ ممَّا يقود بطبيعة الحال إلى فجوة أكبر في تطبيق العدالة بانحِسارها عن الطَّلبة المتميزين لصالح الضُّعفاء، إضافة إلى أن ذلك يقود بشكلٍ تلقائي إلى مزيد من إهمال الطَّلبة لدروسهم؛ بسبب شعورهم بأنَّهم في نهاية الأمر سيَحصلون على درجاتٍ مدرسية متقاربة مهما بذلوا من جهد.

ولعل من المهم ضرورة طرح قضية ذات علاقة بهذا الجانب وهو ما يقوم به مركز القياس والتقويم من عمليات اختبارات قياسية وما تقوم به وزارة التربية والتعليم من عمليات قياس كفايات المعلمين والفنيين من خريجي الجامعات وكأن الأمر أصبح تحدياً بين الطرفين واتهاماً متبادلاً بينهما بعدم توفر الكفايات والمهارات لمخرجاتها وتكون الضحية في نهاية الأمر هي تلك المخرجات لكلا الطرفين، والمأمول أن يكون هناك تكامل وتواصل وتفاعل بين مكونات التعليم العام والعالي للوصول إلى مخرج متمكن مكتسب للمهارات والمعارف والقيم التربوية لنصل إلى تنسيق متكامل بين جميع الأطراف ونتخلص من هذا الإسهال التقييمي المتكرر بشكل فوضوي غير خلاق قد يذهب بالبعض إلى نتيجة أن الهدف هو المال لتلك الجهات والشركات القابضة المشغلة لها.

 

  • التوصيات
  • تطوير مرصد تعليمي تحت مظلة هيئة تقويم التعليم يضم كافة المؤشرات ذات العلاقة ويتكامل مع المراصد الحضرية والإحصاء وتطور فيه المؤشرات في سياق المتعارف عليه دولياً في بناء المراصد العلمية بدلاً من التشتت واختلاف المعايير.
  • تطوير اختبارات لقياس قدرات الطلاب وتوجهاتهم وتحديد ميولهم (أو استخدام ما هو متوفر لدينا من النسخ المقننة مثل بيركمان ومايرز برجز) لمساعدتهم على الاختيار التخصص المناسب (أكاديمي أو تقني مهني).
  • المحافظة على الاختبارين حيث إن اختبار القدرات يقيس جوانب غير اختبار التحصيلي.
  • وجود دراسات تتبعية لنفس الطالب لقياس العلاقة بين درجاته ومعدلاته في الثانوي ومعدل تخرجه من الجامعة وقياس إنتاجيته الوظيفية.
  • التوسع في الترغيب في العمل المهني والتقني على المستوى الاجتماعي والأكاديمي بطريقة تجعل الطالب صاحب هذه القدرات يُقبل وهو يشعر بالقوة والثقة لا أنه أقل من غيره.
  • القيام بدراسات حقلية، وصفية واستشرافية، ذات منهجية عالية، وصرامة علمية، تبحث وتحدد درجة صحة القرار فيما يتعلق بما يجب اتخاذه حول اختبار القدرات، والضرورة القصوى للاسترشاد بالدراسات والتجارب العالمية في هذا المجال.
  • تركيز الجهود لرفع مستوى التعليم الثانوي وممارسات التقييم في مدارسه، وتحسين كفاءة المدرِّسين عمومًا، وفي المرحلة الثانوية خصوصًا؛ ليَحصل الطالب على معدل عدلٍ يستحقُّه فعلًا ويعكس أداءَه الحقيقي لثلاث سنوات من التعليم الثَّانوي.
  • الحوكمة الفعالة تتطلب وجود لائحة قانونية تنظيمية لاختبار القدرات لضمان الحيادية وعدم تعارض المصالح وتفعيل الحماية والحقوق لكافة الأطراف.
  • أن يكون اختبار القدرات مجانياً ودون مقابل أو تتولي بعض الجهات الخيرية بتغطية التكاليف لغير القادرين.
  • إعداد دراسات مستقلة تجيب عن تساؤلات مهمة من أبرزها:
  • كيف تفسر نتائج تحليل الانحدار المتعدد التي أوضحت عدد من الدراسات أن هناك قدراً مشتركاً بين القدرات والتحصيلي في تنبؤهما بنجاح الطالب بالجامعة (أو معدله الدراسي) وترجح استخدام التحصيلي؟
  • هل هناك ضرورة لتطبيق اختباري القدرات والتحصيلي لقبول الطلبة بالتعليم العالي؟ وما الحد الأدنى الضروري منها؟ وما القيمة المضافة لكلٍ منها؟ وهل يطبقان على الجميع؟ ومتى؟ ولماذا من الضروري أن يطبقا؟ وهل تُبرر القيمة المضافة التكلفة؟ وما مدى تأثير المنطقة والجامعة والنوع الاجتماعي والمستوى الاجتماعي والاقتصادي على كل منها؟ وهل المترتبات على تطبيق كل اختبار تمت معالجتها لمن لم يُقبلوا؟ وما التطويرات الحديثة اللازمة لكل منها في ضوء أفضل الممارسات العالمية؟ وكيف تطور أنظمة التعليم والتقويم والبيئة التعليمية بالتعليم العام لتقلل من الفجوة بين الطلاب وتزيد من فاعلية استخدام هذه الاختبارات؟
  • ما مدى جودة المدرسة الثانوية وأثرها في الاختبار التحصيلي؟ وإلى أي حد يساعد اختبار القدرات العامة الطالب ذا القدرات العالية عندما ينخفض تحصيله بسبب انخفاض جودة المدرسة؟ وهل يرتبط اختبار القدرات العامة بالنجاح على المدى الطويل في الحياة العملية، وإلى أي مدى يعتبر اختبار القدرات العامة أقوى في التنبؤ بأداء الطالب الجامعي حينما تجنح الدراسة في الجامعة إلى مواقف التعلم التي تنمي مهارات التفكير الناقد وحل المشكلات ونحوها من الكفايات؟

 

  • المصادر والمراجع
  • النعيمي، عز الدين عبدالله. (2020). فاعلية أسلوب التحليل التمييزي في التنبؤ الدراسي من خلال اختبار القدرات العامة والاختبار التحصيلي في بعض الجامعات السعودية. مجلة العلوم التربوية، ع 24، 460-524.
  • الجهني، محمد صالح والصبيحي، على أحمد. (2021). تحسن درجة الطالب في اختبار القدرات العامة بتكرار أخذه للاختبار ولو بدون تدريب احترافي. مجلة العلوم التربوية والنفسية، مج 5، ع 36، 76-93.
  • الربيعان، عبدالله بن علي والمطيري، نوف بنت فهد. (2022). دراسة تقويمية لمستوى أداء الطلاب ذوي صعوبات التعلم في اختبار القدرات العامة وفق بعض المتغيرات. مجلة الآداب للدراسات النفسية والتربوية، ع 13، 111-150.
  • البوعبيد، عبدالله بن عبدالعزيز. (2016). مدى تحقيق اختبار القدرات العامة للمرحلة الثانوية لمبدأ تكافؤ الفرص التعليمية من وجهة نظر طلاب السنة التحضيرية بجامعة الملك فيصل. مجلة كلية التربية، مج 27، ع 107، 107-139.
  • آل مرعي، محمد بن عبدالله وحسن، محمد السيد عبدالفتاح. (2016). إعداد اختبار القدرات المعرفية “اللفظي – الكمي” وتقنينه على عينة من طلاب الجامعة بصورته الأولى. مجلة جامعة طيبة للعلوم التربوية، س 11، ع 3، 421-443.
  • الغامدي، رباب خلف. (2016). أسباب الفجوة بين نتائج اختبار الطالبات في الثانوية العامة وبين نتائج اختبار القدرات العامة والتحصيلي من وجهة نظر (الطالبات – المعلمات – المديرات – المشرفات التربويات) والحلول المقترحة. الثقافة والتنمية، س 16، ع 101، 73-112.
  • الثبيتي، خالد بن سفر. (2021). أسباب الفجوة بين نتائج اختبار طلاب المرحلة الثانوية بالطائف وبين نتائج اختبار القدرات العامة والتحصيلي. مجلة العلوم التربوية والنفسية، مج 5، ع 48، 87-109.
  • عبود، يسري زكي وأبو ناصر، فتحي محمد علي. (2019). تقنين اختبار القدرات المعرفية المتعدد للموهوبين في الجامعة. مجلة الجامعة العربية الأمريكية للبحوث، مج 5، ع 2، 71-101.
  • العزيزي، عيسى فرج عوض. (2016). أثر برنامج تدريبي على أداء عينة من الطلاب والطالبات في اختبار القدرات العامة في محافظة مهد الذهب. المجلة التربوية الدولية المتخصصة، مج 5، ع 7، 1-17.

 

  • المشاركون.
  • الورقة الرئيسة: د. ابراهيم الدوسري
  • التعقيب الأول: د. إقبال درندري
  • التعقيب الثاني: د. عبدالله الدوغان
  • إدارة الحوار: د. فوزية البكر
  • المشاركون بالحوار والمناقشة:
  • د. وفاء طيبة
  • د. خالد المنصور
  • د. خالد بن دهيش
  • د. خالد الرديعان
  • د. حسين أبوساق
  • د. محمد الملحم
  • د. زياد الحقيل
  • معالي د. عبدالإله الصالح
  • أ. ماهر الشويعر
  • د. ناصر الملحم
  • أ.د. خالد الثبيتي
  • أ.د. عائشة الأحمدي
  • د. محمد الثقفي
  • أ. أحمد المحيميد
  • د. محمد المقصودي
  • د. نياف الجابري
  • د. صالحة آل شويل
  • د. حمد البريثن
  • د. فهد اليحيا
  • د. محمد العامر

[1] – خبيرة ومستشارة في مجال القياس والإحصاء وتقويم البرامج وضمان الجودة في التعليم العام والعالي.

[2] – أستاذ مشارك، كلية التربية، جامعة الملك سعود.

[3] يتجاوز تقصي العلاقة مجرد دراسة معاملات الارتباط فيما بين المتغيرات المستقلة ذاتها وبين التابع(ة) من جهة أخرى. على سبيل المثال قد تكون قيم هذه المعاملات متأثرة بوجود متغيرات أخرى (suppresser variables و/أو spurious (confounding) variables، مثلاً) أو بتأثيرات تفاعلية فيما بينها لم تؤخذ في الحسبان. ويوجد أكثر من إجراء إحصائي للتعرف على طبيعة هذه العلاقة وتحييد تأثيرها في ضوء حضور أو غياب تأثير هذه المتغيرات على الصدق التنبؤي. ويعد مفهوما الصدق المضاف ونسبة التباين المفسر للمتغير التابع (FGPA، مثلاً) أساسيين في تقدير أهمية المتغير(ات) المستقل(ة).

[4] قد يوجد معامل ارتباط مرتفع بين متغيرين، لكن هذا قد لا يعني بالضرورة أن لهما القدر من الأهمية أو الإسهام في تفسير تباين المتغير التابع. مع ذلك يظل ارتفاع قيمة معامل الارتباط مؤشراً على وجود عوامل مشتركة بين المتغيرين، أو متغيرات أخرى تؤثر عليهما معاً لم تؤخذ في الحسبان (المستوى الاقتصادي الاجتماعي، مثلاً)، وأن من الوارد مبدئياً استبعاد أحدهما دون أن تتأثر قيمة الصدق التنبؤي.

[5]  في مجال العلاقة بين  المعدل التراكمي في الثانوية وبين المعدل التراكمي في السنة الأولى و/أو الجامعي يوجد عدد لا يُحصر من الدراسات التي تبين تفوق هذا المعدل (الثانوية) على اختباري SAT و/أو ACT، سواء من حيث قيمة معاملات الارتباط أو من حيث ما يضيفه الاختبار على الصدق التنبؤي، انظر:

Steenman, Bakker and van Tartwijk (2016); Geisinger, Hawley and McCormick (2018); Beard and Marini (2015); Bridgeman, Pollack and Burton (2008); Westrick, Le, Robbins, Radunzel and Schmidt (2015); Richardson, Abraham and Bond (2012); Sawyer (2013); Geiser and Studley (2002); Noble and Sawyer (2002); Ramist, Lewis and McCamley-Jenkins (1994).

وبالنسبة لاختبار القدرات، أوضحت الدراسات التي تطرقنا إليها في معرض المقارنة مع الاختبار التحصيلي أن نسبة الثانوية العامة تتفوق باستمرار على اختبار القدرات، وفي أغلب الحالات على الاختبار التحصيلي من حيث العلاقة بالمعدل التراكمي في السنة الأولى الجامعية؛ المركز، 1428هـ، AlShamrani (2007)، القاطعي والحربي (2013)، Alnahdi (2015)، درندري (2012)).

[7]  هذه القيمة أقرب إلى المتوقع مأخوذاً في الاعتبار أخطاء القياس في الأداتين. أي أنها ستكون أعلى من هذه القيمة من خلال اختبارات تتمتع بقدر من الثبات (reliability) أو الخلو من الأخطاء أعلى مما هو ملاحظ في الأداتين.

[8] ليست ممارسة شائعة في إجراءات القبول تطبيق اختبار SAT واختبار مقنن في التحصيل، وهناك توجه عام إلى التخلي عن اختبارات SAT للتحصيل (SAT-II) في القبول.

[9] قد تحسن الإشارة هنا مقارنة اختبار القدرات منفرداً ومع درجات الثانوية من حيث الارتباط بالمعدل التراكمي. ففي دراسة AlShamrani (2007) على جامعة أم القرى وُجد أن اختبار القدرات لا يفسر سوى 1% من المعدل التراكمي للفصل الأول و0.8% من المعدل التراكمي للسنة الأولى). وفي دراسة القاطعي والحربي (2013) المشار إليها، كانت النتائج بالنسبة للعينة الأولى (حديثة النشأة) من حيث الارتباط (المصحح) والخام لاختبار القدرات بالمعدل التراكمي في السنة الأولى 0.39(0.48) و0.39(.53) بالنسبة للثانوية العامة، و0.48(.59) بالنسبة للاثنين معاً (القدرات + الثانوية).

[10]  يمكن تقييم الصدق التنبؤي من زوايا إضافية؛ مثل “الصدق الفارق”، deferential validity (الفروق في التنبؤ حسب المجموعات المطبق عليها الاختبار، والتخصصات، والكليات، الجنس، مستويات معينة (مئينية مثلاً) من المعدل التراكمي)، و”التنبؤ الفارق”، differential prediction (الفروق في معاملات الارتباط والأوزان في معادلات الانحدار حسب المجموعات والتخصصات والأقسام والجامعات وتأثيرها خفضاً، under-prediction أو رفعاً، over-prediction للدرجات المتنبئ بها أو من حيث الفروق في الخطأ المعياري للتقدير، standard errors of estimate.  كما يمكن تتبع الصدق التنبؤي لأقسام الاختبار (اللفظي والكمي) في كل من هذه الزوايا، وأيضاً في نطاقات أو مستويات معينة من توزيع الدرجات (عالية، متوسطة، منخفضة مثلاً) في المتغيرات وفقاً لاهتمامات الباحث. ويحد من هذا التقييم أمران؛ الأول أننا لم نعثر على سوى الثلاث دراسات المشار إليها في هذه الفقرة تتناول وتهتم بهذه الأنواع من أدلة الصدق لاختبار القدرات، وثانياً لا يتبين من الاستخدامات الحالية للنتائج ـأن هذه المسائل –حسب علمنا- محل اهتمام بين مستخدمي الاختبار.

[11] من المستغرب جداً أنه وبالرغم من أهمية القرارات المبنية على اختبار القدرات، وبالرغم من مرور أكثر من 16 سنة منذ تطبيقه ألا يوجد لدى المركز حتى الآن مواصفات فنية مكتوبة ولا إطار تقييمي يحدد ماهية السمات التي يقيسها أو على الأقل يساعد في تحديد مجالها بما يسمح بتمثيل هذا المجال في محتوى الاختبار. ويؤثر عدم وجود مواصفات فنية للاختبار أو إطار تقييمي ليس فقط في إمكانية بناء محتوى يتسم بصدق المحتوى، بل وفي إمكانية تفسير معنى الدرجات ومعرفة صلتها بما يتعين العمل عليه لكي يتمكن الطالب من تعلم المهارات التي يسعى الاختبار إلى قياسها.

 [13]  إدراكاً لما تعنيه هذه المتغيرات لمبدأ المساواة وتكافؤ الفرص في التعليم، قامت مؤسسة College Board هذا العام بإضافة درجة إلى درجات الطالب في اختبار SAT تأخذ في الاعتبار تأثير مجموعة من المتغيرات الاجتماعية الاقتصادية والبيئية على أداء الطلاب في الاختبار. وتتيح المؤسسة هذه المعلومات لمسؤول القبول بحيث يمكن تقييم درجات الطالب في الاختبار في ضوء هذه المتغيرات عند اتخاذ قرار القبول، انظر:

https://www.wsj.com/articles/sat-to-give-students-adversity-score-to-capture-social-and-economic-background-11557999000?mod=hp_lead_pos5

تحميل المرفقات