الورقة الرئيسة
اختبار القدرات: إلزام بما قد لا يكون له لزوم؟
كاتب الورقة: د. ابراهيم مبارك الدوسري
توطئة: في العرض التالي نقدم مجموعة من أهم المسوغات التي نراها أكثر من كافية لعدم الاستمرار في استخدام الاختبار والاعتماد بدلا من ذلك على الاختبار التحصيلي. وتركز هذه المسوغات على أبرز أدلة الصدق التي تعد أساسية من حيث الوفاء بغرض الاختبار استخداما وتفسيرا مقارنة بالاختبار التحصيلي باعتبار الأداتين تستخدما معا في قرارات القبول. ونمهد في البداية بإعطاء نبذة تاريخية عن نشأة الاختبار بعدها نستعرض في فقرات هذه المسوغات مبتدئين بموضوع الصدق التنبؤي أو مقدرة الاختبار على التنبؤ بالنجاح الأكاديمي، لننتقل بعدها إلى اعتبارات مهمة للصدق في إطار السياق التعليمي تتجاوز الناحية الإحصائية إلى ما هو أكثر أهمية من حيث المضامين والتداعيات المترتبة على اختيار أداة ما للقبول، وعلى الأخص مدى فائدة الأداة في توفير تغذية راجعة مهمة للمعنيين بالعملية التعليمية، وإسهامها في إحداث تأثيرات إيجابية مباشرة وغير مباشرة على التعليم، وقدرتها في التقليل من التداعيات السلبية المصاحبة لاستخدامها، إضافة إلى دورها من حيث تكافؤ الفرص تحقيقا للعدالة والمساواة. وهناك جوانب فنية أخرى لها تأثير مباشر على هذه الاعتبارات تتصل بالخصائص الفنية للأداة (صدق المحتوى، content validity، وتركيبة البنية الداخلية للاختبار، وأخطاء القياس الثبات وغيرها من أمور فنية) وهي مهمة جدا في تفسير النتائج واستخدامها لكن المجال يضيق عن التطرق إليها. وسيكتفى بإيرادها مرورا في إطار نقاشنا لما نعتبره من أبرز أدلة الصدق المضاميني، consequential validity للاختبار. وتجدر الإشارة هنا أن هذه المسوغات قد عرضت بالتفصيل ضمن مراجعة شاملة قمنا بها للاختبار بناءً على تكليف مركز قياس وصدر تقريرها ضمن جزئين تضمنا الكثير من التفصيلات التي يمكن الرجوع إليها فيما يخص بعض ما ورد في هذا العرض من مسائل (مركز قياس، 2019).
نبذة تاريخية: كان الباعث قبل ما يزيد عن 30 عاما لاقتراح فكرة إدخال اختبار استعداد لأغراض القبول مستندا إلى فكرة أن استخدام اختبار الثانوية (الذي كان مركزيا) لا يوفر معلومات عن قدرات واستعدادات ينظر حينها إلى أنها كانت مهمة للنجاح الأكاديمي، وأن اختبار الثانوية وحده غير كاف للتعرف على هذه القدرات والاستعدادات، إلى جانب ما يتضمنه هذا الاختبار من أخطاء في القياس تجعل الاعتماد عليه وحده في القبول أمرا غير كاف. علاوة على ذلك كانت الجامعات تعاني من نقص شديد في الإمكانات أمام تدفق الأعداد الكبيرة من خريجي الثانية التي استمرت تزداد عاما بعد عام، مما أبرز الحاجة إلى وجود أداة تعزز من سلامة قرارات القبول. وقد بذلت “وزارة المعارف” من خلال اللجنة العليا لسياسة التعليم جهودا مكثفة لإدخال هذا الاختبار انتهت بعد مواصلتها من قبل مجلس التعليم العالي إلى إقرار بناء اختبار للقدرات في عام 1422 ه وإنشاء مركز متخصص لهذا الغرض تحديدا وللتقويم في التعليم العالي بوجه عام. وقد ظل الاختبار لسنوات قصيرة يوفر معلومات جيدة من حيث هو أداة للتنبؤ بالنجاح الأكاديمي عندما يستخدم معا ودرجات الثانوية العامة. لكن الظروف تغيرت ولم يتغير الاختبار ولا أساليب استخدامه. تمثلت هذه الظروف في بناء المركز لاختبار آخر جديد هو الاختبار التحصيلي كي يستخدم جنبا إلى جنب مع اختبار القدرات ودرجات الثانوية العامة، وظهور تداعيات سلبية في الميدان نتيجة لهذا الاختبار (القدرات). ومع أنه مقبول أن يكون لدينا ثلاث أدوات أو معايير للقبول طالما أنها ستزيد في مستوى الدقة والصدق في قرارات القبول، إلا أنه اتضح بعد مرور سنوات من التطبيق أن اختبار القدرات لا يقدم معلومات إضافية أو يزيد في دقة قرارات القبول أو صدقها أكثر مما يمكن الحصول عليه من الاختبار التحصيلي. وبمعنى آخر، لسنا في حاجة إلى أكثر من أداتين –درجات الثانوية العامة + درجات الاختبار التحصيلي- للوصول إلى قرارات سليمة في القبول، وأن اختبار القدرات الذي كان مطلبا في مرحلة ما من مراحل تطور التعليم أصبح بما يحمله من تبعات تعليمية واجتماعية عبئا حان الوقت من سنوات بعيدة للتخلص منه. وقد استمررنا نقدم هذا الاختبار إلى جانب الاختبار التحصيلي دون أخذ في الاعتبار لما استجد من نتائج للعديد من الأبحاث والدراسات في هذا النوع من الاختبارات أو التحولات التي حدثت في محتواها تجاوبا مع هذه النتائج ومع الانتقادات التي وجهت إليها.
الصدق التنبؤي: يعتبر دليل الصدق التنبؤي، أي مقدرة الاختبار على التنبؤ بالأداء المستقبلي (النجاح الأكاديمي في حالة اختبار القدرات) أهم الأدلة الإحصائية جميعا للحكم على مدى وفاء الأداة بغرضها الأساس (التنبؤ). ويُقيَّم الصدق التنبؤي للاختبار من خلال تقدير قيمة معامل ارتباطه بمحك الأداء (النجاح الأكاديمي؛ المعدل التراكمي للسنة الأولى الجامعية غالبا) ومعرفة ما إن كان ذلك يفي بالغرض منه. ولما كان الإجراء المتبع حاليا في القبول يعتمد على ثلاثة معايير (درجات الثانوية العامة، والاختبار التحصيلي، واختبار القدرات)، فإن الحكم على الصدق التنبؤي يتطلب تقييم أثرها على قيمة معامل ارتباط متعدد مع محك الأداء مجتمعة معا ومنفردة مع درجات الثانوية. ومن الناحية الإحصائية، وكقاعدة عامة[1]، يتم في نماذج التنبؤ غالبا استبعاد المتغيرات (المستقلة) ذات الارتباط القوي فيما بينها لكون استخدامها معا لا يسهم في زيادة قيمة معامل الارتباط المتعدد، ويُبقى في هذه الحالة على المتغير(ات) الأقوى علاقة بالمحك أو على الأصح الأكثر تفسيرا للتباين الملاحظ[2] فيه مأخوذا في الحسبان أدلة أخرى للصدق تتجاوز دليل التنبؤ؛ مثل كفاية الأساس النظري للسمات المقاسة، كلفة أو صعوبة جمع البيانات أو بناء الأداة، إمكانية الاستفادة من النتائج في أغراض أخرى، التداعيات المترتبة على النتائج، وغير ذلك من أدلة الصدق الأخرى. و نركز باختصار شديد هنا على تقييم مقارن للعلاقة بين كل من الاختبارين (القدرات والتحصيلي) وبين المعدل التراكمي عندما يستخدم أحدهما أو كلاهما – إلى جانب درجات الثانوية- للتنبؤ. هذا ونود التنويه إلى أننا لن نتناول موضوع الصدق التنبؤي لدرجات الثانوية بالنجاح الأكاديمي[3] على افتراض أن هذه الدرجات تشكل معياراً أساسيا للقبول وليس وارداً ألا يكون ضمن الشروط.
وقبل تناول هذا التقييم من المهم الإشارة إلى أن العلاقة القوية دائما بين اختبارات الاستعداد المبنية على التحصيل وبين المبنية على القدرات تعني أن النوعين من الاختبارات يقيسان عاملا أو عوامل مشتركة فيما بينها، مما ينتج عنه ضعف إسهامهما عندما يستخدما معا –وعلى الأخص إلى جانب نسبة الثانوية- في التنبؤ بالنجاح الأكاديمي. أي أن أحدهما يجعل الآخر مكررا ويمكن الاستغناء عنه دون أن تتأثر قيمة الصدق التنبؤي. ففي هذا الجانب، تشير عدة دراسات حول العلاقة بين اختبارات التحصيل بوجه عام وبين اختبارات الاستعدادات أو القدرات العامة ((Naglieri & Bornstein (2003); Strand, Smith, & Fernandes (2006); Mackintosh (1998); Lynn and Meisenberg (2010); Kaufman et al. (2012); Thorndike & Hagen (1977); Cronbach (1977); Ebel (1975)) إلى اتجاه عام حول هذه العلاقة تبينه معاملات ارتباط مرتفعة فيما بين هذه القياسات تراوحت ما بين 0.5 و 0.9. ومع أنه لا يوجد سوى دراسات قليلة فيما يخص اختبار القدرات، مقتصر أغلبها على العلاقة بينه وبين الاختبار التحصيلي إلا أنها تأتي متسقة ومتقاربة مع هذا الاتجاه. ففي دراسة Dimitrov & Al-Harbi (2014) بلغت قيمة الارتباط بين الاختبارين 0.668. وفي دراسة للقاطعي والحربي (2013) بلغ معامل الارتباط 0.73 (معدلا لانحصار المدى، range restriction). وقد أوردت دراسة Dimitrov (2013) معامل ارتباط بين درجات الاختبارين لطلبة التخصص العلمي الثانوي قيمته، 0.652 (و0.779 لطلبة التخصص النظري الثانوي). وفي هذه الدراسة (دراسة Dimitrov (2013))، وجدنا أن معامل الارتباط بين الاختبارين (القدرات والتحصيلي) في الشرائح العليا من درجات الثانوية (أي ما فوق درجة 90) للقسم العلمي يقترب من الواحد صحيح (0.9986)[4] كما حسبناه من الجدول رقم 9 (Table 9, p. 15) في الدراسة).
وفي تقرير إحصائي قدمه المركز في ورشة حول المؤشرات التعليمية (الهيئة الوطنية لتقويم التعليم والتدريب، 16 ربيع الأول 1440) أورد معامل ارتباط بين الاختبارين بلغت قيمته 0.81. وهذه القيمة ربما تكون الأقرب للمتوقع[5]، وبخاصة أنها تشمل كامل مجتمع المفحوصين وليس عينة، إضافة إلى كونها غير متأثرة بانحصار المدى الموجود دائما في دراسات التنبؤ بالمعدل التراكمي من اختبارات القبول.
ويتضح من هذه النتائج أن ارتفاع قيم معامل الارتباط ستجعل قيمة صدق التنبؤ بالمعدل التراكمي باستخدام أي من الاختبارين وحده (إلى جانب استخدام الثانوية العامة) متقاربة إلى الحد الذي يمكن الاستغناء فيه عن أحدهما دون تأثير يذكر على هذه القيمة.
ففي دراسة أجريت على اختبار SAT واختبارات SAT في التحصيل الدراسي بجامعة كاليفورنيا، Geiser & Studley (2002)[6] وجد أن استخدام اختبار SAT لا يقدم تنبؤا أفضل بالمعدل التراكمي من الاختبارات التحصيلية كما أن ما يضيفه إلى قيمة التنبؤ يساوي صفرا أو قريبا من الصفر (مما أدى بناء على هذه النتيجة إلى استبعاد اختبار SAT من شروط القبول بالجامعة، كما دفع بمؤسسة College Board القائمة على اختبار SAT لتغيير محتواه ليعتمد على قياس التحصيل بدلا من القدرات العامة). وفي دراسة قام بها كل من Bridgman, Burton, and Cline (2004) وجد أنه باستخدام أي من الاختبارين، SAT I أو SAT II ، فإن “التأثير المتوقع على الكلية أو الجامعة سيكون محدودا؛ بمعنى أن سيتم اختيار 90% من الطلاب بأحد هذين الاختبارين، وأنه يمكن اعتبار الطلاب ناجحين بناء على أي من الاختيارين”. ويرى أن السبب وراء هذا التداخل بين النوعين من الاختبارات “يعود إلى كون التمييز بين اختبارات التحصيل وبين اختبارات الاستدلال (القدرات) متخيل أكثر من واقعي”.
وبالنسبة لاختبار القدرات، يوجد عدد محدود من الدراسات غير المنشورة. فقد أجرى المركز دراسة عام 1428ه عن الصدق التنبؤي للاختبار أوردت معاملات ارتباط بين المعدل التراكمي ودرجات كل من اختبار القدرات والاختبار التحصيلي ودرجات الثانوية للأعوام الدراسية الثلاثة 1424/1425 و1425/1426 و1426/1427 في الكليات الصحية بلغت متوسطاتها مع المعدل التراكمي للسنة الأولى خلال الثلاثة أعوام .413، .555 و.467، للقدرات والتحصيلي والثانوية العامة على التوالي. ويتضح من الدراسة أن اختبار القدرات يعطي قيمة معامل ارتباط مع المعدل التراكمي أقل من درجات الثانوية[7] والاختبار التحصيلي.
وفي دراسة للقاطعي والحربي (2013) على بيانات عينتين من طلاب الثانوية العامة في 9 جامعات (قديمة وحديثة نشأة) للعام الدراسي 1429/1430، التخصص العلمي، كانت النتائج بالنسبة للعينة الثانية (الجامعات القديمة) من حيث الارتباط الخام (والمصحح) لاختبار القدرات مع المعدل التراكمي في السنة الأولى (0.53) 0.41 و (0.55) 0.50 بالنسبة للاختبار التحصيلي. (كما كان بالنسبة للاثنين معا بدون درجات الثانوية العامة (0.58) 0.52. ويتضح هنا ضآلة ما يضيفه اختبار قدرات على التنبؤ بالمعدل التراكمي عند استخدامه مع الاختبار التحصيلي وحتى من دون وجود درجات الثانوية. وباستخدام المعايير الثلاثة معا (القدرات + التحصيلي + الثانوية العامة) كان معامل الارتباط مع المعدل التراكمي، (مصححا) والخام 0.57 (0.68). وعند حذف اختبار القدرات والإبقاء على الاختبار التحصيلي ودرجات الثانوية العامة، بلغت هذه القيمة (0.67) 0.56. أي أن الزيادة المتأتية من وجود اختبار القدرات في معادلة التنبؤ كانت 0.01، وهي قيمة تعد ضئيلة جدا، حيث لا تفسر سوى نسبة 1.35% من التباين في المعدل التراكمي. ويرى الباحثان أن تفوق الاختبار التحصيلي ونسبة الثانوية مقارنة باختبار قدرات ليس مستغربا “حيث إن المعدل التراكمي يعكس مدى التحصيل العلمي في الجامعة. لذا فالسمة المقاسة بالمعدل التراكمي وتلك المقاسة بالاختبار التحصيلي واختبارات الثانوية العامة متماثلة، وهذا انعكس على مستوى العلاقة بين هذه المتغيرات، كما أن ما يعكسه المعدل التراكمي قد لا يركز كثيرا على القدرات التي يقيسها اختبار القدرات العامة” (الحربي والقاطعي، 2103).
وفي دراسة أجراها Alnahdi (2015) على عينة مكونة من 27420 طالبا من جامعة الأمير سطام للمقارنة بين معايير القبول (نسبة الثانوية العامة، الاختبار التحصيلي، واختبار القدرات) من حيث مستوى الصدق التنبؤي بالمعدل التراكمي للفصل الأول ولعدة فصول، وجد أن استخدام اختبار القدرات إضافة إلى معياري القبول الآخرين (درجات الثانوية العامة والاختبار التحصيلي) لا ينتج عنه زيادة في نسبة تفسير تباين المعدل التراكمي للفصل الأول، أي أن النسبة تساوي صفرا (=0)، بينما لا تبعد كثيرا عن الصفر (0.2%) بالنسبة للمعدل التراكمي لعدة فصول. وتتفق نتائج هذه الدراسة مع دراسة القاطعي والحربي (2013)، ومع نتائج الدراسة التي ذكرناها بالنسبة لاختبارSAT .
وأجرى Dimitov & Al Harbi (2014) دراسة مقارنة لاختبار القدرات والاختبار التحصيلي في نتائج عينة (N=184) من أداء طلاب كلية علمية في مواد معينة: حاسب ومعلومات، رياضيات، وفيزياء مقارنة بأداء عينة (N=8664) واسعة من الطلاب في هذه المقررات بعدد من كليات العلوم. وقد وجدا أن معدل معامل الارتباط مع المعدل التراكمي (خلال 12 فصل دراسي) 0.236 بالنسبة لاختبار القدرات و0.251 بالنسبة للاختبار التحصيلي، ولهما معا 0.379. وعند وضع كل من الأقسام في نموذج الانحدار المتعدد لم يظهر أي من الأقسام (اللفظي أو الكمي) قوة تنبؤية دالة (statistically significant predictive power)، حيث جاء كل منها بأوزان انحدار قريبة من الصفر تقريبا، بل إن وزن الجزء اللفظي أتى بالسالب.
وأجرى Tsaousis (2017) من المركز دراسة على النسخة الخاصة بالتخصص النظري للاختبار لعينة مكونة من 750 طالبة. وقد وجد أن معامل الارتباط بين التحصيلي والقدرات في حدود 0.68. وبإضافة الثلاثة معايير إلى معادلة التنبؤ لم يلاحظ أن درجات اختبار القدرات ليس لها أية وزن ذو قيمة تنبؤية دالة إحصائيا.
وقبل نهاية هذا العرض عن نتائج المقارنة لعلاقة اختبار القدرات والاختبار التحصيلي مع المعدل التراكمي وما يمكن أن يضيفه الأول على قيمة الصدق التنبؤي، ينبغي التنويه أن دراسات أخرى قد أجريت على الاختبار لتقصي مستوى الأداء مأخوذا في الاعتبار بعض المتغيرات[8]، لكن المجال لا يتسع لعرض نتائجها. فإضافة إلى الدراسة التي أجراها Dimitov & Al Harbi (2014)، أجرت درندري (2012) دراسة عن العلاقة بين كل من معدل السنة التحضيرية والمعدل التراكمي للسنة الجامعية الأولى وبين كل من نسبة الثانوية العامة، اختبار القدرات، والاختبار التحصيلي. كما تقصى القاطعي (2012) تأثير توزيع الدرجات التي تعطى في عدد من مقررات التخصصات العلمية بجامعة الملك سعود على الصدق التنبؤي للمعايير الثلاثة (نسبة الثانوية العامة، التحصيلي، والقدرات)، حسب نوعية التوزيع للدرجات في هذه المقررات (اعتيادية أو ملتوية). وفي نفس الدراسة تم حساب معامل الارتباط بين المعدل التراكمي وبين الدرجة الموزونة (وهي الناتجة عن الأوزان التي تعطيها الجامعة لمعايير القبول (30% نسبة الثانوية + 30% القدرات + 40% تحصيلي). ولم نلحظ أن الدراسة أتت بنتائج تختلف كثيرا عما سبقت الإشارة إليه من دراسات بشأن الصدق التنبؤي للاختبار.
ونستخلص من هذا العدد، وإن كان محدودا، من الدراسات، أن اختبار القدرات، وإن عُدَّ أداةً مناسبة للتنبؤ منفردة أو عند استخدامها مع درجات الثانوية العامة، لن يضيف قيمة تذكر إلى الصدق التنبؤي مع وجود الاختبار التحصيلي. ويقدم Glaser (1992) رأيا حول هذه النتيجة:
“من الخطأ الاعتقاد أن قياسات خارج السياق (المجال) للقدرات العامة ستكون أكثر فعالية في التنبؤ بالنجاح الأكاديمي. ’إن أهم استعداد لغالبية ما يُتَعلم لاحقا يكمن في المعارف والمهارات ذات الصلة مباشرة بالمجال الذي سوف يحدث فيه التعلم. وعليه فإن قياس التحصيل السابق، مثل المقررات التي تدرس قبل الالتحاق بالكلية ستكون أفضل المتنبئات بدرجات المقررات في بيئة أكاديمية مماثلة (في الكلية)، وبخاصة عندما يكون التعلم الراهن معتمدا بقدر كبير على التعلم السابق. وعليه فإن الاختبارات التحصيلية تؤدي هذه الوظيفة بنفس القدر. وبقدر ما تمثل قياسات الإنجاز الجوانب المفصلية في الخبرات التي سوف تقابل لاحقا في المجال، بقدر ما تحيط على نحو أفضل بالاستعداد اللازم لذلك المجال.”
وينسجم هذا النص مع ما تؤكده الأبحاث والدراسات بأن أفضل طريقة لتقييم مهارات الاستدلال في مجالات معينة، أكاديمية مثلا، هي من خلال القياسات التي يكون محتواها مبنيا على المعرفة “خاصة المجال، domain specific knowledge“. وفحوى هذا أن الاختبارات التحصيلية المقننة متى كان مجالها مبنياً على مناهج الثانوية سوف تقدم تنبؤاً أفضل مما تقدمه اختبارات لقياس مهارات استدلالية عامة (domain general knowledge) أو حتى غامضة الماهية[9] كما هو الشأن في اختبار القدرات.
والخلاصة أنه ووفقا للتقييم من منطلق الصدق التنبؤي الذي تعد أدلته أهم معيار للحكم على مدى صلاحية الأداة التي غرضها الاختيار (selection)، يمكن القول أن اختبار القدرات في ضوء التطبيق القائم له ردفاً مع الاختبار التحصيلي يكاد يكون معدوم القيمة لا من حيث القوة التنبؤية مقارنة بالاختبار التحصيلي ولا من حيث ما يضيفه إلى الصدق التنبؤي عند استخدام الاختبارين معا ودرجات الثانوية. وعليه فإننا نرى من ناحية إحصائية بحته عدم وجود أي مبرر للاستمرار في تطبيق اختبار القدرات وجعله إلى جانب الاختبار التحصيلي ودرجات الثانوية العامة شرطا للقبول. فوق ذلك، ومن ناحية عملية، فإن ما تقوم به أغلب، إن لم يكن كل، الجامعات من استخدام لما يسمى”الدرجة الموزونة” والتي لا يعتمد اختيارها على أوزان مثالية (optimal weights) للمتغيرات وفق معادلات للتنبؤ محسوبة من بيانات فعلية سيعني إضعاف أهمية كل من هذه الاختبارات في تعزيز الصدق التنبؤي بالاستناد إلى أسس غير موضوعية.
الدور المنشود لاختبارات القبول في التحسين من العملية التعليمية: حيث أوضحت المراجعة السابقة لأدلة الصدق التنبؤي والذي يعد الأهم بالنسبة لأدوات القياس التي غرضها الاختيار، selection، أن الاختبار التحصيلي يتفوق وإن بقيم ليست كبيرة على اختبار القدرات، يأتي السؤال التالي عن أهمية مردود كل من الاختبارين من حيث المعلومات التي تتوفر من خلال نتائجهما للعملية التعليمية. وفي الأساس، تدور الإجابة عن السؤال حول مدى صلة محتوى كل اختبار بالقرارات التي ستبنى على النتائج في ضوء هذا المحتوى. وهنا ربما يحسن التوقف قليلا للتعرف على طبيعة هذا المحتوى بالنسبة لكل من الاختبارين.
من ناحية عامة، يركز اختبار القدرات على قياس مهارات استدلال عامة (لفظية وكمية) ليست مرتبطة بالضرورة بصف دراسي أو مادة دراسية معينة، بينما يركز الاختبار التحصيلي على قياس التحصيل في عدد من المواد الدراسية التي تقدم في نهاية المرحلة الثانوية. ويكمن الاختلاف بين الاختبارين في طريقة اختيار المهام (البنود) الموجودة لمحتوى كل منهما. ففي اختبار القدرات يبذل جهد كبير لبناء مهام اختبارية لا يكون الأداء عليها معتمدا قدر الإمكان على الاتقان لمنهج مادة دراسية معينة، والحصول في النهاية على اختبار ضعيف الصلة قدر الإمكان بالاختبارات التي تقيس التحصيل. في المقابل، يجري التركيز في الاختبار التحصيلي على اختيار تلك البنود التي تعكس ما تم للطالب تعلمه ضمن مناهج مواد دراسية معينة. وينظر في الغالب إلى الاختلاف فيما يقيسه الاختباران أنه اختلاف في مستوى التركيز ضمن متصل طرفاه التحصيل والقدرات، أو بالأحرى مدى خصوصية المحتوى من حيث الصلة بالمعارف والمهارات التي يفترض أنه تم تحصيلها في مادة دراسية معينة خلال فترة زمنية محددة، أو عموميته بافتراض أن هذه المعارف والمهارات تمت تنميتها تراكميا عبر سنوات من الخبرة وتعلم العديد من المواد الدراسية. لكن هذا الاختلاف يحمل الكثير من المضامين المهمة بالنسبة لنوعية المعلومات المتأتية من هذا الاختبارات من زاوية مدى إفادتها في خدمة القرارات التعليمية. فبالنسبة لاختبار القدرات وباعتباره يقوم على قياس مهارات استدلالية عامة ليست مستندة بالضرورة على منهج مادة دراسية معينة، من الطبيعي ألا تقدم نتائج الاختبار معلومات محددة أو بالأحرى تفصيلية بخصوص منهج هذه المادة، أو أية مادة أخرى ربما تساعد في تكييف منهجها أو تعديل طرق تدريسها وتقديمها. ومع أنه لا يمكن التقليل بأية حال من أهمية المهارات الاستدلالية العامة في التعلم اللاحق- وهو ما أوضحته نتائج دراسات الصدق التنبؤي، وكان الأصل في الأساس لجعل اختبار القدرات أحد شروط القبول، إلا أن الإشكالية تنشأ من محدودية قيمة المعلومات التي يوفرها في قرارات تعليمية أخرى تتجاوز قرارات القبول ولا تقل عنه أهمية. وقد كانت هذه الإشكالية هي الدافع الأساس في تحول اختبار SAT -وهو الاختبار الذي اعتمدت نسخته القديمة (1995) لتكون النموذج لمحتوى اختبار القدرات- ليكون تقويما للتحصيل بدلا من التقويم لمهارات استدلالية عامة. فحول هذه النسخة والتغييرات الطفيفة التي أدخلت عليها قبل أن يتحول محتوى الاختبار ليكون تحصيليا، سيقت انتقادات عدة، نجد أنها وهي تنطبق على اختبار القدرات تؤكد في الوقت نفسه أهمية الاختبارات التحصيلية المقننة. وتركز أغلب هذه الانتقادات في نقص القيمة التشخيصية والتقييمة للاختبار سواء من حيث المعلومات التي يوفرها للطالب أو للمعلم أو للمدرسة أو للمنهج. إذ ليس واضحا كيف من النتائج يمكن تكييف المناهج أو أساليب التدريس والتعلم في المدارس أو الكليات بحيث تنمى تعلم مهارات وقدرات غير مضمنة بنودها في المناهج أو في نشاطات التدريس. وباعتبار الاختبار يقيس قدرات كامنة و/أو نامية قد يترسخ الشعور لدى الطالب بأنه ما من جد أو اجتهاد في التعلم أو التحصيل -خلاف التمرن على الاختبار- سيكون له تأثير على تحسين درجاته. إضافة إلى انتقادات أخرى لا يتسع المجال لإيرادها.
وبالمقارنة فإن اختبارا مقننا للقبول جيد التصميم ينبني محتواه على ما يقدم من مناهج في المرحلة الثانوية وينسجم مع ما يُسعى إلى بلوغه من أهداف سيوفر الكثير من المعلومات ذات الأهمية للتحسين من العملية التعليمية. وحاليا تتوجه الجهود في تصميم اختباري SAT و ACT وهما الأكثر استخداما في القبول نحو التركيز على تقييم التحصيل في مناهج المرحلة الثانوية، سعيا إلى أن تساعد المعلومات المتأتية من نتائج هذه الاختبارات في:
- توجيه النشاطات والجهود التي تبذل في هذه المرحلة نحو التركيز على الأهداف والنواتج الأكثر أهمية.
- القيام بدور فاعل ومؤثر في قيادة العملية التدريسية والتعليمية وتوجيهها نحو المهم والأبرز في هذه المرحلة. وهو دور يعد من أبرز الأدوار في وظيفة التقويم.
- توفير دافعية قوية لتحفيز الطالب نحو بذل المزيد من الجد والاجتهاد والتركيز على ما تقدمه المدرسة من مناهج باعتبار ذلك الوسيلة الأجدى والأسلم لتعزيز فرص في القبول.
- توفير معلومات للقائمين على العملية التعليمية والمهتمين بها ذات صلة مباشرة بما يمكن القيام به من جهود لتعزيز فرص التعلم، سواء على مستوى الجامعات أو التعليم العام؛ من معلمين ومشرفين وطلاب وأولياء أمور.
- توفير معلومات تقويمية يمكن أن تتكامل مع الجهود التي تقوم بها الوزارة والهيئة الوطنية لتقويم التعليم والتدريب في مجال التقييمات الوطنية والدولية لرصد مستوى التقدم والانجاز التعليمي.
وإذ يؤكد هذا العرض المختصر، القناعة بأفضلية الاختبارات التحصيلية المقننة على اختبارات القدرات العامة من حيث المردود التعليمي، تحسن الإشارة إلى أن الأخيرة يمكن وبسهولة أن تصمم لتقيس مختلف المستويات المعرفية من المعارف والمهارات والقدرات (بما في ذلك مهارات التفكير العليا) على نحو لا يقل دقة وصدقا عما يمكن أن يقاس من خلال الأولى.
تقليل أثار التداعيات السلبية: لا تخلو الاختبارات، وبخاصة تلك التي يترتب على نتائجها قرارات حاسمة من تداعيات غير مقصودة تتبدى في ممارسات أو مضامين ترتبط بالاستخدام والتفسير. ففي جانب الممارسات تكفي الإشارة إلى ما ينفذ على مستوى المدارس ومكاتب التعليم بهدف مساعدة الطلبة في رفع درجاتهم على اختبارات القبول، تجاوبا مع رغبة الوزارة في تقليص “الفجوة” بين نتائج هذه الاختبارات ونسبة الثانوية العامة. ومع أن هذه النشاطات والفعاليات، متى أحسن توجيهها بحيث تؤدي في النهاية إلى تحسين للعملية التعليمية في مجملها، وليس الاقتصار فقط على التحسين من الدرجات، ستكون مهمة بل ومطلوبة من أجل استثمار ما قد توفره نتائج الاختبارات من معلومات مهمة، إلا أن الخشية قائمة بشأن ما قد تحمله هذه النشاطات والفعاليات من آثار قد لا تكون إيجابية. فمن جهة يخشى أن تتركز الجهود على تنمية مهارات أخذ الاختبارات بدلا من تنمية مهارات التعلم التي يؤكد عليها المنهج، أو أن يأخذ المحتوى المحدد فقط في الاختبار أولوية في ممارسات التدريس. ومن جهة أخرى، هناك الكثير من الجهد والكلفة والوقت الذي قد يخصص على التدريب للتحسين من فرص الحصول على درجات عالية في هذه الاختبارات بدلا من أن يصرف لتقوية المنهج أو تقوية العملية التدريسية. وباعتبار اختبار القدرات يأخذ نصيبه من هذه النشاطات والفعاليات، بما في ذلك التدريب، فإن جعله غير متطلب للقبول يخفف كثيرا من الأعباء التي تتحملها المدرسة والطالب. علاوة على ذلك، فإنه بينما يمكن اعتبار النشاطات والفعاليات التي تتم فيما يخص الاختبار التحصيلي مقبولة-في حدود- باعتبار أن محتوى الاختبار وثيق الصلة بالمنهج وما يتم تدريسه، إلا أنها ليست مقبولة بالقدر نفسه لاختبار القدرات. فبخلاف الاختبار التحصيلي، لا تعد المهارات الاستدلالية التي يقيسها الاختبار مرتبطة مباشرة بالمنهج أو بما يدرس فعليا. بل أن الغموض الذي يكتنف معناها وصعوبة تفسير الأداء عليها ونقص المعلومات المتوفرة لمساعدة الطالب وللمعلم لفهم ما يعنيه الأداء عليها يجعل من الصعوبة بمكان تعرف الكيفية التي يمكن من خلالها تنمية تلك المهارات بصورة مباشرة.
وفي جانب المضامين، قد يتولد شعور لدى العديد من الطلاب بأن الجد والاجتهاد فيما تقدمه المدرسة لن يكون نافعا في الحصول على درجة عالية في الاختبار. إلى جانب ذلك، هناك مضامين سلبية لتفسير الأداء على هذه الاختبارات نظرا لارتباطها بمفهوم الذكاء والقدرات الكامنة، وما ينجم عن هذا من تكوين انطباعات عن الحدود القصوى لقدرات الأشخاص بناءً على الدرجات في هذه الاختبارات والتعامل معهم على هذا الأساس، وما قد يعنيه ذلك ضمنا للممارسات والمواقف التعليمية.
تكافؤ الفرص واختبارات القبول: يترتب على نتائج اختبارات القبول آثار مصيرية حاسمة تشكل المسارات المهنية والحياتية للعديد من الطلاب والأسر بالرغم من وجود العوامل والمتغيرات المؤثرة في هذه النتائج والتي لا يملكون وسيلة لتغييرها[10]. ومن هذه العوامل يشار إلى المستوى الاقتصادي-الاجتماعي للأسر والاختلافات القائمة فيما بينها من حيث الإمكانات والمصادر المتاحة لها لتوفير التدريب والتهيئة المناسبة لهذه الاختبارات والحصول على درجات توسع من خيارات القبول أما أبنائها. وتلعب الظروف البيئية للمدرسة وإمكاناتها من معلمين وإدارة ومرافق وغير ذلك من متغيرات دور مهما في توسيع الفروق بين الدرجات، ليس بسبب الاختلاف أصلا في مستويات القدرات التي يملكها الطلاب، بل في عدم تساوي تلك الظروف. ومع أن هذه العوامل والمتغيرات التي لا دخل للطلاب بها قائمة في كل الاختبارات وبخاصة واسعة التطبيق، إلا أن بالإمكان التقليل من آثارها من خلال تبني عدد من الوسائل والأدوات. ولا يتسع المجال هنا لمناقشة ما هو ممكن في هذا المجال، إلا أننا نعتبر عدم اشتراط أخذ اختبار القدرات جنيا إلى جنب مع الاختبار التحصيلي خطوة من أبرز وأهم تلك الوسائل والأدوات. وسينجم عن تبني هذه الخطوة ليس فقط حذف أعباء مالية تثقل كاهل العديد من الأسر، بل وفي التقليل من فرص عدم المساواة في واحد من أبرز المتغيرات المهمة لمستقبل العديد من الطلاب. فوق هذا ستعني الخطوة الحد من الأضرار التي ستتعرض لها مصائر العديد من الطلاب بسبب عدم تساوي ظروف أو عوامل لا يملكون الفرص مثل غيرهم لتبديلها.
اقتباس ختامي: لعلنا في سياق دعوتنا إلى عدم الاستمرار في تطبيق اختباري القدرات والتحصيلي معا شرطا في القبول، أن ننهي العرض باقتباس بعض الفقرات الواردة في تقرير اللجنة الدائمة الخاصة باستخدامات الاختبارات المقننة في القبول بالكليات، Commission on the Use of Standardized Tests in Undergraduate Admission (NACAC, 2008)، وهي لجنة منبثقة عن الجمعية الوطنية الاستشارية للقبول بالكليات، National Association for College Admission Counseling (NACAC).
“……..تدعو اللجنة أعضاء الجمعية إلى تفهم وفهم التمرن على الاختبارات، والأخذ في الاعتبار الفروق بين الطلاب من حيث المقدرة على الوصول إلى معاهد التدريب ومواده. كما ترى أنه بالقدر الذي تجعل فيه الجامعات والكليات الاختبارات شرطا للقبول ستنتعش سوق التمرن عليها. كما يتفق أعضاء اللجنة على أن أفضل تدرب ممكن يجب أن يكون على المعرفة الأساسية والمهارات التي تساعد على تهيئة الطلاب للنجاح.
وترى اللجنة أنه بينما تعد اختبارات القبول مفيدة لعدد من الكليات، إلا أنها ثانوية من حيث قوة صلتها بأداء الطالب في المقررات الدراسية ذات التحدي. ولذا ينبغي ألا تتركز جهود المدارس لتهيئة الطلاب على اختبار للقبول بعينه، بل إلى تقوية المنهج وإلى تقوية أداء الطلاب في المقررات الدراسية باعتبارها مؤشرات للجاهزية.
وتدرك اللجنة أن النقاش بشأن عدالة اختبارات القبول لن يحسم. لكنها تدرك أيضا أن نوعا من الاعتبار يجب أن يؤخذ في الحسبان للفروق الموجودة قبلا، وإن كان هذا الاعتبار يظل متأثرا بالاعتبار المبالغ فيه من قبل المسؤولين في التعليم لهذه الاختبارات. وستظل هذه الفروق الموجودة قائمة لاعتبارات أخرى، ومن المهم ألا تتأثر فرصة الطالب على النجاح في الكلية بنتائج هذه الاختبارات.
…. إن استخدام اختبارات التحصيل في القبول له نتائج مهمة، فهو يبعث رسالة قوية إلى الطلاب بأن تعلمهم للمواد الدراسية واتقانها-وليس التدرب على كيفية الحصول على درجة عالية في الاختبارات- هو الطريق الصحيح للقبول وللتعلم. وهذا بدوره يساعد المدارس على التحسين من مناهجها وطرق تدريسها، ويزيد من الشفافية. علاوة على ذلك فإن المواءمة بين اختبارات القبول والمنهج سيؤدي إلى تخفيف نقص المساواة في فرص التدرب. …. وترى اللجنة أنه باستخدام اختبارات التحصيل لن تفقد الجامعات سوى القليل أو لا شيء من المعلومات، لكنها ستسهم بشكل واضح في التأثير على التدريس والمنهج في المدارس. وترى اللجنة أن أحد التوجهات المستقبلية لاختبارات القبول يجب أن يكون نحو التبني الواسع لاختبارات تعكس بالضبط ما يقدم في المرحلة الثانوية من مقررات”.
ملحوظات
[1] يتجاوز تقصي العلاقة مجرد دراسة معاملات الارتباط فيما بين المتغيرات المستقلة ذاتها وبين التابع(ة) من جهة أخرى. على سبيل المثال قد تكون قيم هذه المعاملات متأثرة بوجود متغيرات أخرى (suppresser variables و/أو spurious (confounding) variables، مثلا) أو بتأثيرات تفاعلية فيما بينها لم تؤخذ في الحسبان. ويوجد أكثر من إجراء إحصائي للتعرف على طبيعة هذه العلاقة وتحييد تأثيرها في ضوء حضور أو غياب تأثير هذه المتغيرات على الصدق التنبؤي. ويعد مفهوما الصدق المضاف ونسبة التباين المفسر للمتغير التابع (FGPA، مثلا) أساسيان في تقدير أهمية المتغير(ات) المستقل(ة).
[2] قد يوجد معامل ارتباط مرتفع بين متغيرين، لكن هذا قد لا يعني بالضرورة أن لهما القدر من الأهمية أو الإسهام في تفسير تباين المتغير التابع. مع ذلك يظل ارتفاع قيمة معامل الارتباط مؤشرا على وجود عوامل مشتركة بين المتغيرين، أو متغيرات أخرى تؤثر عليهما معا لم تؤخذ في الحسبان (المستوى الاقتصادي الاجتماعي، مثلا)، وأن من الوارد مبدئيا استبعاد أحدهما دون أن تتأثر قيمة الصدق التنبؤي.
[3] في مجال العلاقة بين المعدل التراكمي في الثانوية وبين المعدل التراكمي في السنة الأولى و/أو الجامعي يوجد عدد لا يحصر من الدراسات التي تبين تفوق هذا المعدل (الثانوية) على اختباري SAT و/أو ACT، سواء من حيث قيمة معاملات الارتباط أو من حيث ما يضيفه الاختبار على الصدق التنبؤي، انظر:
Steenman, Bakker and van Tartwijk (2016); Geisinger, Hawley and McCormick (2018); Beard and Marini (2015); Bridgeman, Pollack and Burton (2008); Westrick, Le, Robbins, Radunzel and Schmidt (2015); Richardson, Abraham and Bond (2012); Sawyer (2013); Geiser and Studley (2002); Noble and Sawyer (2002); Ramist, Lewis and McCamley-Jenkins (1994).
وبالنسبة لاختبار القدرات، أوضحت الدراسات التي تطرقنا إليها في معرض المقارنة مع الاختبار التحصيلي أن نسبة الثانوية العامة تتفوق باستمرار على اختبار القدرات، وفي أغلب الحالات على الاختبار التحصيلي من حيث العلاقة بالمعدل التراكمي في السنة الأولى الجامعية؛ المركز، 1428ه، AlShamrani (2007)، القاطعي والحربي (2013)، Alnahdi (2015)، درندري (2012)).
[4] تعني هذه القيم المرتفعة أن أحد الاختبارين كاف عن الآخر فيما يخص غرض القبول. كونهما يكررا نفس النتيجة بالنسبة للدرجات التي تساوي أو تزيد عن 90 في الثانوية العامة. وحيث يشكل هؤلاء حسب الشريحة في عينة الدراسة 95353 طالبا وطالبة أو ما نسبته 46% من كامل العينة (207433 )، فإنه يمكن على الأقل الاستغناء عن أحدهما بالنسبة ل 46% من الطلاب. علاوة على ذلك تشير هذه النتيجة إلى أن معامل الارتباط سيكون مرتفعا –وإن لم يكن بنفس القدر- في الدرجات الأقل من هذه الشريحة، مما يعني زيادة نسبة الطلاب الذي لن يكون تطبيق الاختبارين معا ذا جدوى. وينبغي هنا أن ننوه بأن هذه المعاملات بنيت على قيم المتوسطات في الاختبارات الثلاثة ضمن 10 فترات متساوية للدرجات الواقعة بين 90 إلى 100 في اختبار الثانوية العامة.
[5] هذه القيمة أقرب إلى المتوقع مأخوذا في الاعتبار أخطاء القياس في الأداتين. أي أنها ستكون أعلى من هذه القيمة من خلال اختبارات تتمتع بقدر من الثبات (reliability) أو الخلو من الأخطاء أعلى مما هو ملاحظ في الأداتين.
[6] ليست ممارسة شائعة في إجراءات القبول تطبيق اختبار SAT واختبار مقنن في التحصيل، وهناك توجه عام إلى التخلي عن اختبارات SAT للتحصيل (SAT-II) في القبول.
[7] قد تحسن الإشارة هنا مقارنة اختبار القدرات منفردا ومع درجات الثانوية من حيث الارتباط بالمعدل التراكمي. ففي دراسة AlShamrani (2007) على جامعة أم القرى وجد أن اختبار القدرات لا يفسر سوى 1% من المعدل التراكمي للفصل الأول و0.8% من المعدل التراكمي للسنة الأولى). وفي دراسة القاطعي والحربي (2013) المشار إليها، كانت النتائج بالنسبة للعينة الأولى (حديثة النشأة) من حيث الارتباط (المصحح) والخام لاختبار القدرات بالمعدل التراكمي في السنة الأولى 0.39(0.48) و0.39(.53) بالنسبة للثانوية العامة، و0.48(.59) بالنسبة للاثنين معا (القدرات + الثانوية).
[8] يمكن تقييم الصدق التنبؤي من زوايا إضافية؛ مثل “الصدق الفارق”، deferential validity (الفروق في التنبؤ حسب المجموعات المطبق عليها الاختبار، والتخصصات، والكليات، الجنس، مستويات معينة (مئينية مثلا) من المعدل التراكمي)، و”التنبؤ الفارق”، differential prediction (الفروق في معاملات الارتباط والأوزان في معادلات الانحدار حسب المجموعات والتخصصات والأقسام والجامعات وتأثيرها خفضا، under-prediction أو رفعا، over-prediction للدرجات المتنبئ بها أو من حيث الفروق في الخطأ المعياري للتقدير، standard errors of estimate. كما يمكن تتبع الصدق التنبؤي لأقسام الاختبار (اللفظي والكمي) في كل من هذه الزوايا، وأيضا في نطاقات أو مستويات معينة من توزيع الدرجات (عالية، متوسطة، منخفضة مثلا) في المتغيرات وفقا لاهتمامات الباحث. ويحد من هذا التقييم أمران؛ الأول أننا لم نعثر على سوى الثلاث دراسات المشار إليها في هذه الفقرة تتناول تهتم بهذه الأنواع من أدلة الصدق لاختبار القدرات، وثانيا لا يتبين من الاستخدامات الحالية للنتائج ـأن هذه المسائل –حسب علمنا- محل اهتمام بين مستخدمي الاختبار.
[9] من المستغرب جدا أنه وبالرغم من أهمية القرارات المبنية على اختبار القدرات، وبالرغم من مرور أكثر من 16 سنة منذ تطبيقه ألا يوجد لدى المركز حتى الآن مواصفات فنية مكتوبة ولا إطار تقييمي يحدد ماهية السمات التي يقيسها أو على الأقل يساعد في تحديد مجالها بما يسمح بتمثيل هذا المجال في محتوى الاختبار. ويؤثر عدم وجود مواصفات فنية للاختبار أو إطار تقييمي ليس فقط في إمكانية بناء محتوى يتسم بصدق المحتوى، بل وفي إمكانية تفسير معنى الدرجات ومعرفة صلتها بما يتعين العمل عليه لكي يتمكن الطالب من تعلم المهارات التي يسعى الاختبار إلى قياسها.
[10] إدراكا لما تعنيه هذه المتغيرات لمبدأ المساواة وتكافؤ الفرص في التعليم، قامت مؤسسة College Board هذا العام بإضافة درجة إلى درجات الطالب في اختبار SAT تأخذ في الاعتبار تأثير مجموعة من المتغيرات الاجتماعية الاقتصادية والبيئية على أداء الطلاب في الاختبار. وتتيح المؤسسة هذه المعلومات لمسؤول القبول بحيث يمكن تقييم درجات الطالب في الاختبار في ضوء هذه المتغيرات عند اتخاذ قرار القبول، انظر:
المراجع
اللغة العربية
درندري، إ. (2012). اختبار القبول بالجامعات السعودية في ضوء التوجهات الحديثة في صدق الاختبار. في كتاب وقائع المؤتمر الدولي الأول للقياس والتقويم: معايير القبول في التعليم العالي. المركز الوطني للقياس والتقويم في التعليم العالي، 18-20/ 1/ 1434 هـ، الرياض، المملكة العربية السعودية.
القاطعي، ع. والحربي، خ. (2013) قدرة معايير القبول الجامعي على التنبؤ بالمعدل التراكمي للسنة الأولى في بعض الجامعات السعودية. المركز الوطني للقياس.
المركز الوطني للقياس والتقويم (يناير 2019). مشروع تطوير اختبار “قدرات”. إعداد مؤسسة سبَّارة للتقويم التربوي والاختبارات التعليمية بالتعاون مع Buros Center for Testing (University of Nebraska-Lincoln).
المركز الوطني للقياس والتقويم في التعليم العالي (2005). تقرير مختصر عن بعض الدراسات التي تمت على اختبارات المركز والاختبارات ذات العلاقة، وحدة البحوث والدراسات.
الهيئة الوطنية لتقويم التعليم والتدريب (2018). نتائج اختبارات قياس. ورشة المؤشرات التعليمية، 16 ديسمبر 2018.
اللغة الانجليزية
Alnahdi G. H. (2015). Aptitude tests and successful college students: The predictive validity of the General Aptitude Test (GAT) in Saudi Arabia. International Educational Studies, 8(4), 1–6.
Alshumrani, S. A. (2007). Predictive validity of the General Aptitude Test and High School Percentage for Saudi undergraduate students (Doctoral dissertation, University of Kansas, Ann Arbor, MI).
Beard, J., & Marini, J. P. (2015). Validity of the SAT for predicting first-year grades: 2012 SAT validity sample (Statistical report 2015-2). New York: College Board.
Bridgeman, Pollack, and Burton (2008). Predicting Grades in different types of college courses. College Board Research Report No. 2008-1. Retrieved from: https://www.ets.org/Media/Research/pdf/RR-08-06.pdf
Bridgman, Burton, and Cline (2004). Replacing reasoning tests with achievement tests in university admission: Does it make a difference. In R. Zwick (Ed.), Rethinking the SAT. New York: Routledge.
Cronbach, L. J. (1977). Educational Psychology. New York: Harcourt Brace Jovanovich, Inc.
Dimitov, D., & Al Harbi, K. A. (2014). Examining students’ performance on pre-college tests (GAT and SAAT), college GPA, and post-college tests (PGAT and Teacher Test): The case of science colleges at Saudi universities (Report No. TR073-2014). Riyadh, KSA: National Center for Assessment in Higher Education.
Dimitov, D., & Al Harbi, K. A. (2014). Examining students’ performance on pre-college tests (GAT and SAAT), college GPA, and post-college tests (PGAT and Teacher Test): The case of science colleges at Saudi universities (Report No. TR073-2014). Riyadh, KSA: National Center for Assessment in Higher Education.
Dimitrov, D. (2013). High school assessment (lenient, adequate, strict) relative to the NCA assessments SAAT and GAT (TR033-2013). Riyadh, Saudi Arabia: National Center for Assessment in Higher Education.
Ebel, R. L. (1975). Essentials of Educational Measurement. New Jersey: Prentice-Hall, Inc.
Geiser, S. & Studley, R. (2002). UC and the SAT: Predictive validity and differential impact of the SAT I and SAT II at the University of California. Educational Assessment, 8, 1–26.
Geisinger, K. F., & Hawley, L. R., McCormick, C. (2018). The validation of tests in higher education. In Secolsky, C., & Denison, D, B. (Eds.) Handbook of measurement, assessment, and evaluation in higher education (2nd ed., pp. 147-160). New York: Routledge.
Glaser, R. (1992). Expert knowledge and processes of thinking. In D. F. Halpern (Ed.), Enhancing thinking skills in the sciences and mathematics. Hillsdale, NJ: Lawrence Erlbaum.
Kaufman, S. B., Reynolds, M. R., Liu Xin, Kaufman, A. S., McGrew, K. S. (2012). Are cognitive g and academic achievement g one and the same g? An exploration on the Woodcock–Johnson and Kaufman tests. Intelligence, 40, 123-138.
Lynn, R., Meisenberg, G (2010). National IQs Calculated and Validated for 108 Nations. Intelligence, 38, 353-360
Mackintosh, N. J. (1998). IQ and Human Intelligence. New York: Oxford University Press
NACAC (2008). Report of the Commission on the Use of Standardized Tests in Undergraduate Admission. Arlington, VA: National Association for College Admission Counseling. Retrieved from: https://files.eric.ed.gov/fulltext/ED502721.pdf
Naglieri, J., & Bornstein, B. (2003). Intelligence and Achievement: Just How Correlated Are They? Journal of Psychoeducational Assessment, 21, 244-260.
http://dx.doi.org/10.1177/073428290302100302
Noble, J. and Sawyer, R. (2002) Predicting different levels of academic success in college using high school GPA and ACT composite score. ACT Research Report Series 2002-2004. www.act.org/research/policymakers/pdf/PredictiveValidity.pdf
Ramist, Lewis and McCamley-Jenkins (1994). Student Group Differences in Predicting College Grades: Sex, Language, and Ethnic Groups. College Board Report No. 93-1. ETS RR No. 94-27
Richardson, M., Abraham, C., Bond, R. (2012). Psychological correlates of university students’ academic performance: A systematic review and meta-analysis. Psychological Bulletin, 138(2), 353-387.
Sawyer, R. (2013). Beyond Correlations: Usefulness of high school GPA and test scores in making college admissions decisions. Applied Measurement in Education, 26(2), 89-112.
Steenman, S. C., Bakker, W. E., & van Tartwijk, J. W. F. (2016). Predicting different grades in different ways for selective admission: disentangling the first-year grade point average. Studies in Higher Education, 41(8), 1408-1423.
Thorndike, R. L., Hagen, E. P. (1977). Measurement and Evaluation in Education and Psychology. New York: Wiley.
Tsaousis, I. (2017). Common characteristics and incremental validity of the constructs underlying General Aptitude Test (GAT) and Standard Achievement Admission Test (SAAT) – Art Major (TR195-2017). Riyadh, Saudi Arabia: National Center for Assessment in Higher Education.
Westrick, P. A., Le, H., Robbins, S. B., Radunzel, J. M. R., Schmidt, F. L. (2015) College performance and retention: A meta-analysis of the predictive validities of ACT scores, high school grades, and SES. Educational Assessment, 20(1), 23-45