تحليل الاختبارات
التحليل الإحصائي للاختبارات التحصيلية
Statistical Analysis for the Achievement Test
يتم اختبار الاختبار الجيد بطريقتين هما :
أولاً: التحليل الإحصائي لنتائج الاختبار ، وفى هذه الطريقة يعامل الاختبار كوحدة أثناء تحليل نتائجه ، كي يكتشف هل هو اختبار جيد أم لا.
ثانياً: تحليل الأسئلة Item Analysis ، وفى هذه الطريقة يجعل كل سؤال على حده تمهيداً لتحسينه ، ومن ثم يحسن الاختبار بأكمله.
والطريقة الأولى كلية Holistic ، أما الثانية جزئية Atomistic ونحن نلجأ إلى التحليل الإحصائي في الاختبارات للوقوف على الفروق الفردية التي توجد بين المفحوصين أي ترتيب المفحوصين حسب تحصيلهم ، وعادة توزع الاختبارات التحصيلية للمفحوصين توزيعاً طبيعيا أو وفق منحنى التوزيع الطبيعي ، أي إلى ممتازين ومتوسطين ودون المتوسط ، أما عندما يكون الهدف من الاختبار معرفة مدى إتقان الطلاب للذي درسوه ، فإننا نكون بصدد اختبار إتقان معرفة مدى إتقان Mastery Test ، وفى هذه الحالة يجب ألا تتوقع توزيع علامات الطلاب توزيعاً طبيعياً ، بل يجب أن تتوقع توزيع علاماتهم قرب النهاية العظمى ، لأننا نسأل من حد أدنى عن المعرفة يجب أن يمتلكها كل طالب. ومن اختبارات الإتقان نأتي عادة بأسئلة تعطى ما درسه الطلاب.
ويتوقف التحليل الإحصائي للاختبار على الغرض منه ، وعلى من يقوم به ، فإذا كان من يقوم به معلماً غير ملماً بالجوانب الإحصائية فإنه يمكنه أن يكتفى بالملاحظات التالية :
1- يجب أن لا يكون في الاختبار أسئلة أجاب عليها جميع الطلاب أو أسئلة لم يجب عليها أحد ، لأن مثل هذه الأسئلة لا توضح الفروق الفردية بين الأفراد ، إلا أن بعض علماء النفس يرى أن الأسئلة السهلة التي يجيب عليها كل الطلاب لها فائدة سيكولوجية ، وهى رفع معنويات الضعفاء إلا أنه يجب أن توجد في نطاق ضيق حتى يمكن أن تظهر الفروق الفردية بين الطلاب ، هذا كما أن الأسئلة الصعبة التي لا يستطيع أحد الإجابة عليها لها آثار سيئة ، إذ تثير الفزع لدى الطلاب كما تشعرهم باليأس.
2- يجب أن يكون المتوسط الحسابى فى منتصف العلامات الممكنة (مدى العلاقات) أى التى يمكن الحصول عليها فإذا كان لدينا 100 سؤال موضوعى وكان متوسط علامات الطلاب 55 ومدى العلامات يتراوح بين 15 – 96% فيعد الامتحان جيداً. أما إذا كان المتوسط 35 وكانت أعلى درجة 60 يعد الامتحان صعباً ، كذلك إذا كان مدى العلامات يتراوح بين 70 – 100% ومتوسط العلامات 85% فإننا نعتبر الامتحان سهلاً.
أما إذا كان المعلم ملماً بالإحصاء فيجب أن يقوم بالجوانب التالية بالإضافة إلى ما سبق :
1- أن يوزع العلامات إلى فئات ويحدد تكراراتها ثم يقوم بتمثيل النتائج برسم بيانى ؛ ليرى هل يتفق منحنى التوزيع الطبيعى أم لا.
2- أن يستخرج الوسط الحسابى أو الوسيط.
3- يوجد الإرباعيات ؛ ليرى كيف يتوزوع الطلاب بصورة إجمالية وليوزع الطلاب على شعب تتناسب وقدراتهم.
4- أن يحول العلامات التى رتب مئينياً ودرجات معيارية يسهل تفسيرها.
5- أن يوجد معامل الصدق والثبات للاختبار.
6- أن يوجد الزمن المناسب للاختبار.
تحليل الأسئلة Item analysis :
يقصد بتحليل الأسئلة استخراج معاملات السهولة والصعوبة والتمييز وكذلك تحديد فاعلية المشتقات (المجموعات) :
1- معامل السهولة :
عدد الذين أجابو إجابة صحيحة عن السؤال
معامل السهولة = ـــــــــــــــــــــــ × 100
عدد من حاولوا الإجابة عليه من المفحوصين
ويحدد عدد من حاولوا الإجابة عن السؤال بجميع الطلاب الذين أجابوا عن السؤال إجابة صحيحة أو خاطئة معاً ، وهو يمثل عدد الطلاب الكلى ما عدا الطلاب الذين حذفوا السؤال :
مثال : فى صف يتألف من 25 طالباً بلغ عدد الذين أجابوا عن السؤال رقم 2 إجابة صحيحة 18 طالباً – فإذا كان عدد من حاولوا الإجابة عن السؤال 20 طالباً فكم يكون معامل السهولة :
عدد الذين أجابوا إجابة صحيحة عن السؤال
معامل السهولة = ـــــــــــــــــــــــ × 100
عدد من حاولوا الإجابة عليه من المفحوصين
18
= ـــ × 100% = 90%
20
ويمكن وضع معامل السهولة فى صورة كسر عشرى ويصبح :
18
معامل السهولة = ـــ = 0.90
20
(وهذا يوضح أن السؤال سهل بالنسبة إلى 90% من الطلاب.
2- معامل الصعوبة Difficulty Index
عدد من أخطأوا فى الإجابة عن السؤال
معامل السهولة = ـــــــــــــــــــــ × 100
عدد من حاولوا الإجابة عليه عن السؤال
ويلاحظ أن :
معامل السهولة + معامل الصعوبة = 1 بالنسبة للسؤال ومع ذلك إذا عرف أن معامل فإنه يمكن الحصول على الآخر لسؤال معين فى اختبارات المقال.
معامل السهولة = يعرف معامل السهولة للسؤال فى اختبار المقال على أنه:
معدل علامات السؤال
معامل السهولة = ــــــــــــــ × 100%
النهاية العظمى للسؤال
مثال : إذا كان لدينا عدد 5 من المفحوصين ، وحصلوا على الدرجات التالية فى سؤال مقال : 30 ، 25 ، 20 ، 15 ، 10 فأوجد معدل السهولة للسؤال علماً بأن النهاية العظمى للسؤال 30.
(30 + 25 + 20 + 15 + 10)
ـــــــــــــــــ
5
معدل السهولة = ـــــــــــــــــــ × 100
30
= 67%
معامل السهولة المطلوب :
تتدرج معاملات السهولة بين (صفر – 100%) حيث يمثل معامل السهولة 100% على أنه السؤال الذى يجيب عليه جميع الطلاب، وكما سبق أن أوضحت أنه يجب أن يحذف هذا السؤال ؛ لعدم قدرته على التمييز بين الطلاب. وإن كان يرى البعض أن له فائدة سيكولوجية فى تشجيع الضعفاء ، إلا أن هذه الأسئلة يجب أن توجد فى نطاق ضيق.
أما السؤال الذى معامل سهولته صفر% ؛ فيجب أن يحذف لعدم قدرته على التمييز بين الطلاب كما يحذف ، لأثره السئ على نفسية الطلاب.
والسؤال الذى نطرحه فى هذه الحالة هو ما أفضل معامل للسهولة ؟ يمكننا أن نجيب على هذا السؤال بأن أفضل الأسئلة ، هو ما يقسم المفحوصين – إذا لم يكونوا جماعة ممتازة – إلى فئتين متساويتين تقريباً هما فئة الممتازين، وفئة الضعفاء.
ومعنى ذلك أن أفضل الأسئلة ، ما كان معامل سهولته 50%، وهذا يتفق وصفات المنحنى الطبيعى ، فإذا أخذنا المتوسط كنقطة أجمل (نقطة تصل) نجد أن فرقه 50% و50% من أصحاب السمة التى نقوم بدراستها.
ومن جهة أخرى لنفترض أننا أعطينا سؤالاً لـ (100 طالب) فأجاب عليه 99 طالباً وفشل فيه طالب واحد. هذا السؤال يسهل بالنسبة إلى 99% عن الطلاب وصعب على 1% فهم – وهذا السؤال يعلمنا بأن هناك 99 × 1 = 99 فرقاً بين المفحوصين ، أى أن السؤال قد أخبرنا أن الطالب الذى فشل فيه يختلف عن الـ 99 طالباً الذين نجحوا فيه والسؤال الذى فشل فيه خمسة طلاب يعلمنا بأن هناك 75 فرقاً بين هؤلاء الخمسة الفاشلين وبين الخمسة والسبعين طالباً الذين نجحوا منه.
وبنفس الطريقة يمكننا أن نتدرج حتى نصل إلى معامل سهولة مقداره 50% فإنه يعطينا أكبر عدد ممكن من التمييزات، كما هو موضح بالجدول التالى :
جدول (7): يبين عدد الفروق بين 100 طالب فى حالة نجاح بعضهم وفشل البعض الآخر فى الإجابة على سؤال واحد.
معامل السهولة |
معامل الصعوبة |
مجموع الفروق |
99% 95% 90% 80% 70% 60% 50% 40% 30% |
1% 5% 10% 20% 30% 40% 50% 60% 70% |
99 475 900 1600 2100 2400 2500 2400 2100 |
من الجدول السابق أن معامل السهولة الذى يعطى أكبر عدد من التمييزات بين المفحوصين هو معامل 50% ، وبذلك يعتبر أفضل معامل ولكن هل يمكن جعل جميع معاملات السهولة للأسئلة 50% ؟ أن هذه القضية تثير جدلاً بين المشتغلين بالقياس – البعض يرى أن تكون معاملات السهولة للأسئلة 50% وإذا وجد بنك الأسئلة (ملف يحتوى عدداً ضخماً من أسئلة المادة) فإن ذلك يساعد على اختيار الأسئلة التى معامل سهولتها 50% ، بينما يرى البعض الآخر بضرورة توسيع الحدود ، بحيث تتراوح معاملات السهولة بين 40% - 60% على أن يكون معدلها بالنسبة لهذا المدى 50% ، وهناك فريق ثالث يرى أن تكون الأسئلة متدرجة فى صعوبتها ؛ لتلائم مختلف مستويات الطلبة الأقوياء والضعفاء ، وعليه فإن معاملات سهولة الأسئلة يمكن أن تندرج من 10% - 90% على أن تكون مرتبة من السهل إلى الصعب، وأن يكون المعدل ككل 50% وبذلك نحقق الغرض نفسه.
معامل التمييز Discrimination Indey
إذا كان الغرض من الاختبار التحصيلى هو أن يفرق بين الطالب القادر والطالب الأقل قدرة فى مجال معين – فإن السؤال الوحيد هو ما يخدم هذا الفرض ومع ذلك فإن معامل السهولة ومعامل الصعوبة لا يعنى هذا المفروض، لأنهما لا يحددا نوع الطلبة الذين أجابوا على السؤال. هل هم طلبة ممتازون أم وسط أم ضعاف أم هم خليط من هذه الفئات.
فإذا كان معامل السهولة بالنسبة لسؤال معين 45% فإن هذا السؤال يبدو ممتازاً نظراً لقرب معامل سهولته من 50% ولكن قبل أن نحكم على السؤال جيداً نحاول التعرف على نوع الطلبة الذين أجابوا عليه فإذا كان 15% منهم ينتمون إلى فئة الممتازين ، 15% ينتمون إلى فئة المتوسطين ، 15% منهم ينتمون إلى فئة الضعاف – يكون من الواضح أن السؤال لم يقم بوظيفته وهو " التمييز " ولذلك تستخدم معامل آخر لتحقيق هذا الهدف وهو " معامل التمييز ".
معامل التمييز =
عدد الإجابات الصحيحة فى المجموعة العليا–عدد الإجابات الصحيحة فى المجموعة الدنيا
ـــــــــــــــــــــــــــــــــــــــــــــ
عدد الطلاب فى إحدى المجموعتين
= معامل السهولة فى المجموعة العليا – معامل السهولة فى المجموعة الدنيا
مثال :
إذا كان عدد المفحوصين فى كل مجموعة 25 طالباً وأجاب على السؤال الخامس 18 طالباً من المجموعة العليا ، 8 طلاب من المجموعة الدنيا إجابة صحيحة ، فكم يكون معامل التمييز ؟.
18 – 8
معامل التمييز = ــــــ × 100 = 40%
25
كيفية تحديد المجموعات :
لابد لنا لاستخراج معامل التمييز ، من قسمة أوراق المفحوصين إلى مجموعتين متطرفتين – ولتحقيق ذلك نرتب الأوراق حسب العلامات ترتيباً تنازلياً ثم نقسمها إلى مجمووعتين متساويتين هى مجموعة الأوراق ذات العلامات العليا ، ومجموعة الأوراق ذات العلامات الدنيا ، فإذا كان لدينا صف مؤلف من 40 طالباً فإنه ينقسم إلى مجموعتين عدد أفراد كل منهما 20 ، أما إذا كان عددهم فردياً كأن يكون 41 فإننا نستبعد الوسيط وهو الطالب 21 ولا ندخل ورقته فى تحليل الأسئلة ، أما إذا كان عدد المفحوصين كبيراً كأن يكون 100 طالب فقد نقرر أن نكتفى بوضع الأوراق من كل طرف من طرفى التوزيع.
وقد يتساءل البعض لماذا لم تدخل جميع الأوراق فى التحليل ؟ لقد وجد الباحثون إننا سوف نحصل على نفس النتائج إذا أخذنا نسبة معينة من كل طرف.
ولقد وجد كيلى Kelley أنه إذا كانت المجموعتان مؤلفتين من أعلى 50% وأدنى 50% من الأوراق فإن تأثير الأوراق التى هى حول الوسيط على معامل التمييز ضعيف. وأنه إذا أخذنا أعلى 40% وأدنى 40% فإننا نحصل على معاملات أفضل وهكذا حتى نصل إلى نسبة 27% وهى أفضل النسب ؛ إذ أنها تغطى أعلى معاملات تمييز. ولكن دراسات متأخرة أثبتت أن ذلك ليس صحيحاً ، وأن أى نسبة سواء أكانت 10% أو 20% أو غيرها ذات تأثير ضئيل على الثبات وأنها تعطى نتائج متقاربة.
أما السبب فى أن بعضهم لا يزال يقترح استعمال هذه النسبة (27%) ، فهو وجود بعض الجداول المبنية على هذه النسبة والتى تمكننا من الحصول على معامل التمييز دون عناء.
وبناءً على ما سبق نقترح أن يأخذ المعلم أى نسبة شريطة أن يكون عدد الطلاب كافياً أو معقولاً. فإذا كان الصف مؤلفاً من 30-40 طالباً يستحسن إدخالهم جميعهم فى التحليل. أما إذا كان الامتحان لعدد من الشعب يبلغ طلابها 100 طالب فإننا ندخل فى التحليل ما بين 40-60% وكلما زاد عدد المفحوصين كلما خفضنا النسبة.
معامل التمييز المرغوب :
إن أول شرط لقبول معامل التمييز هو أن يكون موجباً ؛ لأنه لو كان سالباً فإن معامل سهولة السؤال بالنسبة للمجموعة الدنيا أكبر من معامل سهولة السؤال بالنسبة للمجموعة العليا وهذا خلاف المعقول ولا يحدث إلا فى ظروف خاصة ، ومعنى ذلك أن هذا السؤال لا يقيس ما تقيسه الأسئلة الأخرى.
هذا كما أن معامل التمييز يتراوح بين (+1 ، -1) ولتوضيح ذلك نفرض أن لدينا 100 طالب أجاب على سؤال معين 50 منهم ، فمن المحتمل أن يكون هؤلاء من أفراد المجموعة العليا ، إذ أن من يجيب على الأسئلة عادة " أقوى " الطلبة وعليه يكون معامل السهولة = 50%، أما معامل التمييز :
50 – 0
معامل التمييز = ــــــ = 1
50
والآن لنفترض أن السؤال كان يدور حول نقطة خاطئة أو أن المعلم أخطأ فى شرحها. أن الذى يجيب على هذه النقطة كما وردت هم الأغلب من الطلبة الضعفاء – أما الممتازون سيختارون جواباً آخر ، نتيجة لتعمقهم ومطالعتهم الخارجية.
0 – 50
وبذلك يصبح معامل التمييز = ـــــ = -1
5
وإذا افترضنا أن عدد من أجاب عليه من المجموعتين كان متفائلاً فإن:
25 - 25
معامل التمييز = ـــــــ = صفر
50
ومعامل التمييز فى الحالة الأخيرة يعنى أن السؤال لا يميز بين الأقوياء والضعفاء ، وعلى ذلك فإن هذا السؤال ليس له قيمة.
وبذلك يصح الشرط الثانى لمعامل التمييز ألا يساوى صفراً.
أما الشرط الثالث بمعامل التمييز هو أن يعطى أكبر عدد من التمييزات وهذا يحدث عندما يقترب معامل التمييز من الواحد الصحيح. هذا من الناحية النظرية أما من الناحية العملية فالأمر مختلف تماماً ، إذ من الصعب الحصول على معاملات تمييز كهذه – وعادة ما يقبل المشتغلون بالقياس معامل التمييز إذا بلغ 40% أو 50%.
وفيما يلى قواعد افترضها ديدرتش Diederich لاتخاذها مستوى نقبل بموجبه معامل التمييز ، وهذه القواعد هى :
أولاً : إذا كانت المجموعة مقسمة إلى مجموعتين كل منهما تؤلف 59% من مجموع الأوراق ، وإذا كان معامل سهولة السؤال تتراوح بين 0.25 – 0.75 فإن معامل التمييز الجيد الذى يمكن قبوله يساوى ثلاثة أمثال النسبة المئوية للفرق بين عدد الإجابات الصحيحة للمجموعتين مقسوماً على عدد طلاب الصف شريطة ألا تقل هذه النسبة عن 10%.
ثانياً : إذا تألفت كل مجموعة من 50% من الأوراق وكان معامل السهولة السؤال يقل عن 20% أو يزيد عن 80% فإن الفرق بين المنجموعتين منسوباً إلى عدد الصف يجب أن لا يقل عن 5%.
هذا ويجب أن توضح أن معامل التمييز المستخرج بهذه الطريقة يساوى تقريباً معامل الارتباط الثنائى.
وبشكل عام بإمكان المعلم أن يستخرج الفرق بين المجموعتين وبنسبة إلى عدد طلاب الصف حسب الشروط السابقة فإذا ساوى أو زيد عن نسب 5%، 10 ، يمكنه أن يعتبر معامل التمييز معاملاً جيداً.
معامل التمييز السالب والمنخفض :
عندما يجعل المعلم فى أى اختبار تحصيلى على أسئلة ذات تمييز ضعيف أو سالب يجب أن نتصرف حيالها على النحو التالى :
1- انظر فى السؤال فإذا كان به خطأ فنى عليك إصلاحه وإذا تعذر ذلك فاحذف السؤال.
2- إذا لم يكن بالسؤال خطأ فنى يجب أن ترى ماذا يقيس – هل يقيس شيئاً آخر يختلف عما تقيسه معظم الأسئلة فإذا كان الحال كذلك عليك أن تجد محكاً آخر أكثر صلاحية لتقارنه به – وإذا تعذر ذلك وكان السؤال يقيس هدفاً تربوياً فعليك أن تبقيه.
3- الأسئلة الصعبة جداً أو السهلة جداً تكون عادة ذات معامل تمييز منخفض وأسئلة لهذه يجب أن تحذف إلا إذا كانت تمثل جزءاً من المادة لا يمكن تغطيته بغيرها أو إذا كانت ستستعملها كمنشط لدافعية الطلاب الضعفاء أو التحدى للأقوياء.
فاعلية المشتتات :
المشتتات : هى الإجابات الخاطئة من أسئلة الاختيار من متعدد، وتستعمل لتثبيت الطلبة على الإجابة الصحيحة.
ويجب على مصمم الاختبار من هذا النوع أن يتأكد أن كل مشتت يقوم بوظيفته ، وهناك شرطان للتحقق من ذلك هما :
أولاً : يجب أن يكون المشتت جذاباً ومغرياً للطلبة بحيث يختاره بعضهم.
ثانياً : يجب أن يكون عدد الذين جذبهم فى المجموعتين الدنيا أكبر منه فى المجموعة العليا ، فمن المعلوم أن الطالب الذى لا يميز الصواب من الخطأ ، ولا يعرف الحقيقة هو الأغلب الطالب الضعيف لا الممتاز.
جدول (8): يبين توزيع إجابات المفحوصين على سؤال ذى خمسة اختيارات
|
أ |
ب* |
ج |
د |
هـ |
حذف |
المجموعة العليا 18 |
1 |
10 |
3 |
0 |
4 |
0 |
المجموعة الدنيا 18 |
0 |
4 |
6 |
1 |
7 |
0 |
مجموع 36 |
1 |
14 |
9 |
1 |
11 |
0 |
إن عدد المفحوصين 36 طالباً وقد قسموا إلى مجموعتين: عليا ودنيا ، عدد أفراد كل منها 18 طالباً والجواب الصحيح لهذا السؤال هو ب ، وتم وضع نجمة بجابن الحرف "ب" لتدل عليه.
إذا تأملنا إجابات الطلاب نجد أن الجواب الصحيح قد جذب 14 طالباً منهم 10 من المجموعة العليا، 4 من المجموعة الدنيا بمعامل تمييز قدره 33% وهو معامل تمييز فوق 25% فهو معامل تمييز مقبول أما بالنسبة للمشتتات فإن "ج ، هـ" جيدين لأنهما جذب (9 ، 11) طالباً على التوالي .
وكان عدد من جذبه كل منهما فى المجموعة الدنيا أكثر مما جذبه من المجموعة العليا. أما بالنسبة للمشتتات (أ ، د) فهما ضعيفان للغاية ولكن المشتت (د) أفضل من (أ) لأن ما جذبه فى المجموعة الدنيا أكبر مما جذبه فى المجموعة العليا (الاتجاه الصحيح) فيجب أن نسحبهما أو نحذف (أ) على أن نضع محله مشتت آخر ، كما يجب أن نعيد صياغة المحوه (د) لزيادة جاذبيته.