« Home « Kết quả tìm kiếm

Đánh giá độ tin cậy của ngân hàng đề thi căn cứ trên kết quả thi kết thúc học phần của sinh viên chuyên ngành Giáo dục thể chất Trường Đại học sư phạm – Đại học Thái Nguyên


Tóm tắt Xem thử

- ĐÁNH GIÁ ĐỘ TIN CẬY CỦA NGÂN HÀNG ĐỀ THI CHO SINH VIÊN CHUYÊN NGÀNH GIÁO DỤC THỂ CHẤT TRƯỜNG ĐẠI HỌC SƯ PHẠM - ĐẠI HỌC THÁI NGUYÊN.
- Độ tin cậy là một tiêu chí quan trọng trong đánh giá một bài thi.
- Định kì đánh giá độ tin cậy của các phương pháp kiểm tra đánh giá là yêu cầu của kiểm định chương trình đào tạo.
- Việc đánh giá độ tin cậy của cả bộ ngân hàng đề thi, câu hỏi thi bao gồm nhiều hình thức thi như thi trắc nghiệm, thi tự luận, thi vấn đáp, thi thực hành là một bài tốn khĩ.
- Bài viết đề xuất đánh giá độ tin cậy của bộ ngân hàng câu hỏi thi dành cho sinh viên chuyên ngành Giáo dục thể chất Trường Đại học Sư phạm - Đại học Thái Nguyên theo phương pháp thống kê dựa trên kết quả thi kết thúc học phần..
- Từ khĩa: Độ tin cậy, ngân hàng câu hỏi thi, ngân hàng đề thi, chuyên ngành Giáo dục thể chất..
- Phân tích và đánh giá các câu hỏi thi - kiểm tra là một việc rất cần thiết nhưng cịn ít được quan tâm.
- Hậu quả là các kì thi sau vẫn thường lặp lại những sai lầm của các kì thi trước.
- Việc phân tích, đánh giá các câu hỏi sẽ giúp chúng ta hiểu rõ hơn chất lượng của đề thi và chất lượng của sinh viên (SV).
- Tuy nhiên, mức độ phức tạp của việc phân tích, đánh giá các câu hỏi phụ thuộc nhiều vào dạng thức câu hỏi được sử dụng trong kỳ thi..
- Thực tế cho thấy rất khĩ phân tích và đánh giá các câu hỏi tự luận.
- Rất khĩ đánh giá độ khĩ của các câu hỏi này, khĩ xác định những câu tự luận mơ hồ để loại bỏ hoặc sửa chữa chúng..
- Trong khi đĩ, với các câu hỏi trắc nghiệm đã cĩ khá nhiều phần mềm để phân tích đánh giá, nhờ đĩ, các câu hỏi trắc nghiệm thường xuyên được nâng cao chất lượng, loại bỏ hoặc sửa chữa được những câu thiếu rõ ràng, nâng cao được độ tin cậy và tính giá trị của các đề thi – kiểm tra..
- Do khơng chú ý đến việc phân tích đề thi, khơng cĩ thử nghiệm trước khi thi nên một số đề thi - kiểm tra quá dễ hoặc quá khĩ so với năng lực của SV.
- Đề thi dễ quá dẫn đến kết quả làm bài của sinh viên quá tốt nên bị xã hội phê phán là chạy theo thành tích, khơng phản ánh đúng thực lực của người học.
- Đề khĩ quá dẫn đến kết quả làm bài của SV kém nên bị xã hội phê phán là chất lượng giáo dục thấp.
- đánh giá chất lượng giáo dục mà chỉ nhìn vào điểm số là cách đánh giá rất thiếu chính xác vì điểm số phụ thuộc rất nhiều vào độ khĩ của đề thi và tính chủ quan của người chấm.
- Khơng thể so sánh kết quả hai kỳ thi khác nhau khi các đề thi cĩ độ khĩ khác nhau, thậm chí, cùng một đề thi nhưng do những người chấm khác nhau cũng dẫn đến khác nhau..
- Cho đến hiện tại, cĩ nhiều cơng trình nghiên cứu về độ tin cậy của các bài thi trắc nghiệm, tuy vậy, chưa cĩ nghiên cứu nào đề cập đến độ tin cậy của các bài thi tự luận, bài thi vấn đáp, bài thi thực hành.
- Bằng thống kê chúng tơi nhận thấy, sau 5 lần tổ chức thi đối với các học phần của sinh viên Khoa TDTT thì cĩ khoảng trên 70% số câu hỏi cĩ trong ngân hàng đề thi đã được sử dụng..
- PHƯƠNG PHÁP NGHIÊN CỨU.
- Trong quá trình nghiên cứu, bài viết đã sử dụng các phương pháp: Phương pháp đọc, phân tích và tổng hợp tài liệu, phương pháp tốn học thống kê..
- KẾT QUẢ NGHIÊN CỨU VÀ BÀN LUẬN.
- Một số phương pháp kiểm tra đánh giá độ tin cậy của ngân hàng câu hỏi thi.
- Phương pháp kiểm tra – kiểm tra lại (Test-Retest Method).
- Phương pháp này do Henning (1987) và Shohamy (1985) đề xuất.
- Theo phương pháp này một bài kiểm tra được kiểm tra hai lần cho cùng một đối tượng sinh viên trong thời gian khơng quá hai tuần với điều kiện người học khơng được ơn tập lại.
- Độ tin cậy của bài kiểm tra trong trường hợp này được tính đơn giản như sau: R tt =R 1,2.
- Trong đĩ: R tt : Độ tin cậy của bài thi..
- r 1,2 : Sự tương quan giữa kết quả hai lần kiểm tra trên cùng một đối tượng..
- Tuy nhiên phương pháp này chưa đủ khách quan vì khơng đảm bảo chắc chắn là người học khơng ơn lại giữa hai lần kiểm tra..
- Phương pháp chia đơi bài kiểm tra (Split Half).
- Theo phương pháp này bài kiểm tra được chia thành hai phần bằng nhau, ví dụ một phần tồn câu chẵn, một phần tồn câu lẻ và tiến hành kiểm tra trên cùng một đối tượng.
- riêng biệt từng phần, người ta so sánh tương quan của kết quả.
- Điểm số của hai phần càng giống nhau nghĩa là bài thi càng cĩ giá trị.
- Cơng thức Spearman Brown Prophecy được sử dụng để tính hệ số tương quan:.
- Trong đĩ: Rtt: Là hệ số tin cậy theo phương pháp Split Half..
- r AB : Là hệ số tương quan giữa hai điểm số của hai phần của bài kiểm tra.
- Để tính hệ số tương quan giữa hai phần của bài kiểm tra (R AB ) cĩ thể dùng cơng thức:.
- r AB : Là hệ số tương quan Spearman.
- D: Sự chênh lệch điểm của hai phần bài kiểm tra n: Số lượng bài kiểm tra.
- Nếu r AB sự tương quan tốt (độ tin cậy cao.
- 0.6 - 0.8 sự tương quan trung bình (độ tin cậy trung bình).
- 0.4 - 0.6 sự tương quan kém (độ tin cậy thấp).
- 0.2 - 0.4 sự tương quan rất kém (độ tin cậy rất thấp)..
- Tuy nhiên, cả Bachman (1990) và Henning (1987) đều cho rằng độ tin cậy tính theo phương pháp chia đơi cĩ thể khơng mang lại kết quả chính xác vì độ tin cậy cĩ thể thay đổi tùy theo bố cục của bài kiểm tra..
- Để khắc phục nhược điểm trên, Henning (1987) đã đưa ra một số cơng thức tính độ tin cậy:.
- R tt : Độ tin cậy.
- n: Số câu hỏi trong bài kiểm tra.
- Bình phương của độ lệch chuẩn (SD.
- Tổng số sự chênh lệch điểm của tất cả các câu hỏi..
- x : Điểm trung bình chung (Mean).
- (SD) 2 : Bình phương của độ lệch chuẩn (SD) K: Số câu hỏi trong bài kiểm tra.
- Bachman (1990) cho rằng về mặt cơ bản, mặc dù hai cơng thức trên được tính khác nhau nhưng chúng đều cho những kết quả như nhau vì sự chênh lệch điểm số bằng với độ lệch chuẩn.
- Henning (1987) cho rằng độ tin cậy của bài thi nằm trong khoảng từ 0 đến 1 với giá trị càng cao thì bài thi càng cĩ độ tin cậy cao..
- Đánh giá độ tin cậy của ngân hàng đề thi Để đánh giá được phần nào độ tin cậy của các đề thi kết thúc học phần cho sinh viên chuyên ngành GDTC Trường Đại học Sư phạm - Đại học Thái Nguyên trong những năm học gần đây, chúng tơi tiến hành phân tích, đánh giá kết quả thi kết thúc học phần của 2 năm học gần nhất (năm học 2016-2017.
- 2017-2018) bằng phương pháp thống kê tồn bộ điểm thi kết thúc học phần của tất cả các học phần trong 2 năm học đĩ và so sánh điểm của các học phần tại các thời điểm khác nhau..
- Phương pháp phân tích.
- Chúng tơi sử dụng phương pháp thống kê, phân tích kết quả thi để đánh giá độ tin cậy của ngân hàng câu hỏi thi, ngân hàng đề thi của các học phần đang được giảng dạy cho sinh viên chuyên ngành GDTC Trường Đại học Sư phạm - Đại học Thái Nguyên.
- Dữ liệu được chọn là tồn bộ kết quả thi kết thúc học phần của 2 năm học.
- 2016-2017 và 2017-2018 trên cơ sở các phiếu điểm lưu trữ tại khoa bao gồm 31 lượt học phần với 528 lượt SV dự thi.
- Các học phần cĩ tên giống nhau được giảng ở 2 khĩa khác nhau làm cơ sở so sánh.
- Các chỉ tiêu thống kê mơ tả được tính tốn bao gồm: Số lượng bài thi, điểm trung bình, độ lệch chuẩn, số điểm thi ở 2 cận biên của miền điểm là từ 0-1 và 9-10.
- Các mức đánh giá theo hệ thống tín chỉ tương đương bao gồm F (<4).
- B (7.0-8.4) và A (điểm từ 8.5 trở lên) được tính tỉ lệ phần trăm làm cơ sở để đánh giá mức độ tập trung của miền kết quả của từng học phần..
- Nhĩm tác giả đã phân tích kết quả thi của các học phần và xem xét đến việc cĩ đảm bảo khoảng phân bố của kết quả điểm tương đối cân đối giữa các mức đánh giá hay khơng với đề xuất mức điểm trung bình nên ở khoảng 5.5 với độ lệch chuẩn khoảng từ 1.5 đến 1.8.
- Miền kết quả này tương đương với khoảng trên 60% bài thi cĩ điểm tương đương từ tích D đến tích B, đảm bảo phân loại được SV..
- Trong đĩ học phần cĩ số bài thi cao nhất là học phần GDTC cĩ 1.857 bài thi..
- Phân tích mức điểm trung bình cao nhất và thấp nhất trong 2 năm học 2016-2017.
- kết quả được trình bày ở bảng 1 và bảng 2..
- Phân tích theo từng học kỳ, phân điểm trung bình thành 3 khoảng, số liệu cụ thể được trình bày ở bảng 3:.
- Bảng tổng hợp số liệu chung của 2 năm học TT Năm học Học kỳ Lượt mơn Lượt TS dự thi.
- Bảng tổng hợp học phần cĩ điểm trung bình cao và thấp nhất.
- TT Năm học Học kì Điểm trung bình (điểm số).
- Kết quả phân tích điểm trung bình theo từng khoảng cụ thể.
- TT Năm học Học kì Điểm TB.
- từ 0-4.99 Điểm TB.
- từ 5.0-5.59 Điểm từ.
- Qua bảng 3 cho thấy số học phần cĩ mức điểm trung bình từ 5,60 đến 9,0 luơn chiếm tỉ lệ cao so với mức trung bình từ 5.0 đến 5.59.
- Mức điểm trung bình này cũng cho thấy hiện tại số học phần cĩ điểm trung bình quá thấp hoặc quá cao luơn chiếm tỷ lệ lớn, tạo ra sự mất cân bằng giữa các mức điểm trong nhiều học phần..
- Phân tích theo số bài thi đạt điểm quá thấp hoặc quá cao.
- Báo cáo tổng hợp số liệu của các học phần cĩ số bài thi đạt điểm quá thấp (0-1) điểm và quá cao (9-10) điểm..
- Bảng tổng hợp học phần cĩ điểm thấp nhất (0-1) và cao nhất (9-10).
- ĐVT: Số bài thi.
- TT Năm học Học kỳ Số bài thi điểm 0-1 và điểm 9-10 Thấp nhất 0 - 1 Cao nhất 9 - 10.
- 2 HK II.
- 4 HK II .
- Đo lường TDTT và Giáo dục học cĩ số bài thi đạt điểm 0-1 cao và cĩ tính lặp lại ở các năm.
- Phân tích từ độ lệch chuẩn điểm các học phần:.
- Từ điểm thống kê được, nhĩm tác giả tiến hành phân tích độ lệch chuẩn của điểm thi các học phần, cụ thể như sau:.
- Bảng phân tích độ lệch chuẩn TT Năm học Học kỳ ĐLC từ 0-1.49 Tỉ lệ % ĐLC từ.
- 2 HK II .
- Nhìn từ bảng phân tích trên cho thấy, trong cả hai năm học, số học phần cĩ độ lệch chuẩn từ 1.5 - 1.8 luơn chiếm tỉ lệ nhỏ hơn nhiều so với 02 nhĩm mức độ cịn lại.
- Độ lệch chuẩn từ 1.81 trở lên luơn nhiều gấp 2 lần nhĩm học phần cĩ độ lệch chuẩn từ 1.5-1.8.
- Kết quả phân tích cho thấy cĩ sự chênh lệch lớn về giá trị của từng thời điểm đánh giá so với giá trị trung bình..
- Độ tin cậy là điều kiện cần của các đề thi để đánh giá chính xác kết quả học tập của người học.
- Độ tin cậy cĩ thể tăng lên nhờ bổ sung những câu hỏi đồng nhất hay tăng độ phân biệt của các câu hỏi.
- Kết quả phân tích các mức điểm đặc biệt, mức điểm trung bình và độ lệch chuẩn so với điểm trung bình các học phần trong 2 năm học cho thấy cĩ nhiều học phần cĩ tỷ lệ điểm thi quá thấp hoặc quá cao, độ lệch chuẩn so với điểm trung bình cịn cĩ khoảng cách lớn..
- Nguyễn Cơng Khanh (2004), Đánh giá và đo lường trong KHXH, Nxb chính trị QG, HN..
- Thorndike&Haghen, Đo lường và đánh giá trong tâm lý và giáo dục, bản dịch của ĐHQGHN

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt