« Home « Kết quả tìm kiếm

PHÁT HIỆN MÔN HỌC QUAN TRỌNG ẢNH HƯỞNG ĐẾN KẾT QUẢ HỌC TẬP SINH VIÊN NGÀNH CÔNG NGHỆ THÔNG TIN


Tóm tắt Xem thử

- PHÁT HIỆN MÔN HỌC QUAN TRỌNG ẢNH HƯỞNG ĐẾN KẾT QUẢ HỌC TẬP SINH VIÊN NGÀNH CÔNG NGHỆ THÔNG TIN.
- Trong bài này, chúng tôi giới thiệu tiếp cận khai mỏ dữ liệu để phát hiện môn học quan trọng ảnh hưởng đến kết quả học tập của sinh viên ngành công nghệ thông tin (CNTT).
- Chúng tôi tiến hành sưu tập dữ liệu học tập của sinh viên tốt nghiệp ngành CNTT tại Trường Đại học Cần Thơ, sau đó thực hiện bước tiền xử lý dữ liệu, đưa dữ liệu về cấu trúc bảng.
- Chúng tôi đề xuất sử dụng giải thuật rừng ngẫu nhiên học từ dữ liệu để rút trích các môn học quan trọng trong chương trình đào tạo ngành CNTT.
- Kết quả thu được sau khi rút trích có thể cung cấp thông tin hữu ích cho các nhà quản lý giáo dục trong việc tổ chức giảng dạy để nâng cao hiệu quả đào tạo..
- Nguyên nhân chủ yếu do chất lượng đầu ra của sinh viên ngành CNTT vẫn còn thấp.
- Để nâng cao được chất lượng của sinh viên nhằm đáp ứng được nhu cầu thực tiễn, cần phải có sự phối hợp nhịp nhàng giữa.
- nhà tuyển dụng, cơ sở đào tạo mà ở đó vai trò của nhà quản lý giáo dục, đội ngũ giảng viên, giáo viên cố vấn học tập và sinh viên.
- Làm sao giáo viên cố vấn học tập tư vấn để sinh viên biết được kiến thức nào là quan trọng ảnh hưởng đến kết quả khi ra trường.
- Nhờ đó sinh viên chú tâm hơn ở các môn học quan trọng nhằm cải thiện được chất lượng học tập.
- Đồng thời, nhà quản lý cũng có cơ hội bố trí, sắp xếp chương trình, đội ngũ giảng viên phù hợp với các môn học thuộc phần kiến thức quan trọng..
- Chúng tôi đề xuất tiếp cận phát hiện môn học quan trọng ảnh hưởng đến kết quả học tập của sinh.
- viên CNTT tại Trường Đại học Cần Thơ (ĐHCT), dựa trên công nghệ khám phá tri thức và khai mỏ dữ liệu (Fayyad et al., 1996).
- Qua đó, nhà quản lý có chiến lược quản lý phù hợp nhằm cải tiến chất lượng giảng dạy cho nhóm môn học quan trọng, giáo viên cố vấn tư vấn cho sinh viên tập trung cải thiện chất lượng học tập.
- Nâng cao hiệu quả đầu ra của sinh viên CNTT.
- Các bước thực hiện nghiên cứu của chúng tôi bao gồm sưu tập dữ liệu học tập của sinh viên tốt nghiệp ngành CNTT, sau đó thực hiện bước tiền xử lý dữ liệu, đưa dữ liệu về cấu trúc bảng mà từ đó giải thuật rừng ngẫu nhiên (Breiman, 2001) được huấn luyện để rút trích các môn học quan trọng trong chương trình đào tạo..
- Kết quả thu được sau khi rút trích bao gồm các môn học như xác suất thống kê, toán rời rạc, cấu trúc dữ liệu, có thể cung cấp thông tin hữu ích cho các nhà quản lý giáo dục, giảng viên, sinh viên trong việc tổ chức giảng dạy để nâng cao hiệu quả đào tạo..
- Phần 3 trình bày giải thuật học rừng ngẫu nhiên và các rút trích đặc trưng.
- Phần 4 trình bày các kết quả thực nghiệm tiếp theo sau đó là kết luận và hướng phát triển..
- Nghiên cứu ứng dụng khai mỏ dữ liệu vào quản lý giáo dục đào tạo được xem rất cần thiết cho các nhà quản lý giáo dục, giúp công tác quản lý và hoạch định chiến lược giáo dục ngày càng hiệu quả.
- Nghiên cứu của (Lê, 2002) đề xuất sử dụng khai phá luật kết hợp (Agrawal et al., 1993) và logic mờ (Zadeh, 1965) trên kết quả thi tốt nghiệp THPT và THCS cho mục tiêu đánh giá hiệu quả đào tạo và cung cấp các thông tin cần thiết cho quá trình nâng cao chất lượng học sinh.
- Luận văn thạc sĩ của (Phan, 2009) đã nghiên cứu phương pháp khai mỏ tìm luật kết hợp trên dữ liệu giáo dục.
- Ứng dụng thực nghiệm trên dữ liệu kết quả học tập của sinh viên trường Đại học Tôn Đức Thắng, nhằm hỗ trợ đánh giá và dự đoán kết quả học tập của sinh viên, qua đó nâng cao chất lượng đào tạo..
- Tác giả áp dụng thuật toán khai phá luật kết hợp mờ vào việc dự đoán kết quả tốt nghiệp phổ thông trung học dựa trên học lực và hạnh kiểm của học sinh..
- Tác giả tìm hiểu sự ảnh hưởng của vùng miền, của hoàn cảnh gia đình, dân tộc, đạo đức… đến kết quả học tập của học sinh, phân loại kết quả học tập để đánh giá một cách nhanh chóng nhận thức của người học.
- Nghiên cứu của (Nguyễn et al., 2007) đề xuất sử dụng giải thuật máy học cây quyết định (Breiman et al., 1984), (Quinlan, 1993) và mạng Bayes (Pearl, 1985) trong dự đoán kết quả học tập của sinh viên đại học và sau đại học của Trường ĐHCT.
- Một nghiên cứu khác của (Nguyễn et al., 2011) đề xuất sử dụng kỹ thuật phân rã ma trận để dự đoán kết quả học tập của sinh viên..
- Pal, 2013) đề xuất sử dụng giải thuật máy học cây quyết định (Breiman et al., 1984), (Quinlan, 1993) và Bagging (Breiman, 1996) để dự đoán kết quả học tập của sinh viên Đại học Purvanchal, Ấn Độ..
- Nghiên cứu của (Bukralia et al., 2012) đã đề xuất sử dụng các kỹ thuật máy học như mạng nơ- ron, hồi quy logistic (Hastie et al., 2001), cây quyết định (Breiman et al., 1984), (Quinlan, 1993), máy học véc-tơ hỗ trợ SVM (Vapnik, 1995) để dự đoán kết quả học tập của sinh viên theo hệ đào tạo từ xa của Đại học Midwest, Hoa Kỳ..
- Có thể thấy được rằng, các nghiên cứu trên đây đều tập trung vào dự đoán kết quả học tập, dự đoán điểm môn học.
- Nghiên cứu của chúng tôi đề xuất không đi theo hướng dự đoán chính xác kết quả học tập.
- Chúng tôi quan tâm đến phát hiện môn học quan trọng ảnh hưởng đến kết quả học tập của sinh viên ngành CNTT dựa trên giải thuật học rừng ngẫu nhiên..
- Giải thuật rừng ngẫu nhiên tạo ra một tập hợp các cây quyết định.
- 3.1 Giải thuật xây dựng rừng ngẫu nhiên Giải thuật máy học rừng ngẫu nhiên (Hình 1) có thể được trình bày ngắn gọn như sau:.
- Từ tập dữ liệu học LS có m phần tử và n biến (thuộc tính), xây dựng T cây quyết định một cách độc lập nhau.
- Hình 1: Giải thuật rừng ngẫu nhiên 3.2 Rút trích đặc trưng.
- Rút trích đặc trưng quan trọng được thực hiện trong khi huấn luyện mô hình của rừng ngẫu nhiên..
- trong rừng ngẫu nhiên.
- Thuộc tính quan trọng được hiểu là thuộc tính làm ảnh hưởng rất nhiều đến kết quả phân lớp của rừng ngẫu nhiên.
- Việc thực hiện các tính toán để xác định thuộc tính quan trọng trong rừng ngẫu nhiên như sau.
- Từ ý tưởng này, chúng ta thực hiện rút trích môn học quan trọng ảnh hưởng đến kết quả học tập của sinh viên ngành CNTT.
- Chúng ta có thể xem sinh viên như là 1 dòng (mẫu tin, phần tử của dữ liệu), các môn học của sinh viên xem như thuộc tính (cột, trường) và kết quả xếp loại học tập khi ra trường có thể xem là lớp (nhãn).
- Như vậy, dữ liệu học tập của sinh viên chính là bảng dữ liệu.
- Chúng tôi sử dụng rừng ngẫu nhiên học để phân loại sinh viên.
- Trong quá trình xây dựng mô hình học, rừng ngẫu nhiên thực hiện rút trích các môn học (thuộc tính) quan trọng như vừa được mô tả.
- Có thể diễn giải rằng những môn học quan trọng được rút trích từ mô hình học rừng ngẫu nhiên là những môn học làm ảnh hưởng rất lớn đến kết quả phân loại học tập của sinh viên..
- 4 KẾT QUẢ THỰC NGHIỆM.
- Trong phần thực nghiệm, chúng tôi tiến hành thu thập dữ liệu kết quả học tập của sinh viên tại phòng đào tạo, Trường ĐHCT.
- Dữ liệu thu thập bao gồm kết quả học tập của sinh viên ngành CNTT thuộc các khóa từ 20 đến 29 (tuyển sinh từ năm 1994 đến 2003).
- Các khóa từ 30 trở về sau được điều chỉnh bởi quy chế đào tạo tín chỉ sử dụng phương pháp đánh giá kết quả học tập theo thang điểm chữ.
- nên dữ liệu không đồng nhất, do số lượng dữ liệu thu thập đã đủ lớn để nghiên cứu nên chúng tôi không thu thập dữ liệu các khóa này.
- Dữ liệu thu thập được có dạng cấu trúc bảng, được tổ chức theo từng học kỳ năm học..
- Mỗi học kỳ năm học có các tập tin dữ liệu như:.
- diem (lưu điểm sinh viên), dtotng (lưu sinh viên tốt nghiệp), ctdt (lưu chương trình đào tạo)…và các tập tin dữ liệu khác tại học kỳ đó.
- Mỗi tập tin diem chứa các thông tin: mã số sinh viên, mã số môn học (tùy chọn và bắt buộc), điểm thi của các môn học,… mà sinh viên tham gia học vào từng học kỳ.
- Hình 2: Cấu trúc tập tin điểm Tập tin dtotng chứa thông tin kết quả xếp loại.
- tốt nghiệp của sinh viên bao gồm: mã số sinh viên,.
- (lưu tên môn học) để diễn giải tên môn học từ mã.
- số môn học (Hình 4).
- Hình 4: Cấu trúc tập tin môn học.
- Bên cạnh đó, chúng tôi cũng tìm hiểu phương pháp tính điểm học tập của sinh viên để xếp loại tốt nghiệp.
- Với X i là điểm môn học thứ i.
- a i là số tín chỉ của môn học thứ i.
- n là số môn học sinh viên tích lũy..
- 4.1 Tiền xử lý dữ liệu.
- Bước tiếp theo là tiền xử lý dữ liệu: dữ liệu thu thập được sẽ được tổng hợp và chuyển về một bảng dữ liệu duy nhất, mỗi cột (trường - field) của bảng biểu diễn tên của mỗi môn học, mỗi dòng (record) mô tả kết quả học tập toàn khóa học của mỗi sinh viên.
- Hình 5: Dữ liệu tổng hợp.
- Bước 1: lọc lấy dữ liệu điểm của sinh viên ngành CNTT, xóa bỏ các sinh viên ngành khác;.
- xóa bỏ các dữ liệu không hợp lệ.
- các thuộc tính không quan trọng và chuyển dữ liệu từ các tập tin điểm và tập tin tốt nghiệp về một bảng duy nhất (như bảng ở Hình 5).
- Bước 2: Dựa trên bảng dữ liệu vừa xây dựng ở bước 1, chúng tôi tiếp tục biểu diễn dữ liệu trong bảng sao cho các cột mô tả các môn học, các dòng mô tả điểm các môn học mà mỗi sinh viên có.
- Vì có một số môn học sinh viên không tham gia học (có thể các khóa có các môn học khác nhau) hoặc được miễn, trường hợp này điểm của các môn này có giá trị là NULL và chúng tôi xử lý các giá trị NULL thành giá trị ‘NA’.
- Sau quá trình tiền xử lý dữ liệu, chúng tôi thu được bảng dữ liệu có 317 dòng và 249 trường (mỗi trường tương ứng với một môn học, giá trị của mỗi trường là điểm của môn học đó) và trường cuối cùng là điểm trung bình tốt nghiệp (như Hình 6)..
- Hình 6: Kết quả học tập thu được sau bước tiền xử lý.
- Tiếp theo chúng tôi bỏ cột chứa các môn học mang tính chất điều kiện trong chương trình đào tạo như: giáo dục thể chất, giáo dục quốc phòng..
- Các môn học này sinh viên chỉ cần học đạt (hoàn thành), bởi vì kết quả của các môn học này không được sử dụng để đánh giá phân loại kết quả học tập.
- Sau khi thực hiện tiền xử lý dữ liệu, chúng tôi được tập tin dữ liệu có cấu trúc bảng, sử dụng để phân tích kết quả học tập của sinh viên..
- 4.2 Xây dựng mô hình rừng ngẫu nhiên và rút trích môn học quan trọng.
- Sau đó sắp xếp thứ tự quan trọng các môn học giảm dần..
- Kết quả rút trích lấy 10 môn học có tính quan trọng nhất (ảnh hưởng đến kết quả đầu ra của sinh viên CNTT), được trình bày trong Hình 7..
- Hình 7: Top 10 môn học quan trọng Trong top 10 môn học quan trọng nhất được rút.
- trích từ mô hình học rừng ngẫu nhiên, chúng ta có thể thấy rằng các môn học phân bổ vào 3 nhóm như sau..
- Nhóm các môn học đại cương: xác suất thống kê, toán rời rạc, vật lý lượng tử;.
- Nhóm môn học cơ sở ngành: Tin học lý thuyết, Cơ sở dữ liệu, Ngôn ngữ lập trình, Cấu trúc dữ liệu, Lập trình hướng đối tượng;.
- Nhóm môn học chuyên ngành: luận văn tốt nghiệp, chương trình dịch..
- Theo như kết quả trình bày thì đây là những môn học đáng quan tâm nhiều nhất, vì kiến thức các môn học này ảnh hưởng đến chất lượng đào tạo của sinh viên ngành CNTT..
- Để kiểm chứng kết quả rút trích đặc trưng (môn học) quan trọng, chúng tôi đánh giá lại hiệu quả của phân lớp dữ liệu, lần lượt trên tập dữ liệu với tập đầy đủ 249 đặc trưng (môn học) và tập dữ liệu chỉ với top 10 đặc trưng (môn học) quan trọng vừa rút trích.
- Kết quả ước tính tỉ lệ lỗi trên tập dữ liệu với đầy đủ 249 đặc trưng là 21,14%, trong khi tỉ lệ lỗi trên tập dữ liệu với top 10 đặc trưng chỉ là 20,82%.
- Điều này cho thấy rằng ta chỉ cần xác định được 10 môn học quan trọng này là có thể phân loại được kết quả học tập của sinh viên..
- Tóm lại, với kết quả trên, nghiên cứu đã phát hiện ra những môn học quan trọng ảnh hưởng đến kết quả xếp loại tốt nghiệp của sinh viên ngành CNTT.
- Hay nói cách khác, sinh viên học tốt các môn học này thì kết quả xếp tốt nghiệp sẽ tốt..
- Những môn học này có thể sử dụng để phân loại kết quả học tập của sinh viên tốt nghiệp..
- 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Chúng tôi vừa trình bày một tiếp cận khai mỏ dữ liệu để phát hiện môn học quan trọng ảnh hưởng đến kết quả học tập của sinh viên ngành CNTT tại Trường ĐHCT.
- Các bước thực hiện bao gồm sưu tập dữ liệu học tập của sinh viên tốt nghiệp ngành CNTT, sau đó thực hiện bước tiền xử lý dữ liệu để có thể huấn luyện mô hình rừng ngẫu nhiên cho phép rút trích các môn học quan trọng..
- Kết quả thu được sau khi rút trích các môn học quan trọng, có thể cung cấp thông tin hữu ích cho các nhà quản lý giáo dục, giảng viên, sinh viên trong việc tổ chức giảng dạy để nâng cao hiệu quả đào tạo..
- Nguyễn Quốc Thông.: Phát triển một số ứng dụng khai thác dữ liệu vào giáo dục đào tạo..
- Nguyễn Thái Nghe.: Một phân tích giữa các kỹ thuật trong dự đoán kết quả học tập.
- Phan Đình Thế Huân.: Nghiên cứu và ứng dụng phương pháp khai mỏ luật kết hợp trên dữ liệu giáo dục.
- Nguyễn Thị Vân Hảo.: Xây dựng hệ thống dự đoán kết quả tốt nghiệp phổ thông trung học.
- Nguyễn Đăng Nhượng: Khai phá dữ liệu về kết quả học tập của học sinh trường Cao đẳng nghề Văn Lang Hà Nội