Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập

Dự đoán kết quả học tập của sinh viên một các chính xác nhằm phát hiện sớm các sinh viên yếu kém để giúp họ lập kế hoạch học tập phù hợp là một nhu cầu cần thiết ở các trường đại học, đặc biệt là trong công tác tư vấn, cố vấn học tập. Trong bài viết này, chúng tôi sẽ giới thiệu một số nghiên cứu liên quan đến vấn đề hỗ trợ sinh viên lập kế hoạch học tập thông qua việc sử dụng các phương pháp dự đoán trong khai phá dữ liệu. Trong đó, nhóm nghiên cứu thứ nhất liên quan đến việc sử dụng các giải thuật không cá nhân hóa như mạng Bayes và Cây quyết định. Nhóm nghiên cứu thứ hai liên quan đến việc sử dụng giải thuật cá nhân hóa – lấy ý tưởng từ các kỹ thuật trong hệ thống gợi ý - như kỹ thuật phân rã ma trận thiên vị (Biased Matrix Factorization) nhằm dự đoán kết quả học tập cho từng cá nhân sinh viên, từ đó hỗ trợ lựa chọn môn học phù hợp với năng lực của từng cá nhân. Kết quả từ các nghiên cứu này đã cho thấy sử dụng phương pháp máy học trong dự đoán kết quả học tập của sinh viên là khả thi và có thể ứng dụng trong thực tế tại các trường đại học.

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 1

Trang 1

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 2

Trang 2

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 3

Trang 3

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 4

Trang 4

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 5

Trang 5

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 6

Trang 6

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 7

Trang 7

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 8

Trang 8

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 9

Trang 9

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 18 trang Trúc Khang 09/01/2024 6160
Bạn đang xem 10 trang mẫu của tài liệu "Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập

Ng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh viên lập kế hoạch học tập
Ứng dụng các kỹ thuật trong khai phá dữ liệu hỗ trợ sinh 
viên lập kế hoạch học tập 
Nguyễn Thái Nghe 
Khoa Công nghệ thông tin và Truyền thông 
Trường Đại học Cần Thơ 
ntnghe@cit.ctu.edu.vn 
Tóm tắt 
Dự đoán kết quả học tập của sinh viên một các chính xác nhằm phát hiện sớm các sinh 
viên yếu kém để giúp họ lập kế hoạch học tập phù hợp là một nhu cầu cần thiết ở các 
trường đại học, đặc biệt là trong công tác tư vấn, cố vấn học tập. Trong bài viết này, 
chúng tôi sẽ giới thiệu một số nghiên cứu liên quan đến vấn đề hỗ trợ sinh viên lập kế 
hoạch học tập thông qua việc sử dụng các phương pháp dự đoán trong khai phá dữ liệu. 
Trong đó, nhóm nghiên cứu thứ nhất liên quan đến việc sử dụng các giải thuật không cá 
nhân hóa như mạng Bayes và Cây quyết định. Nhóm nghiên cứu thứ hai liên quan đến 
việc sử dụng giải thuật cá nhân hóa – lấy ý tưởng từ các kỹ thuật trong hệ thống gợi ý - 
như kỹ thuật phân rã ma trận thiên vị (Biased Matrix Factorization) nhằm dự đoán kết 
quả học tập cho từng cá nhân sinh viên, từ đó hỗ trợ lựa chọn môn học phù hợp với năng 
lực của từng cá nhân. Kết quả từ các nghiên cứu này đã cho thấy sử dụng phương pháp 
máy học trong dự đoán kết quả học tập của sinh viên là khả thi và có thể ứng dụng trong 
thực tế tại các trường đại học. 
Từ khóa: Dự đoán kết quả học tập, lựa chọn môn học, lập kế hoạch học tập, cây quyết 
định, kỹ thuật phân rã ma trận 
1. Giới thiệu 
Dự đoán kết quả học tập của sinh viên một các chính xác là rất hữu ích trong nhiều ngữ 
cảnh khác nhau ở các trường đào tạo đại học và sau đại học. Chẳng hạn, xác định các ứng 
viên xuất sắc để tham gia các đội tuyển tin học, hoặc cấp học bổng nhằm khuyến khích 
họ nỗ lực hơn nữa trong học tập, hay việc xác định các sinh viên có năng lực yếu kém để 
có những biện pháp thích hợp nhằm hỗ trợ họ học tập tốt hơn. 
Thời gian gần đây, số lượng sinh viên bị buộc thôi học có chiều hướng tăng ở nhiều 
trường đại học (chẳng hạn như tại Đại học Cần Thơ, hàng năm có trên dưới 150 sinh viên 
thuộc diện buộc thôi học do kết quả học tập yếu kém [13]) và thường tập trung vào những 
sinh viên học năm thứ ba và năm thứ tư. Một phần nguyên nhân là do sinh viên không có 
kế hoạch học tập phù hợp. Hiện tượng này đã gây tổn thất lớn cho bản thân sinh viên, gia 
đình và toàn xã hội. Chính vì thế việc phát hiện sớm các học viên yếu kém để giúp họ lập 
kế hoạch học tập sao cho phù hợp là một nhu cầu rất cần thiết. 
Bên cạnh đó, phần lớn các trường đại học đã triển khai theo học chế tín chỉ nên các sinh 
viên thường bị lúng túng khi lựa chọn môn học do có nhiều môn được giảng dạy trong 
một học kỳ. Khi đó, bên cạnh khả năng tự tìm hiểu thì sinh viên sẽ cần đến sự trợ giúp 
của giáo viên cố vấn. Tuy vậy, bên cạnh kinh nghiệm của mình thì giáo viên cố vấn sẽ 
phải tra cứu kết quả học tập của từng sinh viên để trợ giúp tuỳ theo năng lực của mỗi em, 
do đó khá tốn thời gian và công sức. Vấn đề đặt ra là làm sao để sử dụng nguồn dữ liệu 
điểm sinh viên để khai thác, phân tích và đưa ra đánh giá/dự đoán để có thể gợi ý cho 
sinh viên chọn môn học một cách hiệu quả và tự động thông qua hệ thống. 
Bài viết này sẽ tóm lược lại một số nghiên cứu liên quan đến vấn đề hỗ trợ sinh viên lập 
kế hoạch học tập bằng cách sử dụng các phương pháp trong khai phá dữ liệu mà tác giả 
và các cộng sự đã thực hiện. Trong đó, nhóm nghiên cứu thứ nhất liên quan đến việc sử 
dụng các giải thuật không cá nhân hóa như mạng Bayes và Cây quyết định; nhóm nghiên 
cứu thứ hai liên quan đến sử dụng kỹ thuật cá nhân hóa như phân rã ma trận thiên vị 
(Biased Matrix Factorization) để dự đoán kết quả học tập cho từng sinh viên, từ đó hỗ trợ 
(gợi ý) lựa chọn môn học phù hợp với năng lực của từng sinh viên. Thực nghiệm từ các 
nghiên cứu này đã cho thấy cách tiếp cận máy học trong dự đoán kết quả học tập của sinh 
viên là rất khả thi. 
2. Tiếp cận không cá nhân hoá trong dự đoán kết quả học tập (Non-personalized 
approach) 
Nhóm nghiên cứu của (Nguyễn Thái Nghe và các cộng sự, 2007, 2009, 2010) đã đề xuất 
sử dụng thông tin nhân khẩu học thu thập từ hồ sơ đầu vào của sinh viên như độ tuổi, giới 
tính, ngành học, trình độ ngoại ngữ,và điểm trung bình tích lũy (GPA) của học kỳ 
trước để dự đoán kết quả cho học kỳ sau. Việc dự đoán trước kết quả này góp phần hỗ trợ 
các sinh viên trong diện cảnh báo học vụ (do trong quy chế ở các trường, nếu một sinh 
viên trong hai học kỳ liên tiếp đạt kết quả yếu sẽ bị buộc thôi học). Để thực hiện việc dự 
đoán, nhóm tác giả đã sử dụng hai giải thuật là Cây quyết định và mạng Bayes, từ đó so 
sánh độ chính xác của hai kỹ thuật này. 
Nghiên cứu trên đã đưa ra một số đóng góp quan trọng. Thứ nhất, kết quả mà đề tài thực 
hiện đã cung cấp một cái nhìn sâu hơn trong toàn bộ quy trình ứng dụng khai phá dữ liệu 
vào thực tế, bao gồm cả những phương pháp trong việc điều chỉnh tập dữ liệu đầu vào 
(như rời rạc hoá, chuẩn hoá,..) và cải thiện độ chính xác của các giải thuật trong dự đoán. 
Thứ hai, các kết ... đó dòng là danh sách sinh viên và cột là danh sách môn học, mỗi ô trong ma 
trận là điểm của sinh viên học môn học tương ứng. Nếu sinh viên đã học thì điểm số sẽ 
được điền vào ô trong ma trận. Nếu sinh viên chưa học, ô trong ma trận được biểu diễn 
bằng dấu chấm hỏi “?”. 
Hình 8: Ví dụ minh họa BMF 
Mục đích của BMF là phân rã X thành 2 ma trận nhỏ hơn là W và H sao cho ta có thể xây 
dựng lại X từ 2 ma trận này. 
TWHX ≈ 
Với K là số nhân tố tìm ẩn (K<<|S|, K << |I|). 
Quá trình phân rã được thực hiện bằng phương pháp tối ưu hóa hàm mục tiêu bằng kỹ 
thuật stochastic gradient descent. Hàm mục tiêu của BMF được biểu diễn như sau (bạn 
đọc có quan tâm xin xem chi tiết trong nghiên cứu của (Nguyễn Thái Nghe, 2013b [14]): 
Trong đó, µ là giá trị trung bình toàn cục, là năng lực trung bình của tất cả các sinh viên 
(s) trên tất cả các môn học (i) trong tập dữ liệu huấn luyện (p là kết quả học tập của s trên 
môn học i) 
Giá trị bs là độ lệch của sinh viên (là giá trị lệch trung bình của năng lực một sinh viên so 
với giá trị trung bình toàn cục) 
Giá trị bi là độ lệch của môn học (là giá trị lệch trung bình của yêu cầu môn học so với 
giá trị trung bình toàn cục) 
Giả sử sau quá trình tối ưu, ta có được W và H, khi đó kết quả của sinh viên s cho môn 
học i được dự đoán qua công thức 
Thông qua công thức trên, ta tiến hành dự đoán tất cả điểm số của tất cả sinh viên cho 
những môn học là môn tự chọn mà sinh viên chưa có điểm môn học đó, lưu lại vào cơ sở 
dữ liệu cho việc gợi ý. Với mỗi sinh viên, hệ thống sẽ kiểm tra các ràng buộc trong môn 
học tự chọn và kế hoạch học tập, sau đó tiến hành gợi ý những môn có số điểm số dự 
đoán cao nhất (hình bàn tay) trong nhóm tự chọn như minh họa trong Hình 9. 
3.3. Đánh giá kết quả 
3.3.1. Độ đo dùng để đánh giá 
Có nhiều phương pháp có thể dùng để đánh giá hiệu quả của giải thuật gợi ý tùy vào từng 
dạng bài toán. Do đó, khi thực hiện đánh giải thuật chúng ta cần chọn phương pháp phù 
hợp. 
Bài toán dự đoán kết quả học tập của sinh viên thuộc dạng dự đoán xếp hạng từ đánh giá 
tường minh (rating prediction), nên có hai độ đo thường được sử dụng nhất là: Root 
Mean Squared Error (RMSE) và Mean Absolute Error (MAE) được biểu diễn như dưới 
đây 
( )∑
∈
−=
testDpi,s,
2
sisitest pˆp|D|
1RMSE
( )∑
∈
−=
testDpi,s,
sisitest pˆp|D|
1MAE
Phương pháp RMSE sẽ thích hợp với sai số nhỏ và MAE sẽ thích hợp với sai số lớn hơn. 
Hơn nữa, các giải thưởng lớn trong lĩnh vực hệ thống gợi ý đều dùng RMSE để đánh giá, 
như Netflix Prize, KDD Cup 2010,.. Từ những nhận xét trên, nhóm tác giả đã chọn 
phương pháp RMSE cho đánh giá hiệu quả của giải thuật BMF trong bài toán dự đoán 
kết quả học tập của sinh viên. 
Hình 9. Giao diện hỗ trợ lập kế hoạch học tập có gợi ý môn học 
3.3.2. Dữ liệu 
Tập dữ liệu dùng cho đánh giá hệ thống được thu thập trong giai đoạn 10 năm từ năm 
1994 đến năm 2004 của sinh viên ngành Tin học thuộc khoa CNTT&TT trường Đại học 
Cần Thơ. Tập dữ liệu bao gồm 4017 sinh viên (4017 user) và 353 môn học (353 item) 
của 3 ngành học và gồm 279536 điểm chi tiết (279536 ratings). Nghi thức kiểm tra hold-
out lấy ngẫu nhiên 2/3 tập dữ liệu để học và 1/3 còn lại để kiểm tra. 
3.3.3. Kết quả dự đoán 
Sau khi huấn luyện tập dữ liệu điểm sinh viên như trình bày trên, kết quả độ lỗi RMSE 
thu được như trong Hình 10. Ở đó Global Average, Student Average, và Item Average là 
ba phương pháp nền (baseline) [14], còn Matrix Factorization là giải thuật chuẩn không 
có các thành phần bias. 
Từ biểu đồ so sánh cho thấy áp dụng giải thuật BMF vào bài toán dự đoán kết quả học 
tập của sinh viên đạt độ lỗi RMSE thấp hơn so với các giải thuật khác. 
Hình 10. Biểu đồ so sánh độ lỗi RMSE giữa các giải thuật 
4. Các nghiên cứu liên quan 
Khai phá dữ liệu đã được ứng dụng cho nhiều mục đích khác nhau trong giáo dục đào tạo 
và hiện đang được các nhà nghiên cứu quan tâm. Hàng năm, hội thảo chuyên về khai phá 
dữ liệu giáo dục (www.educationaldatamining.org) được tổ chức cũng như tạp chí 
chuyên về khai phá dữ liệu giáo dục (www.educationaldatamining.org/JEDM/), mà ở đó 
ta có thể tìm thấy rất nhiều bài viết chuyên sâu. 
Romero et. al. cũng đã tóm tắt các công trình nghiên cứu liên quan trong lĩnh vực này 
trong [28]. Delavari [3] đã trình bày một mô hình trong đó có nhiều câu hỏi nghiên cứu ở 
các lĩnh vực khác nhau và các kỹ thuật khai phá dữ liệu tương ứng với từng loại câu hỏi 
khi áp dụng trong giáo dục đào tạo. Chẳng hạn, [9] đã trình bày các vấn đề như dự đoán 
năng lực của sinh viên, phân cụm những sinh viên có đặc điểm giống nhau, mối quan hệ 
giữa từng loại sinh viên với các môn học, Luan [7] cũng đã trình bày một nghiên cứu 
trong việc phân cụm các sinh viên có các đặc điểm giống nhau (“self starters” và “high 
interaction”). 
Bên cạnh đó, việc phân tích bằng nhiều kỹ thuật khai phá dữ liệu để dự đoán kết quả học 
tập của sinh viên cũng được nghiên cứu và thực hiện [25]. Tuy nhiên những hướng tiếp 
cận này thường áp dụng cho việc đánh giá năng lực học tập cho học sinh, sinh viên. Sau 
khi đánh giá thì những dự đoán này mang tính chất là quy luật chung nhất, chúng không 
dự đoán cho từng sinh viên cụ thể. 
Một số tiếp cận trong hệ thống gợi ý đã được đề xuất để giải quyết vấn đề dự đoán năng 
lực cho từng sinh viên cụ thể đã được đưa ra: Lọc cộng tác, KNN, Matrix Factorization, 
để dự đoán năng lực học tập của sinh viên (Toscher and Jahrer, 2010; Koren et al., 2009; 
1.240	
  
1.197	
  
1.032	
  
1.013	
  
0.913	
  
0.90	
  
0.95	
  
1.00	
  
1.05	
  
1.10	
  
1.15	
  
1.20	
  
1.25	
  
1.30	
   Global	
  Average	
  
Student	
  Average	
  
Item	
  Average	
  
Matrix	
  FactorizaBon	
  
Bias	
  Matrix	
  FactorizaBon	
  
Nguyen Thai-Nghe et al., 2011). Tuy vậy, những nghiên cứu này đa phần mới chỉ dừng 
lại ở mức kiểm tra độ chính xác của giải thuật và chưa được ứng dụng để giải quyết vấn 
đề thực tế. 
5. Kết luận 
Dự đoán kết quả học tập của sinh viên một các chính xác là rất hữu ích trong nhiều ngữ 
cảnh khác nhau ở các trường đào tạo đại học và sau đại học. Chẳng hạn, xác định các ứng 
viên xuất sắc để tham gia các đội tuyển tin học, cấp học bổng nhằm khuyến khích họ nỗ 
lực hơn nữa trong học tập, hoặc việc xác định các sinh viên có năng lực yếu kém để có 
những biện pháp thích hợp nhằm hỗ trợ họ học tập tốt hơn. 
Bài viết này đã giới thiệu một số nghiên cứu liên quan đến vấn đề hỗ trợ sinh viên lập kế 
hoạch học tập sử dụng các phương pháp trong khai phá dữ liệu. Trong đó, nhóm nghiên 
cứu thứ nhất liên quan đến việc sử dụng các giải thuật không cá nhân hóa như mạng 
Bayes và cây quyết định. Nhóm nghiên cứu thứ hai liên quan đến việc sử dụng giải thuật 
cá nhân hóa như Biased Matrix Factorization trong dự đoán kết quả học tập cho từng cá 
nhân sinh viên, từ đó hỗ trợ lựa chọn môn học phù hợp với năng lực của họ. Thực nghiệm 
từ các nghiên cứu này đã cho thấy sử dụng phương pháp máy học trong dự đoán kết quả 
học tập của sinh viên là khả thi và hoàn toàn có thể triển khai trong thực tế. 
Kết hợp cả thông tin nhân khẩu học (demographic information) và thông tin tương tác 
(collaborative information) giữa sinh viên và môn học hay việc thu thập thêm những 
thông tin khác (như số giờ lướt web/mạng xã hội hàng ngày, tình trạng kinh tế gia đình,..) 
có thể sẽ làm tăng thêm độ chính xác của mô hình dự đoán. Những công việc này sẽ được 
thực hiện trong tương lai. 
Tài liệu tham khảo 
[1] Bekele, R. and Menzel, W. 2005. A Bayesian approach to predict performance of a student 
(BAPPS): A case with Ethiopian students. Proceedings of the International Conference on 
Artificial Intelligence and Applications (AIA-2005), Vienna, Austria. 
[2] Bobadilla J., Ortega F., Hernando A., Gutiérrez H. 2013. Recommender systems survey. 
Knowledge-Based Systems. 46 (2013) 109–132. Elsevier. 
[3] Delavari N. & Beikzadeh M. R & Shirazi M. R. A. 2004. A New Model for Using Data 
Mining in Higher Educational System. Proceedings of 5th International Conference on 
Information Technology Based Higher Education and Training (ITHET), Istanbul, Turkey 
[4] Huỳnh Lý Thanh Nhàn, Nguyễn Thái Nghe. 2013a. Hệ thống dự đoán kết quả học tập và gợi 
ý lựa chọn môn học. Kỷ yếu hội thảo quốc gia lần thứ XVI: Một số vấn đề chọc lọc của 
CNTT&TT (@2013), trang 110-118. Nhà xuất bản Khoa học kỹ thuật. ISBN: 987-604-67-
0251-1 
[5] Huỳnh Lý Thanh Nhàn và Nguyễn Thái Nghe. 2013b. Hệ thống dự đoán kết quả học tập của 
sinh viên sử dụng thư viện hệ thống gợi ý mã nguồn mở MYMEDIALITE. Kỷ yếu Hội thảo 
toàn quốc về CNTT năm 2013. Trang 192-201. NXB Đại học Cần Thơ. ISBN: 978-604-919-
012-4. 
[6] Koren, Y., Bell, R., & Volinsky, C. 2009. Matrix factorization techniques for recommender 
systems. IEEE Computer Society Press, 42(8), 30-37. 
[7] Luan, J., Zhao, C.-M., and Hayek, J. 2004. Exploring a new frontier in higher education 
research: A case study analysis of using data mining techniques to create NSSE institutional 
typology. The California Association for Institutional Research, Anaheim, California. 
[8] Manouselis, N., Drachsler, H., Vuorikari, R., Hummel, H., & Koper, R. 2010. Recommender 
systems in technology enhanced learning. In P. B. Kantor, F. Ricci, L. Rokach, & B. Shapira 
(Eds.), 1st Recommender Systems Handbook, (pp. 1-29). Berlin, Germany. Springer. 
[9] Minaei-Bidgoli, B., Kashy, D. A., Kortemeyer, G., and Punch, W. F. 2003. Predicting 
student performance: an application of data mining methods with an educational web-based 
system. Proceedings of 33rd Annual Conference on Frontiers in Education (FIE 2003). 
[10] Nguyễn Chí Ngôn và Nguyễn Thái Nghe. 2010. Hệ chuyên gia hổ trợ sinh viên lập kế 
hoạch học tập (dựa trên phương pháp khai phá dữ liệu - data mining). Đề tài NCKH cấp 
trường. Đại học Cần Thơ. 
[11] Nguyen Thai-Nghe, Lars Schmidt-Thieme. 2015a. Factorization Forecasting Approach 
for User Modeling. Journal of Computer Science and Cybernetics. 133-148. Vol 31, No 2. 
ISSN: 1813-9663. DOI: 10.15625/1813-9663/31/2/5860 
[12] Nguyen Thai-Nghe and Lars Schmidt-Thieme. 2015b. Multi-Relational Factorization 
Models for Student Modeling in Intelligent Tutoring Systems. In proceedings of the 2015 
Seventh International Conference on Knowledge and Systems Engineering (KSE 2015). 
IEEE Xplore. (to appear) 
[13] Nguyễn Thái Nghe. 2013a. Hệ thống dự báo năng lực học tập và hỗ trợ sinh viên lựa 
chọn môn học. Đề tài NCKH cấp trường. Đại học Cần Thơ. 
[14] Nguyen Thai-Nghe. 2013b. An introduction to factorization technique for building 
recommendation systems. Vol. 6/2013, pp. 44-53, Journal of Science - University of Da Lat, 
ISSN 0866-787X. 
[15] Nguyen Thai-Nghe, Zeno Gantner, Lars Schmidt-Thieme. 2013. An Evaluation Measure 
for Learning from Imbalanced Data Based on Asymmetric Beta Distribution. Book Chapter 
in Classification and Data Mining: Studies in Classification, Data Analysis, and Knowledge 
Organization, pp. 121-129. Print ISBN: 978-3-642-28893-7. Series ISSN: 1431-
8814. Springer. 
[16] Nguyễn Thái Nghe, Huỳnh Xuân Hiệp. 2012. Ứng dụng kỹ thuật phân rã ma trận đa 
quan hệ trong xây dựng hệ trợ giảng thông minh, Kỷ yếu Hội thảo quốc gia lần thứ XV: Một 
số vấn đề chọn lọc của CNTT&TT (@2012), trang 470-477. Nhà xuất bản Khoa học và Kỹ 
thuật. ISBN: 893-5048-931578 
[17] Nguyen Thai-Nghe, Lucas Drumond, Tomáš Horváth, Lars Schmidt-Thieme. 2012a. 
Using Factorization Machines for Student Modeling, in proceedings of FactMod 2012 WS at 
the 20th Conference on User Modeling, Adaptation, and Personalization (UMAP 2012). Vol. 
872, CEUR-WS, ISSN: 1613-0073. 
[18] Nguyen Thai-Nghe, Lucas Drumond, Tomáš Horváth, Artus Krohn-
Grimberghe, Alexandros Nanopoulos, Lars Schmidt-Thieme. 2012b. Factorization 
Techniques for Predicting Student Performance. Book chapter in Educational Recommender 
Systems and Technologies: Practices and Challenges (ERSAT 2012). Santos, O. C. and 
Boticario, J. G. (Eds.). pp. 129-153. ISBN13: 9781613504895, ISBN10: 1613504896, IGI 
Global Publisher. 
[19] Nguyen Thai-Nghe, Tomáš Horváth, Lars Schmidt-Thieme. 2011. Factorization Models 
for Forecasting Student Performance, in Pechenizkiy, M., Calders, T., Conati, C., Ventura, 
S., Romero, C., and Stamper, J. (Eds.) Proceedings of the 4th International Conference on 
Educational Data Mining (EDM 2011). ISBN 978-90-386-2537-9 
[20] Nguyen Thai-Nghe, Lucas Drumond, Artus Krohn-Grimberghe, Lars Schmidt-Thieme 
(2010): Recommender System for Predicting Student Performance. Volume 1, Issue 2, 2010, 
Pages 2811-2819, Elsevier Computer Science Procedia. ISSN: 1877-0509 
[21] Nguyen Thai-Nghe, Andre Busche, and Lars Schmidt-Thieme. 2009. Improving 
Academic Performance Prediction by Dealing with Class Imbalance, in Proceedings of the 
9th IEEE International Conference on Intelligent Systems Design and Applications (ISDA 
2009), pp. 878-883. ISBN: 978-0-7695-3872-3. IEEE Computer Society. 
[22] Nguyen Thai-Nghe, Paul Janecek, and Peter Haddawy. 2007. A comparative analysis of 
techniques for predicting academic performance, in Proceedings of the 37th ASEE/IEEE 
Frontiers in Education (FIE 2007), pp. T2G-7-T2G-12. Print ISBN: 978-1-4244-1083-5. 
IEEE publisher 
[23] Nguyen Thai-Nghe, Tomáš Horváth, and Lars Schmidt-Thieme. 2011. Personalized 
Forecasting Student Performance, in Proceedings of the 11th IEEE International Conference 
on Advanced Learning Technologies (ICALT 2011). pp. 412 - 414. ISSN: 2161-3761. E-
ISBN: 978-0-7695-4346-8. Print ISBN: 978-1-61284-209-7. IEEE Xplore. 
[24] Nguyen Thai-Nghe, Zeno Gantner, and Lars Schmidt-Thieme. 2010. Cost-Sensitive 
Learning Methods for Imbalanced Data, in proceedings of IEEE International Joint 
Conference on Neural Networks (IJCNN 2010), ISSN: 1098-7576. Print ISBN: 978-1-4244-
6916-1. IEEE publisher, Student Travel Grant Award 
[25] Nguyễn Thị Thanh Thủy, Nguyễn Trần Quốc Vinh,. Ứng dụng khai phá dữ liệu xây dựng 
công cụ dự đoán kết quả học tập của sinh viên. Hội nghị sinh viên nghiên cứu khoa học lần 
thứ 8, Đại học Đà Nẵng, 2012. 
[26] Ricci, F., Rokach, L., Shapira, B. & Kantor, P.B., eds. 2011. Recommender Systems 
Handbook. Springer. 
[27] Romero, C., Ventura, S., Espejo, P.G., Hervas, C. 2008. Data Mining Algorithms to 
Classify Students. Proceedings of the First International Conference on Educational Data 
Mining, 8-17. 
[28] Romero, Cristobal, and Sebastian Ventura. 2013. Data mining in education. Wiley 
Interdisciplinary Reviews: Data Mining and Knowledge Discovery 3.1 (2013): 12-27. 
[29] Su, X. & Khoshgoftaar, T.M. 2009. A survey of collaborative filtering techniques. 
Advances in Artificial Intelligence, 2009, 4:1-4:19. 
[30] Toscher A. and Jahrer M. 2010. Collaborative filtering applied to educational data 
mining. Proceedings of the KDD Cup 2010 Workshop on Improving Cognitive Models with 
Educational Data Mining, Washington, DC, USA, 2010. 
View publication stats

File đính kèm:

  • pdfng_dung_cac_ky_thuat_trong_khai_pha_du_lieu_ho_tro_sinh_vien.pdf